V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
letv
V2EX  ›  程序员

AI 好像也没那么智能吧?做个程序题改了好几版都拿不到目标输出

  •  1
     
  •   letv · 2025 年 7 月 16 日 · 3463 次点击
    这是一个创建于 179 天前的主题,其中的信息可能已经有所发展或是发生改变。

    也就是 leetcode medium 的级别而已。 还得自己去 debug 看问题出在哪里。

    第 1 条附言  ·  2025 年 7 月 16 日
    我感觉是 leetcode medium 难度,是一道笔试题,对面公司说可以用 AI 做。
    调整了好几版都没法通过用例,感觉还不如自己想。
    第 2 条附言  ·  2025 年 7 月 16 日
    deepseek, qianwen ,grok3, claude4 都用了,反正就是不对。
    第 3 条附言  ·  2025 年 7 月 17 日
    Problem Description
    我们正在寻找一个按 segments(区间) 管理“强度”的程序。

    Segments(区间) 是从负无穷到正无穷的间隔,我们希望你实现一些函数,这些函数能针对给定范围将强度更新一个整数值。

    所有的 intensity(强度) 都从 0 开始。 请 implement(实现) 这三个函数:

    /** *
    * NOTE: Feel free to add any extra member variables/functions you like.
    */
    export class IntensitySegments {
    /**
    *
    */
    add(from, to, amount) {
    // TODO: implement this
    }
    /**
    *
    */
    set(from, to, amount) {
    // TODO: implement this
    }
    /**
    *
    */
    toString() {
    // TODO: implement this
    }
    }


    // Here is an example sequence:
    // (data stored as an array of start point and value for each segment.)

    const segments = new IntensitySegments();
    segments.toString(); // Should be "[]"
    segments.add(10, 30, 1);
    segments.toString(); // Should be: "[[10,1],[30,0]]"
    segments.add(20, 40, 1);
    segments.toString(); // Should be: "[[10,1],[20,2],[30,1],[40,0]]"
    segments.add(10, 40, -2);
    segments.toString(); // Should be: "[[10,-1],[20,0],[30,-1],[40,0]]"

    // Another example sequence:
    const segments = new IntensitySegments();
    segments.toString(); // Should be "[]"
    segments.add(10, 30, 1);
    segments.toString(); // Should be "[[10,1],[30,0]]"
    segments.add(20, 40, 1);
    segments.toString(); // Should be "[[10,1],[20,2],[30,1],[40,0]]"
    segments.add(10, 40, -1);
    segments.toString(); // Should be "[[20,1],[30,0]]"
    segments.add(10, 40, -1);
    segments.toString(); // Should be "[[10,-1],[20,0],[30,-1],[40,0]]"
    29 条回复    2025-07-18 11:22:11 +08:00
    zxkxhnqwe123
        1
    zxkxhnqwe123  
       2025 年 7 月 16 日
    有没有可能是你提示词的问题
    picone
        2
    picone  
       2025 年 7 月 16 日
    @zxkxhnqwe123 既然是 leetcode 的题目那整条题粘贴进去应该很清晰吧。 同样的信息上下文为什么人能做 AI 不能做。那说明 AI 还不够好
    xuelang
        3
    xuelang  
       2025 年 7 月 16 日
    哪个题目呀,分享下看看哈哈
    sillydaddy
        4
    sillydaddy  
       2025 年 7 月 16 日
    Talk Is Cheap, Show Me Your Code !
    xuanbg
        5
    xuanbg  
       2025 年 7 月 16 日
    这……你要是和 AI 说:“给我写一个和微软最新版 Office 365 相同功能的系统”。你觉得 AI 应该能做到是吧?这句话没毛病啊,是个人都能理解你要的是什么,而且绝对不会有一点点的偏差。
    neteroster
        6
    neteroster  
       2025 年 7 月 16 日
    题目是啥,什么模型什么渠道调用的
    yplam
        7
    yplam  
       2025 年 7 月 16 日 via Android   ❤️ 4
    Talk Is Cheap, Show Me Your Prompt !

    现今说 AI 写代码不行的基本上是提示词不会写。
    CJ2r4u3EH4lrM7aR
        8
    CJ2r4u3EH4lrM7aR  
       2025 年 7 月 16 日 via Android
    那说明你用的 ai 能找到的程序库中没有这个算法,试再多也没有用,你只能换个 ai 。
    dupenn
        9
    dupenn  
       2025 年 7 月 16 日
    现阶段的 AI 已经很棒了,但是还没有那么棒,如果你提供 AI 的问题表述不能让 AI 正确理解问题,那基本上 AI 也不能给你想要的答案。
    kokerkov
        10
    kokerkov  
       2025 年 7 月 16 日
    "AI 公司宣称大模型能提高程序员的生产力和编程效率,但一项随机对照研究发现,AI 降低了开源开发者的编程速度。研究人员招募了 16 名有多年参与开源代码库的资深程序员,跟踪了他们维护代码库时完成 246 项任务的表现,一半任务程序员被要求使用 AI 工具如 Cursor Pro 或 Anthropic Claude ,另一半任务被要求不要使用 AI 工具。在执行任务前,程序员们预测 AI 工具将帮助他们减少 24% 的工作时间,在完成任务后程序员们仍然认为 AI 工具帮助将工作速度提高了 20%。但实际上使用 AI 工具完成任务比不使用 AI 工具完成任务慢了 19%。研究人员发现,AI 工具减少了程序员们自己写代码、测试/调试,阅读/搜索信息的时间,但增加了评估 AI 输出、提示 AI 系统和等待 AI 生成,以及空闲/额外的时间。大部分程序员表示他们需要修改 AI 生成的代码。研究人员认为,现有的 AI 工具不适合高质量标准的环境,它在编程环境中仍然有很大的局限性。 "
    dupenn
        11
    dupenn  
       2025 年 7 月 16 日
    @kokerkov #10 他这个样本数据太少了,只有 16 个人,不足以说明问题,而且至少应该采样不同水平层次的数据来分析
    huanxianghao
        12
    huanxianghao  
       2025 年 7 月 16 日
    AI 有时候会降智是真的
    bestie
        13
    bestie  
       2025 年 7 月 16 日
    楼上都没认真审题么,OP 说的是让 AI 做 leetcode ,这还有啥提示词不提示词的,整道题就是提示词啊
    SoulFlame
        14
    SoulFlame  
       2025 年 7 月 16 日
    我问的一个简单地铁优惠问题,也来回拉扯几次才正确:
    https://i.stardots.io/brad/1752046717688.jpg
    jqknono
        15
    jqknono  
       2025 年 7 月 16 日
    把提示词写出来大家才好评价
    gzeng17291
        16
    gzeng17291  
       2025 年 7 月 16 日
    leetcode 题目,提示语的是不是还要把 leetcode 的提示,和做题用的方法也发了才行?
    irrigate2554
        17
    irrigate2554  
       2025 年 7 月 16 日
    题目和聊天记录都贴出来大家才好讨论
    simpleman
        18
    simpleman  
       2025 年 7 月 16 日
    啥公司能让用 AI 做题?
    liCharlie
        19
    liCharlie  
       2025 年 7 月 16 日
    @kokerkov 等待 AI 生成不就是摸鱼事件嘛?虽然没有减少工作时间但是增加了摸鱼时间
    gorvey
        20
    gorvey  
       2025 年 7 月 16 日
    @SoulFlame #14
    经过你不断的追问,提供了更多上下文,它才回答正确,说明你最开始的提示词太简略了
    refear99
        21
    refear99  
       2025 年 7 月 16 日
    有 ai 了还做题干嘛我请问,直接秃噜秃噜就上线了,多宇宙量级的 app 能用上那些算法和技巧
    maolon
        22
    maolon  
       2025 年 7 月 16 日
    你不试一试 gemini 2.5 pro 和 o3/o4 mini high 还有 grok4?
    你选的那几个做题都一般
    jadeborner
        23
    jadeborner  
       2025 年 7 月 16 日
    你先把题目贴出来
    yuedashi
        24
    yuedashi  
       2025 年 7 月 17 日 via Android
    @Jame00001 不是啊,现在很多 ai 是推理模型,并不需要有题库数据
    kneo
        25
    kneo  
       2025 年 7 月 17 日 via Android
    做个题还要那么多提示词,是不是还要人直接把答案告诉 AI 啊?
    SoulFlame
        26
    SoulFlame  
       2025 年 7 月 17 日
    @gorvey #20 第一次提问,他自己已经把广州地铁完整正确的优惠政策给检索出来了,后续提问我并没有为它提供任何新的政策规则,仅是对它计算方式纠错,我觉得是它的问题。
    letv
        27
    letv  
    OP
       2025 年 7 月 17 日
    @maolon gemini 2.5 pro 的前端能力有点差,经常给我生成一些图片覆盖文字的页面,让它调好几次都没法让文字露出来。反而 grok3 一下子就做到了。
    lologame
        28
    lologame  
       2025 年 7 月 17 日
    这个题我用 ai 写过,好像是 jerry.ai 的家庭作业吧,得用推理模型,非推理模型写不出来单测能全跑过的,用 doubao 的推理模型能写出单测全过的,
    letv
        29
    letv  
    OP
       2025 年 7 月 18 日
    @lologame 请问下你的作业通过了吗?我这边提交的跑文档里用例都过了,结果还是给我拒了,说有没通过的 case
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1012 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 18:16 · PVG 02:16 · LAX 10:16 · JFK 13:16
    ♥ Do have faith in what you're doing.