deplives

opus 4.8 现在真是一坨

  •  
  •   deplives · 12h 7m ago · 887 views
    官方 claude 使用的 opus4.8 xhigh
    没有用 CLAUDE.md
    一个很简单的 cloudflare worker 让新增一个页面,主要功能是从同目录下的 appcast.xml 解析出下载链接,然后在页面中展示一个下载按钮,然后设计一套好看点的 UI
    就这一个简单到不能再简单的需求,洋洋洒洒写了个 300 多行 spec 又洋洋洒洒写了个 611 行的 plan
    然后派发了 6 个 agent 执行,然后写到一半也不知道为啥就开始启动 wrangler dev 然后疯狂发请求调试,然后貌似本地请求一直有问题(我看他请求的 url 一直是 404 )然后就开启了 debug 甚至都开始想改我本机的 /etc/host

    然后我给他说你别纠结这个了,直接进行下一步吧,然后他又开始了长达 15 分钟的 kill wrangler dev 的操作

    从开始到现在已经 40 多分钟了,代码就写了三行 (router.js 中增加了页面的路由)
    5h 用量已经只剩了 40%
    Bluecoda
        1
    Bluecoda  
       10h 29m ago
    我觉得你用错了
    你应该分开多个小任务,控制在 context window 120k 以内就能完成的大小,因为超过这个就开始降智,所有模型都是。
    compact 过的更蠢。
    每做完一个就 clear ,确保 context 干净,小
    xiaomushen
        2
    xiaomushen  
       10h 23m ago
    @Bluecoda 这样和 glm5.1 有何区别? opus 本来就是靠长任务大上下文碾压国模的
    jjx
        3
    jjx  
       10h 4m ago
    max 一个会话总是中断, 没办法,只好使用其它模型
    deplives
        4
    deplives  
    OP
       9h 17m ago
    @Bluecoda 兄弟,html 调用一个 js 解析一个 appcast.xml 拿到最新的下载链接,条充到对应的位置,你要分成几个 agent 来做?最后 codex 花了 3 分钟占用了 3% 的上下文带上 html 一共加起来 300 行代码,你告诉我要分成几个小任务去做?
    kpprotector
        5
    kpprotector  
       8h 3m ago
    非常降智了,我给了 opus 一段非常简单的字符串处理代码,让它加到已有的代码里:
    raw_str = raw_str.replace(r"\n","\n")
    (中间 4 行其他代码)
    if len(raw_str)>1 and raw_str[-1] == '\n':#这里
    raw_str_ = parse(raw_str[:-1])
    else:
    raw_str_ = parse(raw_str)
    Opus 提示我没有对字符串末尾的字面量“\n”做删除,只替换掉了换行符。
    然而我第一行就换过了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2890 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 15:10 · PVG 23:10 · LAX 08:10 · JFK 11:10
    ♥ Do have faith in what you're doing.