viskem
V2EX  ›  Claude

昨天早早蹬完了 Fable 5 的额度, GPT 对其评价为 8/10 分。

  •  
  •   viskem · 5h 32m ago · 1110 views

    昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。

    最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议:

    例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。

    5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

    Supplement 1  ·  3h 2m ago

    我说,由于没用Claude Code,我打算用Codex的Goal模式来完成这项大任务,相比之下,GPT5.5对着目标连续执行任务是否存在一些能力缺陷?

    Fable:

    “「让它不间断连续执行」是个幻觉——Goal 型 harness 的真相是一串必死的有限会话。Claude Code 用 Loop/Hooks/子代理/后台守护提供的连续性,Codex 一样都没有。所以……(省略)”

    这Fable评价Codex话语还够狠的。

    3 replies    2026-06-11 16:26:07 +08:00
    409164
        1
    409164  
       5h 29m ago
    Fable 毕竟新,解决问题的能力强是预料之中
    dabaibai
        2
    dabaibai  
       28 mins ago
    老哥搞啥游戏的。
    ryougifujino
        3
    ryougifujino  
       26 mins ago
    “二线架构诊断顾问”把我整笑了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5380 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 08:52 · PVG 16:52 · LAX 01:52 · JFK 04:52
    ♥ Do have faith in what you're doing.