昨天早早蹬完了 Fable 5 的额度， GPT 对其评价为 8/10 分。

昨天早早蹬完了 Fable 5 的额度，由于全用于审查各个项目的上层命题，以及大的策略规划，代码能力没太感受出来，不过风格上似乎更注重数据和执行的有效性，可靠性。

最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告，而 5.5 也采纳了不少建议：

例如，Fable 会把归因搞得更具体，5.5 xHigh 总一个劲埋头“泛化排查”，而 Fable 知道要先解决个别 Fatal ，并固化个别归因工具。而且有注意到 IO 重叠问题，也说出了一些空引用可能带来的污染。对排查问题的先后顺序，指导得比较明确，这是 GPT 5.5 xHigh 没达到的。

5.5 xHigh 也对 Fable 做了个评价：“二线架构诊断顾问，方法比普通泛泛建议强很多，但很多细节坑它还是不知道，必须自己的证据落地。我的评价是 8/10：方法论靠谱，但也不是啥都懂。”

Supplement 1 · 3h 2m ago

我说，由于没用Claude Code，我打算用Codex的Goal模式来完成这项大任务，相比之下，GPT5.5对着目标连续执行任务是否存在一些能力缺陷？

Fable：

“「让它不间断连续执行」是个幻觉——Goal 型 harness 的真相是一串必死的有限会话。Claude Code 用 Loop/Hooks/子代理/后台守护提供的连续性，Codex 一样都没有。所以……（省略）”

这Fable评价Codex话语还够狠的。

3 replies • 2026-06-11 16:26:07 +08:00

1

409164

5h 29m ago

Fable 毕竟新，解决问题的能力强是预料之中

2

dabaibai

28 mins ago

老哥搞啥游戏的。

3

ryougifujino

26 mins ago

“二线架构诊断顾问”把我整笑了