o3 非常不给力,还不如 4o,是因为降智么?

2025 年 6 月 10 日
 ttgo
我是 plus 订阅。碰到的问题有

1. 有时思考时间极短,回答极短。
2. 第一条消息上传了附件,过两三条消息,思考过程里就说无法访问附件,然后就开始脱离附件内容胡扯。

虽然也帮我解决过一些 4o 无法解决的问题,但没有感觉到明显强于 4o ,没有宣传和跑分说的那么强啊。
2085 次点击
所在节点    OpenAI
2 条回复
neteroster
2025 年 6 月 10 日
比较像降智。事实上现在 IP 不特别干净几乎必然降智的。

想实锤就试试难数学题,如果思考时间仍然短可以确定降智。
youthfire
2025 年 6 月 10 日
以前理解是 ip 关系,现在理解是动态调整。
付费前提下,除了 claude ,没有一家老实的。openai 一直动态调整的,perplexity 是不断缩减 context ,gemini 短频快给你换模型,claude 就是明着额度偏少。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1137540

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX