Claude5 要来了...真的感到太快了

网上有关于 Claude5 的消息了...更新了很多东西，能力强多少先不论，肯定比现在更好。哪怕参考现有的 4.5 能力已经非常强了。

按照这个迭代速度，后面真的是不敢想象。真的是越来越焦虑了😢

CatGo

2 月 3 日

@xianzhe #11 一部份是出新模型有对比导致，一部份感觉是旧模型降智

wshhfy

2 月 3 日

@kneo @xianzhe 我说的宽泛了点，不论是 llm 还是 agent 或是各种多模态工具，实际上确实是提升了大部分人的工作效率的，虽然目前不能完全脱离人的 review ，但我自己的工作量是明显减少且速度更快的。

至于你说的 gpt 早期的模拟命令行功能，现在通过各种 mcp 可以做的更多。

虽然现在都是通过提升上下文和处理速度来进化，但量变引起的质变很明显

wshhfy

2 月 3 日

@FaustinaD 哈哈，游戏确实难搞，不过用 rodin 打印了很多小朋友的 3d 玩具还是可以玩玩的

andrew2558

2 月 3 日

说是 5 sonnet 比现在 4.5 opus 更强，成本降低 50%。真要这样，真是可以的

yarawen

2 月 3 日

@FaustinaD 说到游戏，蚂蚁灵波的世界模型，视觉效果也非常震撼。
或许有生之年真的可以见证一个虚拟世界的诞生。
当然星网和全息游戏还是很遥远。

HK560

2 月 3 日

《关于各家 AI 大爹不知不觉把我惯成废物这件事》

org100

2 月 3 日

Claude 免费额度很少不过很好用

FaustinaD

2 月 3 日

@yarawen 这个模型在哪可以体验呀

yarawen

2 月 3 日

@FaustinaD github 上开源了 https://github.com/Robbyant/lingbot-world

kneo

2 月 3 日

@wshhfy >至于你说的 gpt 早期的模拟命令行功能，现在通过各种 mcp 可以做的更多。

agent 能力不等于模型能力。如果拉上 mcp 才能实现，说明模型能力在退化。

kneo

2 月 3 日

@andrew2558 >说是 5 sonnet 比现在 4.5 opus 更强，成本降低 50%。真要这样，真是可以的

成本降低可能是真的。强多少可很难说。（当然现在 opus 4.5 也不强就是了。）

Felldeadbird

2 月 3 日

不用焦虑，只需要知道：上下文容量、推理质量和 token 消耗三者存在不可能三角关系。一切就释然了。

再焦虑也解决不了年纪上去了，社会逐步淘汰老登啊。

tomorrow092

2 月 3 日

@iorilu 你把资本想的太善良了，降智 4.5 ，逼你换到 5

EchoAdventure

2 月 3 日

坐等他出来。

yuPD97Yeed4QM245

2 月 4 日

没什么好焦虑的，首先，它进化得没有那么那么快，其次大多数人类的工作没那么重要，别放在心上

alenryuichi

2 月 4 日

@FaustinaD agent-zero 又来了

beyondstars

2 月 4 日

套路就是，每次精心准备一些 benchmark 数据集，跑出比上一个好一些的分数，精心挑选一些指标放出来，然后让上一代模型降智。

也就那样。

holulu

2 月 4 日

AI 生成再快，在严肃场景里还是得人来确认吧，不然上线出问题还是得自己担。如果不是严肃场景就随便吧。

wzw

2 月 4 日

@xianzhe #17 怎么用好 plan 模式？

huaweii

2 月 4 日

大量底层码农的自然语言表达能力（需求表达能力），还跟不上模型编码细节能力的提升。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1190464

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.