Claude5 要来了...真的感到太快了

2 月 3 日
 wshhfy
网上有关于 Claude5 的消息了...更新了很多东西,能力强多少先不论,肯定比现在更好。哪怕参考现有的 4.5 能力已经非常强了。

按照这个迭代速度,后面真的是不敢想象。真的是越来越焦虑了😢
12064 次点击
所在节点    Claude Code
67 条回复
CatGo
2 月 3 日
@xianzhe #11 一部份是出新模型有对比导致,一部份感觉是旧模型降智
wshhfy
2 月 3 日
@kneo @xianzhe 我说的宽泛了点,不论是 llm 还是 agent 或是各种多模态工具,实际上确实是提升了大部分人的工作效率的,虽然目前不能完全脱离人的 review ,但我自己的工作量是明显减少且速度更快的。

至于你说的 gpt 早期的模拟命令行功能,现在通过各种 mcp 可以做的更多。

虽然现在都是通过提升上下文和处理速度来进化,但量变引起的质变很明显
wshhfy
2 月 3 日
@FaustinaD 哈哈,游戏确实难搞,不过用 rodin 打印了很多小朋友的 3d 玩具还是可以玩玩的
andrew2558
2 月 3 日
说是 5 sonnet 比现在 4.5 opus 更强,成本降低 50%。真要这样,真是可以的
yarawen
2 月 3 日
@FaustinaD 说到游戏,蚂蚁灵波的世界模型,视觉效果也非常震撼。
或许有生之年真的可以见证一个虚拟世界的诞生。
当然星网和全息游戏还是很遥远。
HK560
2 月 3 日
《关于各家 AI 大爹不知不觉把我惯成废物这件事》
org100
2 月 3 日
Claude 免费额度很少 不过很好用
FaustinaD
2 月 3 日
@yarawen 这个模型在哪可以体验呀
yarawen
2 月 3 日
kneo
2 月 3 日
@wshhfy >至于你说的 gpt 早期的模拟命令行功能,现在通过各种 mcp 可以做的更多。

agent 能力不等于模型能力。如果拉上 mcp 才能实现,说明模型能力在退化。
kneo
2 月 3 日
@andrew2558 >说是 5 sonnet 比现在 4.5 opus 更强,成本降低 50%。真要这样,真是可以的

成本降低可能是真的。强多少可很难说。(当然现在 opus 4.5 也不强就是了。)
Felldeadbird
2 月 3 日
不用焦虑,只需要知道: 上下文容量、推理质量和 token 消耗 三者存在不可能三角关系。一切就释然了。

再焦虑也解决不了年纪上去了,社会逐步淘汰老登啊。
tomorrow092
2 月 3 日
@iorilu 你把资本想的太善良了,降智 4.5 ,逼你换到 5
EchoAdventure
2 月 3 日
坐等他出来。
yuPD97Yeed4QM245
2 月 4 日
没什么好焦虑的,首先,它进化得没有那么那么快,其次大多数人类的工作没那么重要,别放在心上
alenryuichi
2 月 4 日
@FaustinaD agent-zero 又来了
beyondstars
2 月 4 日
套路就是,每次精心准备一些 benchmark 数据集,跑出比上一个好一些的分数,精心挑选一些指标放出来,然后让上一代模型降智。

也就那样。
holulu
2 月 4 日
AI 生成再快,在严肃场景里还是得人来确认吧,不然上线出问题还是得自己担。如果不是严肃场景就随便吧。
wzw
2 月 4 日
@xianzhe #17 怎么用好 plan 模式?
huaweii
2 月 4 日
大量底层码农的自然语言表达能力(需求表达能力),还跟不上模型编码细节能力的提升。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1190464

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX