1
Leeeeex PRO 这个评测报告一股子 ai slop 味道
还不如隔壁站真人用过的体验 |
2
hsiafan 3h 59m ago 我现在见到这样的 AI 文风都已经生理不适了,这个文章你是咋看得下去的..
|
3
mnoputd20adfadf3 3h 45m ago Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 。
两者用的是同一个底层模型,差别主要不在能力本身,而在开放边界: Fable 5 是加了更严格安全措施、面向大众可用的版本。 Mythos 5 则只向少量可信用户开放,部分高风险领域的限制被解除。 Anthropic 也借这次发布明确了一件事:Mythos 级已经是高于 Opus 级的新一档模型。 Fable 5 是他们目前公开可用里最强的模型,任务越长、越复杂,优势越明显。 软件工程部分最典型的例子来自 Stripe:在一个约 5000 万行的 Ruby 代码库里,Fable 5 用一天完成了原本需要整个团队两个月以上的迁移。 它在知识工作、图表和表格理解、复杂分析任务上也被认为明显更加健壮。视觉能力则不只是“会看图”,还包括从科学图表中提取精确数据,或仅凭截图重建 web app 源代码。 长上下文和持续执行能力也是这次发布反复强调的部分。Anthropic 提到,Fable 5 能在数百万 token 的任务里持续推进,还会利用自己留下的笔记改进后续输出。 文章用 Slay the Spire 和 Pokémon FireRed 这些例子来说明,它在长程任务中的状态维持、自我修正和纯视觉执行能力都比过去强了一截。 Mythos 5 则更多被放到科研场景里展示。内部蛋白设计团队用它把药物设计中的部分流程提速约 10 倍;在分子生物学盲测里,研究人员大约 80% 的情况下更偏好 Mythos 5 提出的假设。它还做过一项持续一周以上的基因组学研究,整合跨 138 个动物物种、数百万细胞的单细胞数据,设计并训练了一个定制模型,效果超过一篇近期发表在 Science 的模型,而且规模小得多。 Mythos 级模型在网络安全、生命科学这些领域已经足够强,既能帮助研究和防御,也可能被恶意利用。所以 Fable 5 上线时带了一套新的分类器:一旦请求涉及网络安全、生物与化学、或蒸馏等风险方向,系统就会把请求交给 Claude Opus 4.8 处理,而不是让 Fable 5 直接回答。按官方说法,超过 95% 的 Fable 会话不会触发回退。 安全安排之外,Anthropic 还调整了数据策略:对 Fable 5 、Mythos 5 以及同等级模型的企业流量,统一要求保留 30 天,用于安全监测和减少误判,不用于训练新模型。 开放范围上,Mythos 5 目前主要面向 Project Glasswing 的网络安全合作伙伴,之后会逐步扩展 trusted access program ; Fable 5 则从发布当天起全面可用,价格是每百万输入 token 10 美元、每百万输出 token 50 美元。 订阅侧先在 6 月 9 日到 6 月 22 日向 Pro 、Max 、Team 和 seat-based Enterprise 提供,6 月 23 日后改为 usage credits ,之后再视算力情况调整。 |
4
laimailai 3h 42m ago
|
5
526457385 3h 27m ago
写个 crud 用得着这么高级的模型,gpt-5.4 完全够用
|
7
wat4me 3h 12m ago
这个文章是用 Fable 5 总结的吗
|
8
Kokomashiro 2h 59m ago
昨天订阅的,今早刚好看到新的 Fable 5 ,试了前端,我是直接把 figma 设计图给他,可以说爆杀 5.5 ,可以做到 1 比 1 像素级还原。
|
10
takanashisakura 2h 44m ago via iPhone
@jsq2627 AI 生图说实话比 AI 八股还是好受些的。特别是这类示意图而美术资产的情况,更让人好接受些。
|
11
hellodigua 2h 43m ago
没有测评,但是在网页上尝试聊了一下,感觉进步很大,已经是我的主力文本对话模型了
|
12
HENQIGUAI 2h 33m ago
据说前端进步能力巨大!
|
13
EnterpriseD 2h 21m ago via iPhone
生物问题限制是真的严格,随便总结一篇自己发的的 paper 都不给
|
14
dongmian2019 2h 15m ago
用了一下,没感觉和 4.8 有什么大的差别
|
15
shyrock2026 1h 58m ago
感觉提升巨大,那种轻快的,指哪儿打哪儿的感觉好像飞起来了。。。
|
16
zzzzz024 1h 53m ago
早上用了 mythos 一个 codex-review
直接把 max5 的 5h 额度干没了 |
17
xiangran0028 1h 50m ago
早上用了,比较满意,解决了工程中遗留的一个复杂问题,之前 claude 4.8 和 codex 5.5 尝试了几轮都不行。
|
19
tomyark123 40 mins ago
刷了下 HN 上的评论都说不错
|