Llama 2 可以在本地 Mac 运行了

locoz

2023 年 7 月 25 日

@046569 #17
6/7 、举一个我认为很典型、很能体现模型基本能力的例子：

我前段时间在一个 Ceph 集群的 MDS 完全无法正常工作的情况下，研究 CephFS 存在 metadata 池中的文件元数据。由于 Ceph 是完全自定义的数据结构，从池中导出来的内容中几乎没有明文文本，想要在没有源代码的情况下分析数据内容（懒得找），就得靠找规律切出每条数据后，结合已知的其他外部信息结合分析，这属于典型的黑盒逆向。

而 GPT4 能做到什么程度？

在我通过人工判断快速确定了文件元数据所在的位置后，随手复制一大段 16 进制状态的数据丢进去，告诉它这应该是一个自定义的数据结构，其中可能包含了多个文件的元数据，要求它分析数据结构、找出规律。然后 GPT4 不仅找出了规律，逐个列出了切出来的单条数据，还大致判断出了每条数据中可能包含了哪些信息、字段可能的格式是什么样。并且在我没有要求的情况下，还将其中包含的少数明文文本内容（为 16 进制状态，混在那一大段数据中）也处理成了明文进行描述。

而在我根据规律切出数据，再补充上当时能匹配上的一些文件的元数据信息之后，GPT4 几乎给出了准确的数据结构定义，除了提供的样例数据中没有的情况和一些可能是数据丢失或是其他数据结构的情况导致异常以外，直接基于这份数据结构的定义暴力解析出大致的元数据是完全没问题的。

事实上对 Ceph 的数据结构分析也不仅是 CephFS 的 metadata ，其他的数据我也尝试这么逆向分析过，包括后续的根据分析结果编写处理代码在内，整个流程中 GPT4 都给我省了相当多的事。这个水平，市面上的其他同类模型就没有一个能打的，包括 Claude 、PaLM 这种评测排行仅次 GPT4 的商业模型在内。

lianxin255

2023 年 7 月 26 日

@046569 b 站有个 up 用 m2 Ultra 的简单测试，你可以看看。链接附上： https://m.bilibili.com/video/BV1fh4y1M7DX?ts=1690342397&spmid=333.401.click.desc_more&h5_buvid=6393792F-E382-DEA2-AB13-854D2B9785F127256infoc&unique_k=EkNsJ8v&bsource=share_source_weixinchat&openid=o7omF0SUs2y0-EVJROIK09gqWhYs&wxfid=&page=0

046569

2023 年 7 月 26 日

@jjxtrotter
@lianxin255
我之前关注了林亦 LYi,所以第一时间就看到了.然而他在视频中的说法是有误导性的.我求证了 Apple 工程部,截至目前尚未回复具体数据,说是要等待测试结果.

cheneydog

2023 年 8 月 9 日

@locoz

关注你！
感觉你对 AI 应用非常深入了。有没有技术博客、开源项目分享，我也在学习这个方向。

locoz

2023 年 8 月 9 日

@cheneydog #23 没有，我看的东西比较零散，没有特意关注某个或某些博客之类的。而且其实前面的很多内容实际不属于 AI 领域的范畴，AI 领域或者说是大语言模型领域的也都是自己尝试一下就能得到的知识，自己多深入用用就好了。

locoz

2023 年 8 月 9 日

@046569 #22 B 站站长 bishi 前段时间使用 192G 版本的 M2U 做了测试，你可以参考一下：“llama 70B ，没有 4bit ，思考的时候吃掉 140G ，速度和高峰期用 gpt4 没太多区别”

有一说一，和之前说过的一样，没有实用价值。推理时 140G 统一内存占用，意味着多人使用顶不住；速度和高峰期的 GPT4 差不多，意味着速度已经慢到基本没法用了。

046569

2023 年 8 月 9 日

@locoz
简单估算模型规模 * 2 就是无量化的显存占用.
速度不容易估算出来.所以这个数据更有价值一些.好在过了这么多天,网上已经有很多测试视频了.
多人使用肯定要量化的.慢点总比用不了要好.