目前历史追踪功能是这样做的。
历史数据只存储 10 天,每天大概 1500 万数据,所以最多限制存了 1.5 亿条数据。然后数据是通过 parquet 形式落地到磁盘的,查询用的 duckdb ,数据之间的相似性通过汉明距离来判断(有可能误判),没有通过 ai 去做,是因为 ai 的消耗太大了。
额,上面有点嘴碎了。功能大概就是,点击某一条热点旁边的趋势按钮,弹框里显示最近类似的所有热点。朋友们可以帮忙测测提提意见。
热榜站地址:tgmeng.com
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.