老大让爬取微信公众号的历史文章内容和点赞数以及评论,各位 v 友有什么建议吗?

2018 年 6 月 13 日
 dapengzhao

1 目前尝试了自己抓包,想通过自己拼接微信数据接口的方式取数据,无奈参数太多,有几个始终无法解析出来。 2 看到 git 上有大佬用中间人攻击的方法直接获取数据包,但是看不懂。

2401 次点击
所在节点    问与答
9 条回复
ooooo
2018 年 6 月 13 日
关键词 huginn
airyland
2018 年 6 月 13 日
楼上说 huginn 是真的试过的么,如果是要爬搜狗,搜狗是没有点赞数,评论的,历史文章只有 10 条。历史文章页面是微信域的,有严格的 ip 限制。

现在简单可行的就是用 Anyproxy 实现注入 js 脚本来实现爬取了,但是你要有足够多的账号设备,微信封不封你看心情。。
golmic
2018 年 6 月 13 日
赞同二楼。直接免费直播讲过微信公众号内容的抓取,录播视频在知识星球:数据
golmic
2018 年 6 月 13 日
anyporxy 或者 whistle
golmic
2018 年 6 月 13 日
@golmic anyproxy...
dapengzhao
2018 年 6 月 13 日
@golmic 好的我去看看学习一下
dapengzhao
2018 年 6 月 13 日
@golmic 去了知识星球上面有个搜索框输入了微信,视频,数据,微信视频,微信数据,都返回没有搜到。。。
crab
2018 年 6 月 13 日
@dapengzhao 应该说的是公众号 pydatame 里的付费星球
golmic
2018 年 6 月 13 日
@dapengzhao #7
@crab #8
知识星球搜 数据 应该有的吧,星球名字叫数据,是付费的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/462778

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX