求助帖 如何收集 B 站所有用户 UID

2025 年 5 月 19 日
 mingde816

如题,想收集 B 站所有用户的 UID ,但是 B 站现在用户 UID 位数已经达到了 16 位,简单的遍历似乎已经无法完成这个任务。 目前的进展: 测试了一个 16 位 UID 的上下账户,发现是连续的,疑似 B 站的散列是制造了一些固定的前缀,再以此分配 UID ,可以按一定间隔尝试寻找锚定点,进行查找。 下面这篇专栏也有一样的发现。 https://www.bilibili.com/opus/833100467182501892

7275 次点击
所在节点    程序员
47 条回复
Shatyuka
2025 年 5 月 20 日
刑啊
teble
2025 年 5 月 20 日
可刑可拷
evan1
2025 年 5 月 20 日
试试去爬 google 。google 搜一下 site:bilibili.com {uuid},有结果就有对应的用户,没结果就没用户。
Wxh16144
2025 年 5 月 20 日
入职 B 站,打入内部。之前不还爆出来员工擅自修改特定用户 web 端直接重定向到某个网页么。那就说明内部很草台
evan1
2025 年 5 月 20 日
@evan1 #23 我真是个天才!
evan1
2025 年 5 月 20 日
@evan1 #23 但是看了下 google 的 robots.txt ,不让随便爬 search 。
x86
2025 年 5 月 20 日
带预算自然有人给你做
lisxour
2025 年 5 月 20 日
这种东西还要问吗,不靠自己用号码池抓,你要不打电话给 b 站运维,让他把数据库导出打包发给你?
Laobai
2025 年 5 月 20 日
太刑了
binge921
2025 年 5 月 20 日
太刑了
JoeDH
2025 年 5 月 20 日
收集的理由?
sir283
2025 年 5 月 20 日
用 selenium 调用浏览器访问?
FlashEcho
2025 年 5 月 20 日
@Belmode #4 B 站有好几个大规模搜集用户信息的爬虫站(虽然因为反爬收集地不全),比如:
laplace.live
aicu.cc

我感觉如果没有商业冲突,至少 B 站是懒得管的,他们内控都一团糟,普通开发都能去生产数据库查用户隐私开盒用户,外部的网站就更懒得管了
abc1310054026
2025 年 5 月 20 日
这可能是个 XY Problem ,你想收集 UID 用来干什么?
C02TobNClov1Dz56
2025 年 5 月 20 日
你可以试试到 b 站入职, 当现场运维人员, 然后到备份库里面导一份全量的 uid)
la2la
2025 年 5 月 20 日
V 站联系 B 站数仓人员,每天用 excel 给你拷出来一点
stone9527
2025 年 5 月 20 日
@JoeDH 这种事儿怎么能说出来啊
suyuyu
2025 年 5 月 20 日
看了一下我的是 8 位
edward1987
2025 年 5 月 20 日
B 站主页啥的有风控,但是活动页不一定有风控 可以找几个活动看下请求
franswish
2025 年 5 月 20 日
没玩过爬虫技术,以下是我的一些突发想法和问题:
有没有懂法的人介绍下,爬虫行为是否触犯法律和爬取速率、数据量有关系吗?
除了本贴提到的爬 b 站用户 UID (商业网站),以前还看到过想自动化爬取公开招标公告的(政府、机构、国企网站),前者只有在比较快的速率和相对大的数据量下才会有实际使用价值,而后者说只是想用脚本替掉自己每天手动刷新(也就是说只需要每天若干次爬取即可),两者都算非法入侵计算机信息系统吗?
反过来说,如果我发动很多人集中访问某个地址,行为中不包含任何自动化手段,是否不管我发动多少人,都不算非法入侵计算机信息系统?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1132841

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX