一个 22 万张 NSFW 图片的鉴黄数据集?你可以有大胆的想法了……

2019 年 1 月 14 日
 ljspython
如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的。例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像。但限制级的图像很难收集,也很少会开源。因此最近有开发者在 GitHub 上开源了一份 NSFW 图像数据集,这是不是你们想要的?



项目地址: https://github.com/alexkimxyz/nsfw_data_scrapper

最后,希望大家注意身体
27754 次点击
所在节点    分享发现
129 条回复
BestMe
2019 年 1 月 14 日
@ljspython 不懂技术的,表示很焦急。
wwg1994
2019 年 1 月 14 日
这谁顶得住啊
shench
2019 年 1 月 14 日
厉害厉害!
abeholder
2019 年 1 月 14 日
哇塞,搭配我的控制台下载器
https://github.com/abedormancy/tinydownloader
来下载 食用更佳 (里面有千把张二次元桌面壁纸,忘记哪爬的了。。)~~
imshf
2019 年 1 月 14 日
@thonatos #13 顶得住老哥
zhang1215
2019 年 1 月 14 日
@JohnChiu 噢,没仔细看还以为全都是呢
abeholder
2019 年 1 月 14 日
为什么突然萌生出一种六学既视感 。。。

说到 NSFW 的数据集, 我就想起了几个月前做的一个小的下载器。。。

别问了,问就文体两开花·
lingo
2019 年 1 月 14 日
你要说人工智能神经网络,我是不会的,但是你说人工标注,那我们的故事就开始了。
lingo
2019 年 1 月 14 日
顺便想起前几天看到的说 firefox 新功能,内置了一个黄网名单,名单上的网站不会出现在欢迎页。。
作为一个开源项目,能不能只对这份名单感兴趣 = =
d5
2019 年 1 月 14 日
理念先进了
gxlwm
2019 年 1 月 14 日
就这一会 star 涨了好多, 老哥们稳
Amayadream
2019 年 1 月 14 日
这谁顶得住啊
lucahan
2019 年 1 月 14 日
@abeholder 这谁顶得住啊。。。
xspippo
2019 年 1 月 14 日
快拿我的营养快线
jasonyang9
2019 年 1 月 14 日
这叫学以致用
Bantes
2019 年 1 月 14 日
1842 次点击 ∙ 55 人收藏
不说了,收藏波先
suyuyu
2019 年 1 月 14 日
插眼
x86
2019 年 1 月 14 日
手冲一时爽,一直冲一直爽
lkmountain
2019 年 1 月 14 日
插眼
youngxu
2019 年 1 月 14 日
机器之心昨天发的,我昨天就 clone 了以防被删( x

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/526896

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX