鉴黄师专用 Python 轮子之 PornDetective

2017 年 1 月 3 日
 slysly759

前言

这两天跨年,就想将自己的 Python 组织和表达能力再提高一下,当然最好的方式自然是读大师的源码,我也就看到实验楼上面的那篇关于色情图片识别的文章,因此依葫芦画瓢才建了这个库。

0x01 色情识别算法介绍

检测色情或者说判定是否是色情的关键是通过皮肤的裸露程度判别,也就是说色情识别算法的核心就是识别皮肤。

那么现今主要识别皮肤的是通过三个步骤:首先选择合适的颜色空间来表征图像像素;然后使用适当的皮肤模型来建模皮肤和非皮肤部分像素;最后依据此建模来分割出正确的皮肤部分。而识别皮肤的关键在于寻找到合适的像素区间,因为肤色 种族 光照 等等因素都会影响到皮肤的识别。

从 2015 年的厦大陈丽一篇《一种融合方法的皮肤检测技术》上我们了解到 在图片预处理 降噪 resize 后 将二维直方图 高斯模型 动态阈值 三个处理模型进行混合的综合皮肤检测技术,能达到识别率 90+的程度,比其他三种模型高出一到五个百分点。

那么实验楼这位作者是如何去识别一张图片的皮肤部分呢?

0x02 我在此基础上做了什么?

0x03 未来将会准备做什么?

试验效果图属不可描述范围~附上 Gayhub 地址~

当然我不会说那个 HeiHeiHei 函数是干嘛的==

github 地址 ![]( http://www.songluyi.com/wp-content/uploads/2017/01/QQ 截图 20170103220111.png)

9559 次点击
所在节点    Python
36 条回复
lostvincent
2017 年 1 月 4 日
我感觉通过分析音频来鉴黄比较简单...
SlipStupig
2017 年 1 月 4 日
@lostvincent 色情图片,用音频识别,在下佩服佩服
lostvincent
2017 年 1 月 4 日
@SlipStupig 就关注鉴黄没在意是图片了,尴尬(逃
nbndco
2017 年 1 月 4 日
基本上都是深度学习了,检测皮肤不靠谱的
kankana
2017 年 1 月 4 日
试了腾讯万象,这东西还是得用深度学习,现有算法准确率没那么高
EIlenZe
2017 年 1 月 4 日
@DoraJDJ 233333333
dobest
2017 年 1 月 4 日
一点看法:

1. 基于像素+人工规则 的方法鲁棒性存在问题,像其他同学说的那样,深度学习更靠谱。
2. 为什么不用 scikit-image 或 opencv 等基于 numpy 的库呢? 这样性能不是更好吗?
3. 楼主的代码和 nude.py 的代码有些类似,但没看到说有参考 nude.py ,或者楼主是参考的实验楼该项目作者的代码?

https://github.com/hhatto/nude.py/blob/master/nude.py
https://github.com/songluyi/PornDetective/blob/master/porndetective/__init__.py
slysly759
2017 年 1 月 4 日
@dobest 的确借鉴他的,我也在文中说明了我改了那些 新加了那些东西。 看起来诸位都看好深度学习的| ू•ૅω•́)ᵎᵎᵎ我还是默默去看文献了⊙▽⊙
dsphper
2017 年 1 月 4 日
求原始训练集高清五码图片。
iamnuomi
2017 年 1 月 4 日
yahoo 的鉴黄开源项目在这里 https://github.com/yahoo/open_nsfw
另外,还有人根据 yahoo 的模型反向制作了图片生成器,在这里: https://open_nsfw.gitlab.io/, 其中有大量算法生成的图片,怎么说呢,还是值得一看的

anyway ,请大家搭配服用
ericgui
2017 年 1 月 4 日
其实微博上很多网红露太多了,都不穿衣服,但都利用手势或者其他姿势恰好遮住了三点,虽然也是几乎没遮住。。。这种情况啊,连微博管理员都不知道到底该删不该删。
figofuture
2017 年 1 月 4 日
mark
winglight2016
2017 年 1 月 5 日
@lostvincent 正如前人所说:你叫那些直播网红怎么办啊?
hjq98765
2017 年 1 月 6 日
胶衣丝袜控有福了→_→
Pythonwanted001
2017 年 1 月 12 日
大项目,有兴趣合作吗?可加 QQ 1005367713 私聊。
saintatgod
2017 年 7 月 21 日
挖个坟,已经被机器学习甩掉几条街了。准确度太低

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/332010

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX