上次请教了大家关于平胸妹子鉴黄的问题,调整了一下训练数据集之后又练了个模型 120.78.173.99:4000/tryout 这里可以体验一下,手机端和 PC 端访问都做了适配,后续等我把代码整理一下就丢 gayhub 上了(由于是二手 py,所以会比较丑)
同时收一波训练素材:doge
上次请教了大家关于平胸妹子鉴黄的问题,调整了一下训练数据集之后又练了个模型 120.78.173.99:4000/tryout 这里可以体验一下,手机端和 PC 端访问都做了适配,后续等我把代码整理一下就丢 gayhub 上了(由于是二手 py,所以会比较丑)
同时收一波训练素材:doge
1
tinytin Jan 24, 2018
我是素材
|
2
sennes Jan 24, 2018 刚刚试了 4 张图 分别检测的话
NSFW 0.004 0.004 0.118 0.003 但是拼成一张图之后 NSFW 0.890 |
3
f2f2f Jan 24, 2018
1#头像 0.4114783704280853
|
4
northisland Jan 24, 2018
Something is not right.
Error: Internal Server Error The server encountered an internal error and was unable to complete your request. Either the server is overloaded or there is an error in the application. |
5
tghgffdgd Jan 24, 2018 这个时候是不是应该来个“已屏蔽”
|
6
xwhxbg OP |
8
Weny Jan 24, 2018 via iPhone
当然是去草榴抓
|
10
Willjim Jan 24, 2018 via Android
楼主,放的几个健身男的图,似乎有 0.5?要不要加胡须识别?而且网站 icon 是守望?🤔
|
11
xwhxbg OP @Willjim 其实 0.3-0.7 之前都属于 sexy 的范畴,实际运用的时候我把这些图标记黄图,但是需要人工审核,至于产品去不去审核那就......
|
14
taurenshaman Jan 24, 2018 这张图的 SFW 还不到 0.1
https://i.loli.net/2018/01/24/5a683b43a253b.jpg  |
15
taurenshaman Jan 24, 2018
呃,是 NSFW 值
|
16
xwhxbg OP @taurenshaman emmm 这个明显是 bug,不确定是不是因为我的素材里没有单纯的身体局部导致的
|
18
cname Jan 24, 2018 via Android
已经开始飙车了
|
19
keithszc Jan 24, 2018
可怕
|
21
Weny Jan 24, 2018 via iPhone
@taurenshaman 真的怕
|
22
kenshinhu Jan 24, 2018
服务器好像不能访问了?
|
23
gamexg Jan 24, 2018
没填 url 就点了提交,然后就打不开了...
|
24
xwhxbg OP |
25
skyrem Jan 24, 2018
google 搜 GAY 然后贴上的基本都 NSFW
|
26
zo Jan 24, 2018
这就直接开车了。。。
|
27
zst Jan 24, 2018 via Android
其实我想说有些我自己都不知道算不算小黄图
|
28
mcone Jan 24, 2018
啊 看到楼主头像我就想到你之前那个剑皇帖子了 果然还是你哈哈 随手找了几个关键词搜了十几张图丢了上去 感觉比我想象的好不少……哈哈
话说这个结果不太像是用 3k 样本训练出来的。。。能大概透露下训练样本数和方法吗,直接用已训练好的模型,finetune 一下?难道是直接训练出来的吗(惊恐) 不过有一些 NSFW 本身就涵盖过的图片类别在你这里反而结果有点奇怪 感觉你应该微调了啥…… |
29
xwhxbg OP @mcone 确实只有 3K,用的 nn.softmax,数据处理参考的 open-nsfw,它有个方法用来处理数据矩阵的,然而由于我数学渣渣,看不懂为啥要这么做,目前感觉可能是样本太少导致很多图的结果很奇怪,多人图,身体局部图都很奇怪
|
30
kingcc Jan 24, 2018
火钳刘明
|
31
4263Ad06Awk3b1Do Jan 24, 2018
给楼主 贡献了几张大胸肌肉男,NSFW 0.48 算不算黄啊
|
32
Travers Jan 24, 2018
传了个 22600082070.jpg ,才 0.09 ,楼主可以看下
|
33
Travers Jan 24, 2018
还有个 22600082078.jpg NSFW 0.078 问题比较大
|
34
R18 Jan 24, 2018 via Android
老哥有源码了求艾特
|
35
mcone Jan 24, 2018
@xwhxbg 完全自己训练的吗……那这个结果其实已经不错了 才 3k 数据量要啥自行车(哈哈哈哈) 不过通常 nn.softmax 用于多类 你的样本太少了 有空的话可以改 sigmod 试试看
那个处理数据矩阵的方法我不太清楚,回头等你开源了我围观下吧,毕竟不是做黄图的对这块还真是不太了解…… 至于我上条回复提到的类别的是 athlete,可能你的训练样本里不够多,很多露肉运动员被搞成了黄图……但是我不确定直接加一些类似样本会不会有帮助,因为你数据太少了,加的多了反而可能对你模型有负效果…… |
36
xwhxbg OP @mcone Will do,现在主要是我没有理论支撑,单纯靠调参或者调方法可能不能达到一个可行的高度,而且 py 的性能问题也很突出,目前想要把训练好的模型用 golang 的 TensorFlow binding 来调用,不知道会不会有明显的区别
athlete 这个问题其实蛮严重的,我看了下我收到的结果波动很大,有些 NSFW 被打的很高,有些很低,跟我预想的能节约 90%以上的人力成本差的很有点远,目前看来能节约 50%就不错了 目前在看 https://www.coursera.org/learn/machine-learning 这个课程想要补一下入门知识,现在只恨时间太少,白天还要搬砖,搞完不知猴年马月了 |
38
gh110827 Jan 24, 2018
楼主,我这有个接口,大概是 6000 多张图,都是煎蛋上的,你可已用来当素材训练
https://ie34.com/api/jiandan |
39
AckywOw Jan 24, 2018
老司机带带偶🤓
|
40
owlsec Jan 24, 2018
流弊
|
41
Level5 Jan 24, 2018
开源不? 作为遵从人本性出发,LZ 应该贡献源代码让我们反其道而行....😂
|
42
imn1 Jan 24, 2018
自己去找力武靖的图吧,不过我没有,收这些图有风险,也没这样的嗜好
不是平凶的倒很多 |
44
zonghua Jan 24, 2018 via iPhone
@taurenshaman 地铁上我点开了这个图。。。z
|
45
run2 Jan 24, 2018
@gh110827 #38 的煎蛋里的图 006rN2x6gy1fibr74qjnnj30ks0rr75r 这个 0.26040464639663696 emmmmmm
|
46
AlisaDestiny Jan 24, 2018
百度随便找了个图:
http://g.hiphotos.baidu.com/image/pic/item/c8ea15ce36d3d539f09733493187e950342ab095.jpg NSFW 0.21911317110061646 SFW 0.7808868288993835 |
49
baskice Jan 25, 2018
感觉效果还可以,至少比新浪微博的判断准确率高
|
50
glchaos Jan 25, 2018
老衲差点圆寂在你们的回复中
|
51
opengps Jan 25, 2018
题主收集 H 图的能力非常的可以
|
52
cat9life Jan 25, 2018
这空手套图术果然 6
|
53
Felldeadbird Jan 25, 2018
@mingyun 哇~一大早上班就看到这个。我是 AI 估计受不了了。
|
54
lingyv Jan 25, 2018
不错,用的啥模型?
|
55
xwhxbg OP |
56
xiaojunjor Jan 25, 2018
别关门,别关门,我上错车了。。我先下去
|
57
gh110827 Jan 25, 2018
|
59
gh110827 Jan 25, 2018
我的那个接口是从数据库随机返回一个图片,准备做个应用,可以无限看图的,太懒还没写
|
63
charexcalibur Jan 25, 2018
我也要学机器学习!
|
64
mikeven Jan 25, 2018 via iPhone
reddit nsfw
|
66
Zzde Jan 25, 2018
试了几张 大部分都是 NFW
|
67
Zzde Jan 25, 2018
??? |
69
laodao1990 Jan 29, 2018 via iPhone
教练,我想学开车
|