如果你对网络上那些打上 NSFW(No Safe For Work,上班时间不要看)标签的照片是如何分类感兴趣的话,你应该会对这条新闻感兴趣,雅虎刚刚 开源了他们自己构建的一套深度学习神经网络 ,专门用于自动检测图片是否含有色情内容。

话虽简单,事实上用机器去分辨色情图片确实是件困难的事,毕竟在法理上区分淫秽都非常不容易,甚至可以说根本无法定义淫秽。美国前大法官波特·斯图尔特有一句名言:“ 我看到它,才知道它是不是 ”。机器是没有七情六欲的,任何图片在它看来都只是文件。

经过多年的研究和实践,卷积神经网络已经证明是最好的图片归类工具,只要提供相应的数据库,算法就可以学习这类图片的特性,比如分类狗狗的照片,只要识别尾巴鼻子头;分类汽车,前脸轮子门把手;给机器“欲望”,你们自己脑补吧。

雅虎的色情图片识别系统会给图片一个 NSFW 值,最无害的是 0,最极端是 1,题图里花从中的姑娘的 NSFW 值是 0.001,铁人三项妹子因为穿的稍微运动一些,数值升高到 0.116,也都不是色情图片的标准。

开源之后,这套识别系统可以在很多场合使用,除了第一时间能想到的审查系统,比如还可以用作自动 NSFW 标签器,帮你过滤工作邮箱里不合时宜的图片(来自其他员工的恶搞)。

各位如果有兴趣的话可以去 雅虎的文章 里查看详细情况,模型可以在 GitHub 上下载,如果你想要搭建自己的色情图片识别系统,你必须自己提供数据,不过我想这应该不是什么问题。

(配图来自网络,非原文配图)