❏ 站外平台:

谁能帮你猜 12306 验证码,就指望深度学习啦

作者: 箫雨

| 2015-12-12 08:02   评论: 1    

近段时间以来,大家纷纷被 12306 的神级图像验证码给击败了,网上吐槽一片。正好最近在深度学习方面的一项图像识别测试比赛中,各大科技公司又取得重大突破,微软还拿到了第一名。也许,将来我们可以指望微软小冰来帮你识别那些神级图像验证码了。

据科技博客VentureBeat报道,在第六届ImageNet年度图像识别测试中,微软研究院的计算机图像识别系统在几个类别的测试中拔得头筹,击败了谷歌、英特尔、高通、腾讯以及一些创业公司和学术实验室的系统。ImageNet是全球最大的图像识别数据库。

ImageNet数据库中的iPod图片

微软的获胜系统名为“图像识别的深度残差学习”Deep Residual Learning for Image Recognition,由微软研究员何恺明、张祥雨、任少卿和孙剑组成的团队开发。微软称,公司将在未来发表的论文中详细介绍这一系统。

考虑到这项技术的复杂性,它可以称得上一项了不起的成就。“我们对神经网络的训练深度超过了150层,”该团队称,“我们提出了一个‘深度残差学习’框架,它能够减少优化,整合极深度网络。当网络的深度在之前基础上显著加深时,我们的’深度残差网络’的准确率就会提升。这种准确率的提升是很多普通网络在加深时无法达到的。”

科技公司现在十分热衷于深度学习领域的研究,他们希望借此改进自主内部系统及其消费级产品。深度学习是高性能网络的核心,涉及在照片等大数据基础上训练人工智能神经网络,然后向它们提供新数据,获得推断结果。

微软已经通过几款有趣的应用展示了公司在人工智能领域的实力,比如“我看起来有多大”How Old Do I Look?“我的胡子怎么样”How’s My Moustache Doing?。微软还建立了Project Oxford项目,以实现图像识别技术的商业化。

ImageNet要求参赛系统对来自图片分享网站Flickr和搜索引擎的10万张照片进行精确定位,然后尽可能准确地将他们划分到1000种目标类别下,包括狼蛛、iPod、清真寺、玩具店、调制解调器等。

微软获胜系统的分类错误率为3.5%,定位错误率为9%。过去几年,谷歌、创业公司larifai、NEC一直在图像分类准确率上占先。

微软的系统今年还在ImageNet的目标侦测测试中占据第一位。“甚至连我们自己都不相信这种单一想法能够取得这么好的效果,”孙剑称。

百度并未参与今年的ImageNet测试。去年,百度的测试存在违规行为,采用了密集测试的方法以提高成绩。百度随后道歉,并解雇了团队负责人。百度因此被禁止提交测试成绩1年。

在这次测试中,IBM提供了SoftLayer公有云服务供参赛团队使用,使用的是英伟达的图形处理器。



最新评论

来自四川成都的 Liebao|Windows 7 用户 2015-12-12 15:50 10 回复
省省吧,再NB的图片识别算法,也架不住12306的响应速度慢。

返回顶部

分享到微信

打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。