94.78%高分人工智能首战获世界冠军

2017-07-29 09:01:57来源:中国网
字号:
摘要:2017年,人工智能“世界杯”ImageNet挑战赛退役,由WebVision接棒。值得一提的是,在此次WebVision展现出的所有识别结果中,码隆科技提交的五次识别结果,占据全部识别结果排名的前五名,展示出了极大的优势。

2017年,人工智能“世界杯”ImageNet挑战赛退役,由WebVision接棒。图像识别比赛不再停留在处理“实验室”干净样本数据中,而是开始挑战极度不平衡且有噪声的互联网图像识别,真正走向实际应用场景。在首届WebVision竞赛中,全球有一百多支队伍提交参赛,码隆科技Malong AI Research以超过第二名2.5%的成绩,以大比分优势夺冠。

今天的人工智能革命是由“深度学习”这项技术所驱动的。尽管这个技术表现已非常出色,但它仍有一个主要的缺点:需要大量的标注数据来支持。而且,并非所有的数据皆能直接使用,现在的深度学习系统需要的是提炼过的、人工标注过的干净数据。就像一个在海上脱水而幸存的人,会迫切期盼能从汪洋大海中萃取出饮用水来止渴一样,计算机科学家也迫切希望能在海量数据中找到最符合深度学习需求的数据。但是,正如同人类必须通过海水淡化才能饮用海水一样,今日盛行的深度学习算法所需的数据,必须通过既费时又昂贵的人工标注过程才能取得。

多年来,ImageNet数据集已被视为评估大规模计算机视觉算法的基准。其花费的人力成本是巨大的:通过近五万人,耗时两年多时间,标注了数百万张图片数据。ImageNet团队还通过人工“平衡”了数据,以确保机器学习的先决条件:“每个类别之间存在相同数量的图像”能成立。在这个数据集的基础上,ImageNet大规模视觉识别竞赛(ILSVRC) 就此诞生了,用于测试最新、最好的计算机视觉算法,通过挑战计算机去将未知的图像,进行多达1,000种常见类别分类,从动物(如狗)至交通工具(如飞机)等。

2017年,ImageNet挑战赛退役了。接棒的是名为WebVision的挑战赛,由Google Research、苏黎世联邦理工(ETH)、卡耐基梅隆大学(CMU)等共同组织,在计算机视觉领域最顶尖的学术会议CVPR上举办。WebVision挑战赛所使用数据集使用与ImageNet 竞赛相同的 1000 个物体类别,但与ImageNet有个重要的差别:ImageNet比赛数据都属干净数据(已通过人工标注和平衡的数据),WebVision 所用数据集属于未经过人工标注的来自网上的海量噪声数据(“noisy” data),相较于ImageNet比赛数据为通过人工标注和平衡的干净数据(“clean” data),WebVision难度也因此提高许多。更具体来说,WebVision数据集来自网上的240 万张图像(谷歌搜索的 100 万张图像,以及 Flickr 的 140 万张图像),皆属未经过人工标注或修改的噪声数据。

此次WebVision数据库有极大的不平衡性

2017年7月,在CVPR会议上首届WebVision挑战赛的结果正式公告,冠军获得者是一家来自中国的人工智能创新企业──码隆科技。码隆团队通过 “半监督学习”(Semi-Surprised Learning) 的深度学习算法,处理并利用了“不干净”且“不平衡”的海量数据,其训练出的深度学习模型,图像识别正确94.78%是在所有参赛队伍中唯一可以达到人类识别正确率的,以非常大的优势获得了此次挑战赛全球冠军。

会议期间,码隆科技CEO黄鼎隆博士接受英伟达团队专访,并在晚宴上与英伟达创始人兼CEO黄仁勋,和ImageNet 创始人李飞飞博士亲切交流。英伟达对Inception Program计划成员进行独家专访,曾荣获2016年英伟达COOL DEMO大奖的码隆科技,在CVPR会议上接受英伟达采访,CEO黄鼎隆博士发表对人工智能发展的看法,并介绍了码隆科技目前核心产品人工智能商品识别云平台ProductAI。

这次WebVision挑战赛全球有超过100个团队注册参赛,并因为参赛团队过多一度将比赛截止日期延期。一些团队在比赛后选择匿名并不公开结果,在公开提交结果的团队中,SnapChat、清华大学、上海科技大学、UCF等来自世界各国的顶尖学术和研发机构均榜上有名。

全球有超过100个团队注册参加此次WebVision竞赛

纵观比赛结果,这次WebVision比赛码隆科技的最好结果(94.78%)比第二名高出2.5%,这在计算机视觉的技术竞赛领域是很大优势,比如去年ImageNet图像识别比赛第一名只比第二名高出0.04%。同时,根据权威数据指出,人类对图像的识别正确率在94%-94.9%之间,这说明码隆科技的人工智能图像识别能力已经达到且即将超越人眼识别能力。

值得一提的是,在此次WebVision展现出的所有识别结果中,码隆科技提交的五次识别结果,占据全部识别结果排名的前五名,展示出了极大的优势。

通过这个比赛的实践,码隆算法团队证明了现代深度学习技术可以不完全以人工标注数据为基础,并为今后研究通用的半监督和无监督学习打开一扇门, 为弱人工智能到强人工智能的发展迈出开重要一步。 另外, 码隆科技目前的算法, 对于人工智能技术在很多领域的实际落地非常关键很重要,因为对于很多实际领域,如商业、金融、医疗等,面临的问题不是缺少数据,而是数据缺乏专家标注和标注不统一。

码隆科技已将这项技术广泛应用于其产品ProductAI.com当中,这是一个专为各商品相关企业打造的人工智能商品识别平台,任何一个企业或开发者想使用人工智能商品识别服务,通过这个平台,可以轻松实现高性能的商品搜索和分类技术,目前已应用于如时尚服饰、家具、家装、纺织面料、交通工具、酒类、快消等商品。如果码隆科技在WebVision挑战赛的出色结果,ProductAI对各种商品的识别精准度也明显超出市场同类竞争对手,甚至在多个领域已经达到并且正在超越人类的识别能力。举例来说,任何开发者现在只要通过ProductAI平台上的API接口,就能迅速搭建起一个媲美亚马逊Echo Look的产品,甚至帮助搭建像Amazon Go这样的无人商店,或创造出下一个引领潮流的应用程序。码隆科技在“半监督学习”技术上的突破,使得大量存在于网络和工业界的“不干净”数据也能被用于深度学习模型训练,为深度学习技术和应用的飞速发展提供新的燃料。

码隆科技表示将持续在人工智能科学技术研究领域加大投入,不断推进“半监督式”深度学习的技术突破和商业应用,并会在世界级人工智能和计算机视觉会议和期刊上,发表更多相关技术论文,回报研究界,为人工智能科学研究做出贡献。

责编:海闻

  • 路过

新闻热图

海外网评

国家频道精选

新闻排行