不让AI研究创业输在起跑线 AI Challenger全球AI挑战赛开放数据集

2017-08-15 10:21:58来源:新华网
字号:
摘要:数据被视为开启人工智能引擎的燃料。8月14日,创新工场、搜狗和今日头条联合宣布发起“AI Challenger全球AI挑战赛”,打造国内最大的科研数据集与世界级AI竞赛平台,推动中国人工智能科研创新。

图为三方共同启动“AI Challenger全球AI挑战赛”(新华网发)

新华网北京8月15日电(凌纪伟)数据被视为开启人工智能引擎的燃料。8月14日,创新工场、搜狗和今日头条联合宣布发起“AI Challenger全球AI挑战赛”,打造国内最大的科研数据集与世界级AI竞赛平台,推动中国人工智能科研创新。

三方联合开放的AI Challenger数据集涵盖多个领域,与当前众多热门应用研发密切相关。比如,人体骨骼关键点数据集,可用于无人驾驶、安防、体感游戏等场景;图像中文描述数据集,对于图像和视频内容理解、图像标题自动生成等各类应用至关重要;口语领域英中翻译数据集,可用于同声传译等自然语言处理的各类应用。大赛第一年将开放超过1000万条中英文翻译数据、70万个人体动作分析标注数据、30万张图片场景标注和语义描述数据,是国内迄今公开的规模最大的科研数据集。

据了解,在人工智能领域,数据的质和量是科学研究与产品技术研发的核心。高质量训练数据对机器学习模型的建立和优化有关键性的作用。建立大规模、高水准的标注数据集,是推动AI科研和技术前进的驱动力。

大赛宣言指出,没有足够好的数据,就无法取得世界顶级的科研成果。在此方面,学术界和创业团队所能获得的数据资源通常远少于产业界中的顶级企业。因此,将高质量的数据集建设与科学研究、技术产品研发、人才培养有效结合,对人工智能发展具有重大意义,也是身为产业先驱应尽的一份社会责任。

国务院7月份发布的《新一代人工智能发展规划》指出,围绕增加人工智能创新的源头供给,从前沿基础理论、关键共性技术、基础平台、人才队伍等方面强化部署,促进开源共享,系统提升持续创新能力,确保我国人工智能科技水平跻身世界前列,为世界人工智能发展作出更多贡献。

作为业内较早在人工智能领域布局的投资机构之一,创新工场CEO、创新工场人工智能工程院院长李开复在会上发出号召,希望企业向学术界和创业界开放分享通用数据,让他们在AI研究和创业中不输在起跑线上。他认为,当前AI创业大有前途,但是进入成本和门槛相对较高,开放数据集能够帮助潜在创业者尝试在AI领域展开创业。

自然语言理解、机器翻译等技术在搜狗搜索、输入法、机器同传等产品中均有体现,在产业实践中搜狗积累了大量语音、文本、图像、视频等数据集。“AI人才供给目前存在差距”。搜狗CEO王小川表示,从移动互联网时代向AI时代的演进中中国不能掉队,只有将数据共享出来,科研才能进步,当前针对AI的研究大多是国外关心的方向,中国人要有自己的探索,要做世界AI的贡献者。

今日头条顾问、技术战略研究院院长张宏江表示,今日头条的业务其实是建立在数据之上,对用户更准确的认知是基于对数据的不断挖掘。伴随互联网和移动互联网的发展,数据的量和质均获得提升,正因为有了数据,本轮AI的崛起才会如此真实、迅猛。他指出,虽然由华人撰写的AI论文数量比较多,但真正提出具有重大探索价值问题的论文却较少,在这一点上,中国与美国之间尚存在差距。他希望参赛团队能够从数据中把握问题,利用数据开发出一些新算法,取得应用上的突破。

据悉,2017年竞赛将区分为五个竞赛任务供参赛者组队报名,设有共计200万元人民币的奖金池。自9月5日起开放参赛队伍线上进行数据集下载,竞赛将持续至12月。三方计划在未来三年投入数千万元规模的资金,不断完善平台的建设、扩大数据集的规模。

责编:海闻

  • 路过

新闻热图

海外网评

国家频道精选

新闻排行