博客首页|TW首页| 同事录|业界社区

李瀛寰

李瀛寰

AlphaGo完胜柯洁,中国AI企业谁有实力与谷歌同台竞技?

AlphaGo再次完胜世界围棋第一人柯洁,人工智能显示出在某一特定领域已超越人类的超强能力,应该说,这是一个人的落寞和亿万人的欢呼。

柯洁 VS AlphaGo 0:3大败

事实上,人工智能自1956诞生至今,对于普通公众而言,我们除了从科幻电影中能看到人工智能的影子外,在实际的现实上却很难看得到。一直到了2006年,加拿大多伦多大学教授、机器学习领域泰斗——Geoffrey Hinton开启了深度学习在学术界和工业界的浪潮,这是人工智能行业的一个分水岭。到了2011年,微软研究院和Google的语音识别研究人员先后采用DNN技术降低了语音识别错误率20%~30%,这是语音识别领域十多年来最重大的突破性进展,从而开启了人工智能迅猛发展的一个时代。

今天让我们惊讶的AlphaGo就是基于神经网络算法的成果,AlphaGo可以从每一层的神经网络中对棋局进行分析,现在的AlphaGo已经拥有了40层神经网络。当然,对于人工智能领域的发展,也不仅仅只是我们现在热议的AlphaGo,从全球范围内,几个主要的“玩家”起到了决定性的推动作用。在软件方面,谷歌和Facebook进行了大量的投入,很多创新都是从这两家公司产生的。而微软、IBM和亚马逊也是这个领域不可或缺的“玩家”。

麦肯锡2016年年底的报告显示,“被视为未来超级智能系统的先锋——各类应用机器学习技术的分析工具已现身市场。金融、医疗、制造等行业应用发展迅速,人工智能领域的全球风投也从2012年的5.89 亿美元猛增至2016年的50多亿美元。 麦肯锡预计,至 2025 年人工智能应用市场总值将达到1270亿美元。”

所以从产业发展的角度看,未来全球经济的驱动力向人工智能方向转移也是必然的,事实上,无论是美国、欧洲还是中国,人工智能已经上升为国家战略。

人工智能领域,中国与世界的距离

中国在互联网、特别在移动互联网领域跑赢了全球大盘,在人工智能领域能否继续成为全球的主流“玩家”,将决定着中国未来20年甚至50年的经济增长。麦肯锡在《中国人工智能的未来之路》报告中表示,中国与美国是当今世界人工智能研发领域的领头羊。仅在 2015 年,两国在学术期刊上发表的相关论文合计近1万份,而英国、印度、德国和日本发表的学术研究总和也只相当于其一半。尽管如此,但中国在人工智能领域的研究论文的影响力远不如英美。这里面有产业积累上的原因,更多是因为人才和智能生态环境的原因。对此,商汤科技联合创始人、CEO徐立博士认为,“中国的人工智能有非常大的发展潜力,我们(商汤科技)也大量引进人才进入这个行业”。

中国人工智能领域的论文“量”很大,但“质”还有很大空间

同样在公众关注度等方面,“谷歌上搜索深度学习的这个热度,中国遥遥领先于世界各国。这是很有意思的事情,仔细想一想,这说明中国关注人工智能的群体倒底有多少人,人工智能在中国是不是一个非常大的热潮。”这一切,为中国的人工智能产业的大发展提供了良好的社会环境和公众认知。

就像中国在移动互联网领域特别是移动互联网应用层面,基于海量的用户基数和需求,让中国的移动互联网应用超越了美国成为另一个中心一样,中国互联网产生的巨量用户数据,也将成为人工智能领域深度学习算法的“原料”,成为中国人工智能领域发展的独特资源,也将对人工智能产业发展产生巨大的推动。所以我们今天可以看到麦肯锡的报告对于中国人工智能产业发展的肯定。

事实上,中国的人工智能领域之所以被行业认可,除了互联网巨头之外,还有一些持续坚持基础研究和应用落地的企业。在5月26日深圳举办的“看见Ÿ人工智能”为主题的2017商汤“智”造大会上,商汤科技联合创始人、CEO徐立博士表示,“从2004到2008年间,我们在两个顶级学术会议上的文章数量为57篇,MIT一共有91篇,剑桥是30篇。前年也是在这两个会议上,商汤发表了24篇文章,谷歌是38篇。要知道,谷歌是拥有6万名员工的大公司。去年,还是这两次会议,我们又发表了42篇文章,超过了谷歌前年的水平。按照这个标准,我们顶多落后于谷歌一年。”

商汤科技联合创始人、CEO徐立博士

商汤科技在人工智能基础研究方面的成就,着实让很多人大吃一惊。

事实上,商汤科技的科学家是学术界最早涉猎深度学习的华人团队,自2011年开始便涉及深度学习领域的研究。到了2011—2013年间,在计算机视觉领域的最顶级的两个会议上,全球涉及到深度学习的29篇文章中,有14篇出自商汤科技的科学家之手,占了全球一半的数量。2014年,商汤科技在人脸识别技术方面超过了人类眼睛识别能力的极限。当时,一般人眼识别的准确率是75%左右,但Facebook做到了97.3%。商汤科技的团队连续做了四五个算法,最后将识别准确率从97.4%提高到了99.55%,从而超过了Facebook的准确率。

这是中国人工智能加速的一剂催化剂,为中国在计算机视觉识别特别是人脸识别方面的大规模应用创造了条件。

用原创技术,赋能中国人工智能应用

ImageNet竞赛是人工智能领域的权威竞技场(斯坦福华裔学者Feifei Li为视觉领域收集了大规模的“图像分类和物体检测”数据集,该数据集最初包括一个1000类图片分类的任务,后面又增加了200类静态图片物体检测任务),2014年9月,商汤科技团队首次出征ImageNet竞赛,在大规模物体检测比赛中以40.7%的成绩荣获世界亚军。

2015年,组委会在比赛中加入了视频。在视频的检测中,商汤科技取得了全球第一的成绩。2016年,商汤科技在五项比赛里取得了三项第一名。

商汤科技之所以能在世界深度学习和计算机视觉领域与谷歌、微软等人工智能领域世界顶级的企业站在同一个技术平台上角逐并能折桂而归,其自身的技术实力已毋庸置疑,更重要的在于,商汤科技自创立之初就将自己定位于“致力于引领人工智能核心深度学习技术突破,构建人工智能、大数据分析行业解决方案”。

在商汤科技CEO徐立博士看来,“在2011年之后,深度学习被首次应用到了视觉当中。商汤也是在其中最早将深度学习应用到视觉领域的团队之一,也是比较大的一个团队之一。计算机视觉识别技术发展正在进入超越人类的第二阶段,我们发现我们其实不需要依赖于人类的这些数据和一些场景,以及专家的一些特定支持,我们可以完全表达,从数据中来解决这样的一些问题。那么有了这种从数据中学习的过程,我们就拥有了可以超越人的准确率”。

近期,AlphaGo的创始人哈萨比斯也表示,在深度学习领域,数据其实比算法更重要,这与商汤科技的思想不谋而合。

事实上,在业界公认的人工智能四大组成部分认知、预测、决定和集成方案中,与我们常见的PC系统相似,仍然需要系统、超算平台和大数据库的支持。我们常听说的“谷歌大脑”、“百度大脑”其实指的就是人工智能领域的系统。大脑的核心就像是一套操作系统,它是一个开源算法。谷歌和Facebook都有它自己的开源系统用来做基础应用,而且有一些还是免费的。现在人工智能、深度学习的门槛变得比较低,就是因为它有了开源算法。

2011年的时候还没有很理想的开源算法,商汤科技需要从头做起。经过这些年的努力,商汤成功开发了自己的人工智能深度学习算法,如今,商汤的合作伙伴已经大范围的开始使用。

商汤科技深度学习并行训练集群系统

通过深度学习技术,商汤就用这套算法训练ImageNet的项目。它是一个神经网络,目前,AlphaGo是40层的结构,去年微软将神经网络做到了152层,而目前用商汤科技的算法训练出来的神经网络是1207层。训练这么复杂的一个网络需要一个很强大的平台,谷歌和Facebook的开源系统并不支持这个大平台的运算,而商汤科技自己构建了一个超算平台。目前这个超算平台在香港有一个超算集群,在北京有三个,只有在这样的大集群上才能真正的训练出核心的大脑和核心的网络。这一主要用于人工智能的超算平台,是NVIDIA和商汤科技合作的结果。

有了模型,有了平台,还需要海量的数据。目前商汤科技与300多家企业进行了合作,有18类、十几亿的各种图像和多媒体的数据。合作过程中,商汤科技也在建立一些大型的学术方面的数据库,定义了很多新的研究方向和新的课题,包括人脸数据库、车型数据库等等。

正是基于对算法、超算中心和大数据基础构建,让商汤科技的深度学习的核心算法得到了有力的保证,也使得商汤科技在计算机视觉领域在国内一骑绝尘。

虽然还有很多人不知道商汤科技这家企业,但要说起小米手机的“宝宝相册”、“一人一相册”功能和云端存储照片自动分类功能;华为Mate 8“智能云图”功能;曾经刷爆网络的移动应用 Faceu;OPPO手机中,使用普通单个摄像头,人像照片依旧可以得到单反式的大光圈效果功能;一直播、小咖秀、秒拍都相继上线的增强现实技术等等,都是商汤科技提供的核心技术让这些产品和应用得到了超一流的用户体验。

商汤科技已经拥有300多家不同领域的客户及合作伙伴

从这个意义上讲,商汤科技的人工智能离我们很近,也是能“看见”的人工智能。

在5月26日的“看见Ÿ人工智能”大会上,商汤科技宣布与国内领先的云服务商金山云达成合作。商汤科技的SenseAR增强现实感特效引擎,将会在金山云即将推出的视频生态新平台中实现集成,满足客户更加多样性的需求。

实际上,这仅是商汤科技智能应用场景落地的一个技术方向,在当天的会议上,面向智能视频、智慧商业、手机及移动互联网等行业商汤科技发布了一系列人工智能产品和解决方案,包括SenseVideo视频结构化系统、SenseFace人脸布控系统、SensePhoto全面的手机影像处理解决方案、SenseAR增强现实感特效引擎,以及SensePose单目摄像头人体动作估计解决方案等。

商汤科技在5月26日商汤“智”造大会现场,展示的诸多面向智能视频、智慧商业、网络安全、手机及娱乐互联网等行业的完整人工智能产品和解决方案系列,吸引了每一位与会者的关注

难怪商汤科技联合创始人、CEO徐立博士近期表示,“商汤科技的计算机视觉能力在很多垂直领域已经大大超越了人类,而我们的目标就是将这些‘超越’注入到各个行业中,打造‘商汤驱动’,联合海内外的合作伙伴,开拓创新,共同探索人工智能应用的新蓝海。”

商汤科技,确实让我们“看见”了“人工智能”,也看见了在人工智能的“国家队”里,有一支可以和谷歌、微软、Facebook同台竞技的产学研队伍。

浏览数: 次 星期日, 05月 28th, 2017 未分类

还没有评论。

发表评论