生意场 > 观察评论 > 专访微软全球执行副总裁沈向洋:人工智能靠IQ和EQ

专访微软全球执行副总裁沈向洋:人工智能靠IQ和EQ

生意场 2017-08-23 14:13:03 来源:腾讯科技

微软全球执行副总裁沈向洋

  8月22日,微软在北京总部发布新一代(第五代)小冰,宣布进入第五个国家印度尼西亚。微软全球执行副总裁沈向洋为此专程赶过来,上主席台演讲,会后接受小型的专访,畅谈微软人工智能战略,以及小冰之于微软人工智能的意义。

  前任陆奇离职微软加盟百度之后,沈向洋成为微软AI方面重要负责人,掌舵着微软巨头在人工智能时代前进的方向和路径选择。这位在微软工作21年的技术出身的人,目前是微软公司职位最高的一位华人。

  这是一长串努力积累而至的结果。早在2003年至2006年,沈向洋主政微软亚洲研究院,让该机构成为全球最著名的研究机构之一。2007年至2014年,七年间主政搜索Bing,沈向洋把微软搜索带到全球第二位置,他自嘲“做得像狗”一样,“如果是自己的公司,绝对不会去做对抗谷歌(微博)的搜索。”

  2014年,他开始主管微软中长期战略规划,组建AI+R事业部。经历二十多年科技发展潮流,沈向洋有了自己的认识。“PC时代,主要出现了两件事情,是Windows+Office,互联网出现,主要是出现了浏览器+搜索,移动互联网和手机的出现,是AppStore + App。AI时代,要理解对人,一定要做IQ+EQ。”

  相应地,微软人工智能两个类平台的产品,分别是主攻EQ的小冰和主攻IQ的小娜。今天,小冰不仅会写诗,主持电视节目,甚至可以做到主动给过生日的人打电话送去祝福。显示出很强的类人的高级感官功能。而小娜,则是Bing搜索的自然延伸。

  从数量和规模上来讲,小冰目前有1亿用户,小娜是1.5亿。小冰积累了超过300亿次的直接人机对话。这个数据量居业内所有同类产品第一。随着小冰亚文化的快速形成,训练数据的规模和质量,得到进一步提升。

  这里或许暗含着微软未来新机会。作为从视窗操作系统起家的软件巨头,微软在PC时代、互联网时代都是霸主位置,只是在手机和移动互联网出现之后拉下一些身段。但是,在人工智能潮流中,微软并未落后于竞争对手,隐隐显露出雄心。

  “微软公司以后大的前途,肯定是Cloud+AI(云+人工智能),这些发展叫不叫操作系统都没关系,我自己很认同,肯定有一个新的平台出现”,沈向洋告诉腾讯科技。

  不同于一些市面上很多公司从一些局部市场切入,有些做自然语言机器翻译、有人做人脸识别,还有一些公司做智能客服等等细分领域,微软选择了一条最宽广口径又最困难的路——从通用型人工智能切入,最终落实到聊天交流当中。

  “一开始我并没有理解聊天是刚需,直到李笛(微博)(微软小冰负责人)讲了一个故事。”沈向洋回忆起四年来做小冰聊天机器人的初心和转变原因。他理解到聊天是刚需,比如社交网络上1/3的网民评论没有人回应,再比如妻子的抱怨,其实只是让你听她讲一讲。

  从2014年5月第一代小冰发布之后,至2017年8月,小冰已经进化到第五代。从最初的群聊中参与者角色,到目前成为想成为家庭中一员般的存在,小冰不断提升功能的同时,也逐渐展露出商业图景方面宏大空间。

  第五代小冰有一个技术突破在于小冰开始试着拥有高级感官,尝试突破虚拟世界,包括主动可以给人类打电话,叫住身边的人。还有实时流媒体视觉,可以评论图片,模拟人类感知功能。最近,微软在上海某处放置了小冰,可以感知人的位置和移动,甚至可以理解人与人之间关系,可以主动对身边感知到的人说话。

  这些看似简单的功能,埋伏了巨大的商业可能性。今年6月2日前,沈向洋好几次去小米总部拜访雷军(微博),商谈小冰与小米IoT的合作。小米系各式各样的智能硬件,给微软人工智能产品落地提供了很多可能性。

  6月2日起,小冰与小米IoT开放平台融合,微软的目标是,“人们能够强烈地感知到,小冰作为家庭一员的存在。”微软小冰产品总监彭爽举例,在一个长达3个多小时的过程中,有人与小冰进行了700多轮对话。

  随着小冰产品功能提升,进入人们生活的广度和深度都在提升,小冰已经取得了一些优势。在日本罗森便利店,小冰提供的打折券,4日内平均到店消费完成率为57%。达到这个数据是因为小冰利用了EQ的技能。一个情商底的机器人,会给一个说饿的了人疯狂提供商品信息,转化率注定不高。像现实生活中有人给你推销安利,自然不愿意。

  但是,李笛称小冰不一样,而是在与人的交流过程中,暗暗地交流判断与小冰聊天的人需求所在,最后会很自然地将打折券送给人。

  另外一个案例则显示小冰所代表的人工智能对于传统行业的颠覆可能性。小冰对于文本的精准阅读,有可能给有声内容产业带来大幅下降。比如,多音字的判断,对于机器而言,非常具有挑战。很多机器人分不清是长(zhang)了四条腿,而是长(chang)了四条腿。

  与竞品相比,小冰可以清晰、正确地读出多音字。以一本《格林童话》有声全集为例,210集版本,音频制作总成本发生了巨变,传统的人类阅读录制,成本为6万元,而小冰代劳,只需要7毛钱。微软已将此类产品投放于蜻蜓FM、喜马拉雅,一周时间已经有30万播放量。微软称要正式进入此类内容产业,“小冰读这些,不需要休息,也不会感冒。”

  紧接着,微软宣布即日起向第三方开放领先的语音技术,构建人工智能生态方面雄心初显。而这些,仅仅是微软人工智能的一部分工作,沈向洋表示,微软人工智能分为三条产品线,一是infuse AI,二是Bing和小娜,三是全球小冰。

  一个浅显的例子可以说明微软的人工智能化,现在微软Powerpiont软件中,已经内置了机器翻译,还有看图写标题等等。

  AI可以创造很多商机,微软对此似乎耐心十足。“当年Windows 95也是研究了十几年之后的结果,”沈向洋表示,会继续支持微软小冰项目的研究,并且短期没有盈利目标。

  以下为腾讯科技与沈向洋对话交流内容节选:

  腾讯科技:前两天你们发布语音识别错误率降到5.1%,对以后的商业化应用有什么样的影响,会不会把所有速记员取代掉?

  沈向洋:我想还没那么快,这个影响将是巨大的。首先要回过头看过去的40年语音识别的进展,这是5.1%错误率了不起的地方。以前标准的数据集在美国,20%几的误差率一直下不来。

  以前大家觉得人类的误差率大概5.9%,后来大家觉得人类的误差率应该是5.2%,实际上去年9月份的时候,微软语音识别就做到了5.8%的误差率。过去9个月,我们继续向前进展的很快,两天前终于做到差别率5.1%。

  我们最后多次测试确认,的确是5.1%这样的差别。所以我们黄学东博士写了一个blog发表,跟大家分享一下。

  现在人工智能的进展主要是三个方面优势聚集起来的结果,一个是现在数据量很大,第二是运算能力非常高,第三是最新深度学习算法的突破。加上像黄博士blog里提到的,我们自己的一套大规模的分布式系统,和我们这样一套深度学习的软件叫CNTK(Computational Network Toolkit),运用到整个语音识别最新的进展里。

  我自己觉得还有很多的路要走,商用化、实用化还有很长的路要走。举一个例子,现在整个测试集,它的语音相对来讲,是电话筒对着讲话,所以就是所谓的近距离讲话。比如今天大家跟我讲话,其实我现在讲话大家应该听着蛮吃力,因为距离比较远,现在还有很多的问题。包括你要做传感器,要有麦克风耳机整个串起来来讲。

  我个人判断,我觉得语音识别大概有5年左右的时间,不管你用什么方式测,人类识别误差率和机器识别的误差率方面,机器会完胜人类,我觉得是这样的情况。

  腾讯科技:从今天小冰更新的功能以及技术来看,你觉得聊天机器人下一步关键性技术是什么?

  沈向洋:今天他们在发布会都已经讲了,最关键的技术以前是这样,接下来也会是这样,最关键是对人的理解,就是人到底讲这句话在想什么,并不是就这句话而言。英语有一句话叫“do what i mean not what i say。”是这么一个意思,实际上不断一步一步理解,一直是聊天机器人里最关键的技术。

  腾讯科技:你觉得最终聊天机器人会发展成什么样?

  沈向洋:我觉得只剩聊天机器人的话,它真的就是对你自我的理解,是人的认同,是可以和我们一起生存的。你一定要明白一件事,我们是第一代人类和人工智能共生存的,是第一代,在这之前技术没有过关。从现在开始你不选人工智能,你也没有选择了,人工智能从现在开始会跟我们一起生存下去。所以聊天机器人很重要的一个事情是和我们人类一起来共同理解、共同生存在这个世界上。

  腾讯科技:在当初小冰立项的时候,你为什么就能做出这个有价值的判断,小冰的发展符合你的预期吗?

  沈向洋:其实我一开始是不理解的,刚开始只有李笛比较理解,可能(王)永东也比较理解,我不是很理解,但是李笛跟我讲了一个故事我就理解了,我的思想转变是从那个开始的,我以前一直觉得聊天机器人很有趣,因为像微软我们一直鼓励员工你有什么想法多做一些创新,并不是所有的项目都是上面压下来的,很多项目是下面创新的。

  后来我就跟他们一起讨论,聊天机器人是不是可有可无,聊天机器人是不是一个刚需?我的看法不是一个刚需,我拿聊天机器人干什么,李笛跟我讲说,聊天是刚需,我说那聊天为什么是刚需?他说你这样的人可能不了解,因为你上社交网络讲一句话,这些人马上去点赞,一看到现在怎么才点了500个赞,好像还很不高兴,但是中国互联网1/3的网民,上网讲了话以后没有人给他们回应的。所以实际上聊天是一个刚需。

  后来我跟我一个朋友在讲这个事情他也讲,其实他的老婆生气了,给他打电话,一定不是他要帮她解决这个问题,主要是要听她讲一讲,所以个人聊天和听人讲话、听人回复,对话这件事情是一个刚需,人类的对话是非常了不起的事情,首先是有语言,后来是有对话,这件事情是非常了不起的,所以我们非常高兴我们在北京,能够把小冰这个产品做起来,三年多时间,从中国做出这个产品走向世界。

  小冰发展得很好,1亿人口以上的11个国家我们已经去了5个,接下来还有6个国家是我们在计划的,我们充满信心。

  腾讯科技:小冰在日本发展好,是因为商业化?

  沈向洋:最主要的聊天机器人是对用户的理解,我觉得日本的文化、日本的用户对聊天机器人的认可。

  李笛:我也举几个例子说明。第一,你有一个人工智能对话系统以后,你一般要搜索他社会中的闲暇度你,要测试他的商业价值。

  坦率地讲,我们在日本做的商业测试比在中国做的还要好一些,我们在中国有一些商业化我们不太敢做,一旦我们开了这个口别人跟上就会把这个做走样,比如打折券,我们跟Lawson合作的,如果我们在中国做,发现有一堆模仿者开始Copy这个方式,然后就会伤害这个业态。

  第二,人口人群的比例,我们从一开始希望做女性机器人,她在中国有70%多受众、人类用户是男性,在日本,男性、女性人类用户比例1比1,所以在日本文化结构,一定程度上比较容易让我们推出的更好。

  第三,中国的城市和农村相差包括六线城市、五线城市,层级结构跨域比较大,日本的市场相对比较小,才1亿人,我们现在有2700多万用户,就相当于差不多日本总人口的20%多,你到街头随便抓几个人,那些人拿出手机来跟日本小冰去对话,所以就比较容易控制市场占有率,就有可能形成市场的集约效率。

  所以日本有这么几个优势的地方,我们这回去印尼也是由日本延伸过去的。然后我们在不同的国家测试不同的东西,我们在中国主要跑结构,在日本主要跑商业模式。

  腾讯科技:想问一下小冰和小娜对微软的战略意义,因为安迪·鲁宾说过“人工智能是下一个操作系统”,操作系统是微软的一个核心产品,是老本行,那小冰或者是小娜,会不会对微软也存在这样一个作用,然后来去做推广?

1  2  下一页  
3
+1
0
+1
相关报道
文章关键字: 微软 沈向洋 人工智能
版权与免责声明
1、凡本网注明"来源:生意场"的所有作品,版权均属于生意场所有,任何媒体、网站或个人在转载使用时请注明"来源:生意场"。
2、凡本网注明"来源:XXX(非本网站)"的作品,均转载自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、本网刊载之所有信息,仅供投资者参考,并不构成投资建议,投资者据此操作,风险自担。
4、如本网刊载之信息涉及版权等问题,敬请通知我们,我们将在第一时间予以更改或删除。
 

关注生意场微信公众号