企业互联网+
生意场 > 高端访谈 > 商汤融资6亿美金后,比拿钱更难的是AI全行业的技术落地

商汤融资6亿美金后,比拿钱更难的是AI全行业的技术落地

生意场 2018-04-17 09:27:34 来源:36氪

2018年4月初,商汤科技宣布拿到新一轮6亿美金融资。上一轮融资发生在9个月前,4.1亿美金的B轮融资破了当时的记录。

从此商汤的股东名单里就多了阿里、苏宁和外资基金新加坡主权基金淡马锡。

其实早在去年底就有传言说,阿里有投资意向。很多人觉得,这意味着AI独角兽要开始在BAT身后站队了。

但商汤科技联合创始人、CEO徐立并不认同这种观点。“我们其实是去年下半年因为智慧城市项目跟阿里云有业务接触,接受投资是考虑到战略上比较匹配。我们都是战略合作,本身是业务场景的深度结合。所谓站队是你以帮助某一家巨头做事为使命,但AI是多元化的,会服务于很多行业。”

拿谁的钱?怎么花钱?商汤选择投资方的逻辑是业务牵引,为下一步的战略铺路。

譬如把阿里和苏宁纳入股东名单,背后暗含的目的是要花更大力气做新零售。新零售加上智慧城市、手机和终端、车载、移动互联网,这四块是商汤现在的核心应用场景。徐立透露,去年跟苏宁合作的Biu体育用品无人店今年计划要开200家。

又譬如先前之所以接受高通的战略投资,徐立的解释是“我们在人脸、3D等各个层面都能展开合作,高通需要领先AI算法带动高端计算芯片的更新迭代,我们需要通过芯片层面优化把我们更有效推入各个场景方向。”这场合作意味着不再需要和不同客户进行各自定制化优化,然后再集成SDK。商汤的产品形态逐渐向着整体的行业通用方案靠拢,进一步加强平台化布局,这意味着商汤要赚更多的钱。

做AI是门极其花钱的生意。到了这个阶段,AI公司必然要拼现金流。

如果说去年的重点是拿钱,今年所有AI公司的重点都是怎么花钱,做好技术落地,和做出有壁垒的产品。

商汤想把钱花在两件事上:水平做产品,垂直做打通。水平指的是做产品矩阵,垂直指的是利用资本在垂直产业链里做整合,把产品从早期的技术、API、SDK转型成行业解决方案。

尽管还没有蔓延到C端,但AI对B端的改造已经在潜移默化中发生。数据成了新的语言,用来描述人和万物。

世界会变成一张由大数据编制的网格,拼凑出群像和每个人的画像。在机器的作用下,人类对自己和周围世界的认知可能会达到前所未有的清晰。

叠加了智能的消费会如何发生?徐立举了个例子:无人零售,以后商家可以按需采购,用户可以扫码买东西。现在你进超市需要带银行卡或者手机,未来你可以什么都不带,输入身份证,刷个脸就过去了。

 

 

商汤科技智慧零售业务在商超的样机,通过摄像头识别用户,并将用户数据和商超会员体系打通,推送广告。

一个在数据和算法主导下高效率运转的社会,未来可期。 

拿到新一轮融资后,商汤科技CEO徐立接受了36氪的独家专访,聊了聊商汤科技的下一步战略、计算机视觉服务商今年的行业竞争,以及这个日渐数据化的物理世界日后将要如何运转。访谈内容如下,经36氪编辑略有删节:

一、6亿美金花在两件事:水平做产品,垂直做打通

36氪:去年有传阿里有意向投资商汤,你们是什么时候开始谈?

徐立:其实是先从业务开始谈,去年下半年就有接触,在智慧城市和跟阿里云的合作上技术团队都有对接,接受投资是考虑到战略上比较匹配,阿里接下来做城市大脑,其中视觉理解部分我们有很多可以参与协作。

36氪:去年几家计算机视觉独角兽都拿到了大额融资,今年资本市场的态度是否会有变化?

徐立:这个行业到了这个阶段肯定是看现金流的能力,未来还是会向头部公司集中,只有头部几家能赚到钱。很多行业都是这样,第一家利润很高,第二家(利润)少很多,第三家基本上比较难赚钱。

36氪:现在已经到这个阶段了?

徐立:在垂直行业上基本上是。

36氪:这次融来的钱打算怎么花?

徐立:有个比喻说现在投入未来收获就好比是“存钱模式”,我们要做的就是看怎么存钱,怎么能更好建立壁垒,而且未来怎么稳定地收取比银行更高的“利息”。我要把钱花(存)在两件事上:“水平做产品,垂直做打通。”

水平来说,单一的产品很难覆盖整个市场,我们要打造产品矩阵,比如同样一个人脸闸机我可以做成各种形态的,适合于楼宇的、机场的、酒店的完全不一样。垂直指的是在垂直产业链条里做深入整合,这也是可以借助资本进行打通的地方。除此之外,就是把底层的基础设施做好。这是最大的核心竞争力,它决定了一些算法的研究和演进别人需要做几天或者几周的事情,在我们这里半小时能干完。

36氪:商汤一直通过投资推动在垂直市场的落地,迄今为止都投了什么?

徐立:投了有六七个了,都是行业应用,具有产业价值或者可以跟我们形成垂直整合的公司。有些是我们的客户,通过股份投入可以更好地协同,他们基本都是些产品公司,在我们的产品基础上再做产品,比如AR、VR端应用我们投资了51VR,安防领域我们投了特斯联。

36氪:在今年这个时间节点,按照公司的发展节奏,哪些目标是你们必须完成的?

徐立:有些行业,要做模式的转型。商汤科技最早是卖算法的,后来变成卖SDK,因为算法当时不够成熟,但是SDK可以规模化。卖SDK以后又发现一个问题,日本这类地区可以接受用Licence的模式售卖软件,但是卖软件的销售模式不太符合中国企业的消费习惯,他们觉得花几千万买个光盘太贵了,可能采购6000万元希望打折到5000万,第二年感觉技术服务商什么事都没干希望再打折,相比之下中国客户更容易认可买回来一屋子机器。

所以我们今年转型就是要把未来可能会被压缩的利润,在早期形成壁垒的时候转化成上下游更深层次的技术。我们会在下游做一些投资并购,形成更强的势能,而不是说只是提供某一块服务。

36氪:举个例子,转型后的产品会有什么差别?

徐立:比如安防只卖SDK是一种模式,我也可以绑定集成商,把整个解决方案拿下来,通过下游的合作伙伴去卖整体行业解决方案赚钱。这样客户更能接受,我们往价值链的那一头去延伸,选择好的合作伙伴,就能形成生态势能。在早期做生态布局会获得很大价值,这是我们商业化以来做的最对的事情。

二、为什么一定要从底层技术做起?

36氪:你之前说,商汤是少有的具备原创性AI技术的公司,且从长期竞争来看,数据和算法也是遵循摩尔定律的。怎么理解这话?

徐立:我读书的时候写简历,写着精通操作系统,面试官问怎么个精通法?我说每项指令我都会用,用得很熟。他就狂笑,说那叫精通使用操作系统。

从PC(Linux)到手机 (Android)再到AI,操作系统的开源一直是由Google、微软这些公司在支配,他们在培养自己的生态和能力。你用他们试错过和训练好的系统做事情,的确不需要投入很多硬件、底层架构上的资源。但反过来如果他们的方向并不代表行业最领先算法趋势,或者和你要走的方向不吻合,那你就走不通。如果大家都用一套系统,所以大家就说数据最重要。

但企业最核心的竞争力靠的就是“大脑”(操作系统)比别人聪明,所以商汤在这块投入资源,不停地打造训练平台,这是个建立壁垒的过程,先从红海到蓝海,再从蓝海到壁垒。要做原创的事情只有一种可能性,就是你的创新速度持续领先。如果等着别人来做,时间窗口就错过了。

36氪:自己做底层技术,反映到产品体验层面,优势是怎么体现的?

徐立:拿手机拍照举例,目前双摄算法中,传统的算法对摄像头配准(对齐)的要求特别高,所以很多厂商会为两个摄像头再造一个模组支架,多这样一个支架的成本是几美金。如果所有底层基础都自己打造,就可以从开始就完成端到端的训练,对应产品上就可以支持无支架的摄像头。就好比人眼,其实双眼位置并没有那么苛刻。产品成本降低,体验提升,竞争力就出来了。

36氪:商汤在超算中心上累计投入了多少钱?

徐立:目前超算中心已有8000多块GPU, 每年投入数亿元。

36氪:为什么在超算中心上花这么多钱是有必要的?

徐立:如果使用别人的大脑,比如Google的开源工具TensorFlow,在自有数据上训练,确实不需要投入很多资源。但如果要自己设计训练平台和“大脑”,就需要大量尝试和使用更大规模场景数据进行验证。所以才需要这么多资源去投入,去获取特别多的计算能力。在别人看来我们的前期投入很大,但正因为有这么大的投入,才能够做成平台,站在别人的前面。 

三、四块主营AI垂直落地场景,每个行业场景快速规模化

36氪:从竞争层面看,今年在场景落地上你有紧迫感吗?

徐立:紧迫感一直有,但我们现在最大的好处就是每个阶段的focus都还蛮准的,从数字上倒是一直没有太大担忧。连续三年的收入增长400%,去年开始财务上实现盈利,有较大幅度的增长,2018年Q1也接近300%的环比增长。我们的四块核心领域,智慧城市、移动应用、手机终端和车载业务增长到比较快,每一块收入都快速过亿了,今年的增长速度更快。

36氪:哪个领域的落地挑战性比较大?

徐立:四条主线落地都还可以,车载时间会长一些。做无人车的企业光从算法端是没法做的,落地没法一上来就规模化,可以先做项目集成,再形成各种产品。车内、车外、车前、车后,有一个大的产品矩阵,既然进去了我就要拼销售,这才是我们今年投入钱的地方。商汤进入一个垂直行业先是一针进去,然后再水平铺开,打造产品矩阵。

36氪:今年有哪些新的AI落地场景,是你很感兴趣的?

徐立:我一直对视频比较看好,因为视频的识别、理解可能会在这两年过工业应用的红线。以前不是没有场景,是技术不“过线”。之前很多概念包括“所见即所搜”,或者“看到-知道-购买”都依赖于视频技术过实用红线 。另外,AR、VR类产品的算法会被AI加强。以前都是手动设置的一些算法,现在对各个场景的理解都可以用大数据驱动,会有完全不一样的效果。我们和OPPO也建立了开放的AR平台。这可能会驱动未来的游戏和交互市场,很可能未来一两年就会出现特别火的AR游戏。

36氪:去年8月跟苏宁在南京合作的苏宁体育Biu无人店运营了半年多了,情况怎么样?

徐立:还不错,包括这家店在内的六家Biu店铺卖家转化率超过了70%,这类店今年计划开200家店。前面几家店客流量还不错,效率很高,运营过程中人员的介入程度是比较低的。我们选择先做卖服装的店,因为服装本身是有(RFID)标签的,不需要任何额外成本对商品进行电子化和数据化,商品挂上去之后剩下的事情全都变成了自动化流水线。如果要拓展到其他产品,有一个问题就是物品的标签化可能很难,这点对于服装很容易。

36氪:智慧城市是个听上去很遥远的概念,其中哪些场景会最先落地?

徐立:我理解智慧城市的定义,就是怎么样更好的利用大数据去做城市管理。这其中包括出行、金融、医疗、消费等等各个纬度的公共数据。摄像头数据、信号数据、数据背后的关联性和各种声音视频数据的混合数据。把数据识别、处理,连接整个数据应用链条,去做交通管控甚至城市规划,这里面会有很大的商业空间。 

36氪:哪些城市做智慧城市落地会比较快,杭州、深圳还是雄安?

徐立:我了解到杭州和浙江的一些城市已经在做,雄安就像当年的深圳,是一张白纸,所以会有比较好的规划,能少走些弯路。它可以直接按照智慧城市的模式建造,比如路灯可以带有各种传感器、wifi、定位装置,可以按照5G的模版去打造,高速可以是超级高速,无人驾驶的路线也可以规划。但最考验的是执行力和决策的时间点,所有新技术的结合都要去摸索,没有任何经验,这需要时间。深圳这方面建设比较快,但是深圳也是花了十几年才变成现在的样子。

36氪:群像数据和个人数据,目前割裂地分散在各个商家,生成Profile的难点在于什么?

徐立:难点在于一方面因为有各种各样的场景,另一方面是数据标准不统一。这需要参与方共同努力。

另外视觉信号我认为有三个层次:第一是手机、Pad这类手持移动设备,移动摄像头,未来不论人脸、物体都会变成合适代码,在不同设备端进行传输,传出去的信号就是加密的代码。第二是地面端的固定摄像头,比如安防摄像头,智慧楼宇的摄像头、智慧机场的摄像头,这些设备未来一定是互联互通的。第三就是天上的卫星摄像头,它的数据是全局的、全球化的。未来从个人到终端到高端的数据,会联动,形成一个智慧城市的视觉数据的索引,形成更好的智能,用来做很多事情。 

四、如何在物理世界数据化的过程中赚钱?

36氪:AI是怎样在物理世界数据化中发挥作用的?

徐立:我认为AI的作用第一是规模化预测,第二是差异化服务。有了更多数据就可以更好地对未来进行预测,这是一个群像的概念,就比如智慧城市中我通过数据预测某个路口未来24小时内的人流量、往什么方向走,通过这个来做交通规划。差异化的服务是关于个人数据的应用。把群像数据回归到个人身上,我知道你前面的道路是拥堵的,根据你个人的喜好和前面可能去的地方,我可以给你推荐先去什么地方玩,再去什么地方。把当地的情况和个人情况结合起来,一大一小两个维度的数据一起推进。大数据是群像数据和个人数据的融合。

36氪:商汤在大数据商业化的产业链里扮演的角色是什么? 

徐立:我们提供标准化的技术平台,相当于提供生产工具和基础设施,让大家都使用同一种语言,每个人有自己的应用。在平台上的商户可以把人、车、物这些东西全部结构化地定义和描述,比如你是谁,另外描述属性,比如你的头发是黑颜色,你是哪里人,你穿什么样的衣服,背什么样的包。这两个纬度的信息提供到各个平台上,会诞生出各种各样的应用。

36氪:所以你们现在的重点就是把自己的“语言”尽可能往外推广,让更多人用,这样就有了竞争门槛?

徐立:就是看你的标准是不是兼容并蓄的,能服务好场景。你要推的东西如果能让所有的东西都能兼容,那你的标准一定最宽泛,用途最广,就看你怎么定义这个事情。

36氪:让更多方的数据融合、交换起来才能补出更全的画像,有更大的商业机制,但这个牵头的角色会是谁来做?

徐立:这件事很难,BAT也不一定能完全打通,因为B端企业不一定愿意把自己的信息给别人。这需要一个公共数据分享平台,政府可能会起到一个很重要的作用,因为政府的数据量最大,它可以把数据脱敏,让大家来贡献数据并从它的平台上获取数据,打造更多应用。不是有一方牵头就能做成这件事,必须是大家都是自发的,有匹配的交换需求,而不是被强迫的。数据的分享没有那么简单,不过在此之前至少要先建立一个沟通渠道,有共同的“语言”,这就是我们在做的事。

36氪:群像数据和个人数据,哪个现在看来商业化进展更快?

徐立:肯定是群像数据,因为它不牵涉个人信息,能带来更高的管理效率。个人数据,很多时候太敏感是很难商业化的。你当然可以说你能做很多变现,比如我知道你家门在哪里,又发现你家门坏了,上门给你推销门,那你就会非常惊讶说为什么我家门一坏了你就来卖门了,你是不是天天在监视我家。这种根本形不成商业闭环。所以真正意义上的个人Profile(用户画像)一定是去身份性的,只涉及属性,比如你更像是东北人,所以我可以给你推荐饺子。但不会精确到你的身份是谁。

1
+1
1
+1
文章关键字: 商汤 融资
版权与免责声明
1、凡本网注明"来源:生意场"的所有作品,版权均属于生意场所有,任何媒体、网站或个人在转载使用时请注明"来源:生意场"。
2、凡本网注明"来源:XXX(非本网站)"的作品,均转载自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、本网刊载之所有信息,仅供投资者参考,并不构成投资建议,投资者据此操作,风险自担。
4、如本网刊载之信息涉及版权等问题,敬请通知我们,我们将在第一时间予以更改或删除。

关注生意场微信公众号