商汤科技作为为人工智能技术的重要一员,商汤科技徐立丝毫不敢懈怠。专注于计算机视觉和深度学习原创技术,成为国内最大的新锐人工智能公司,他表示我们进入了软件的摩尔定律时代,软件性能通过人工智能快速增长,用人工智能改造传统行业挖掘蓝海市场。
今日人工智能时代完全变了,第四次工业革命尚未真正开始,很多人已开讲。“全球进入了一种未卜先知时代,这与抗日剧中喊八年抗战马上要开始一样。”徐立说。
作为人工智能公司商汤科技联合创始人兼CEO,徐立感受着创业的苦与乐,以及时代的喧嚣和嘈杂。一方面,商汤科技专注于计算机视觉和深度学习原创技术,飞速发展,自主建立了原创深度学习平台Parrots和深度学习超算中心,成为国内最大的新锐人工智能公司,估值超过20亿美金。
另一方面,各路人马齐齐杀到这一领域。国内外巨头公司无不分出人马研发人工智能,竞争日趋激烈。从2015年开始,只要一个论坛主题词中出现人工智能几个字,场场爆满。
在这样环境中,近三年人脸识别、自然语言处理和机器深度学习等等人工智能型公司纷纷创立。商汤科技是其中一员。2014年创立,经过三年发展,商汤科技将人脸识别、图像识别、自动驾驶、人机交互、医疗图像、人工智能芯片等多项人工智能核心技术实现应用落地。
2017年7月,商汤科技宣布完成4.1亿美元B轮融资,创下当时全球人工智能企业单笔融资纪录,同时也成为全球估值最高的人工智能独角兽企业。
但是,商汤科技徐立丝毫不敢懈怠。新一轮融资后,他希望在包括无人驾驶、智慧医疗、深度学习芯片、增强现实平台等方面加大研发投入以及人才引入,开拓更多技术应用场景,深化人工智能商业生态,以原创技术赋能更多行业。
视频分析大风口
移动互联网时代,每个人手机都会拍照很多照片,录制短视频。商汤科技联合创始人之一杨帆注意到一个现象,这些照片和视频二次价值转化很小,其最重要的价值体现在拍完、分享那一刻,之后大多数人很少再次翻阅、利用这些照片。但是,它们占据了大量的手机存储空间。“这是很矛盾的。” 杨帆说。
基于这种洞察,商汤科技为手机厂商提供了一个智能相册解决方案,即利用人脸识别聚类技术,按照不同人像进行归类,实现“一人一相册”,轻松解决手机中成百数千张照片分类管理的难题。该方案还能找到手机中照片最多的那个小孩,从大概率来说,“那是用户自己的小孩,系统会将该照片推荐给手机用户做屏保”,其余照片或者可以存储到云端,或者利用其它技术处理,实现照片的二次价值转化。
这是一个并不复杂的实际应用案例。再往下发展,随着AI技术进步,杨帆相信可以从照片和视频中挖掘更价值。
商汤科技研发的智能相册、美颜和滤镜功能,有些已应用到华为和小米手机上。借助此类方式,商汤科技的技术已经悄无声息影响到很多人。
11月2日,最新发布的OPPO旗舰手机R11s上,应用了商汤科技提供的AI智慧美颜技术和 “面部识别”人脸解锁功能。
通俗来讲,这类应用后面的实现方式与人脸定位、AI特效增强相关,算法的选择尤其关键。
技术落地经历了一个有意思过程。杨帆最早预设各类场景,抽象出106点来。最初从5个点,2个眼睛、1个鼻子、2个嘴角,接着衍生出21个定位点。接下来是38个点,最后是106个点位。
理论上来说,点位越多越准确。操作时要兼顾人工标注数据成本,一张106点的标注图,成本要5-10元。从标注十万张照片起步,5个点位全部标出来,训练出一个5点模型,再进化,将21点算法等融合到标注工具,然后就可做到更快、更低成本标注。
最后,商汤倡导的106点标注得到非常广泛的应用,积累到百万级别数据时,可以通过类似方法去以较低成本标注240个点。
类似技术成熟后,为商汤打开了进入短视频和直播业务通路。商汤正在进入一个技术进步带来数据积累,进而做到产业化落地的正向循环。
商汤想解决计算机识物之后,真正把视频理解发挥到一个真实应用场景当中。现在,视频分析能力可以认出人的身份,周围的桌子、凳子和沙发,还有颜色。再进一步发展下去还有很大可能性。
比如,搜索引擎公司现在只是基于文本,如果对于整个视频理解能做到文本搜索水平,未来可以成为视频搜索引擎。当然这只是商业上想象的一部分。
按照徐立和团队设想,人工智能对当前互联网主要的商业领域电商、搜索和游戏都将产生影响,另外,还外对安防、智能驾驶等等领域赋能,未来前景广阔。
商业模式摸索前进
作为算法领先的公司,商汤科技在商业模式上经历过一段摸索阶段。
商汤科技属于第一批研究视觉方面的人工智能团队。2011年,人工指导智能变成数据驱动智能刚开始的时候,商汤已经投入此方向。2011到2013年间,在CVPR、ICCV和ECCV三大全球顶级计算机视觉学术会议上,有关深度学习的文章共29篇,其中14篇是来自于商汤团队。团队里包括18名教授和150多名博士,创立早期三人中必有一个博士。软件领域快速发展,最尖端人才具有决胜性作用。
在技术平缓发展的时候,竞争比拼的是资本和财力。在技术快速进步领域,创业型公司有机会通过技术迭代形成竞争壁垒。徐立称,“我们进入了软件的摩尔定律时代,软件性能通过人工智能快速增长,你只要领先带来的时间窗口可能是一年,甚至更长,领先18个月就超出一代,是整体一倍性能。”
2015和2016年世界上最顶级视觉会议上,就论文统计数量排名而言,微软、卡耐基梅隆大学等排在前面,商汤排在所有亚洲公司前面,领先于谷歌很多名次。
这或许是市场中,商汤科技能找到生存之地的秘诀。但是,论文落地变成商业上的案例,首先要考虑到有效需求,而且有人愿意给需求付费。
商汤科技杨帆举过一个极端的例子——
厕所里刷脸取厕纸,可以通过设置规定,每次一人不能取太多,防止有人把厕所纸拿走,这是一个真实需求。但是,如果要落地,前提是管理方想明白,通过人工智能设备可以省出足够多纸钱来。
照着真实需求去查看,首先关注到安防领域。安防是目前整个AI落地最快,也是短期规模最大、最重要的一个市场。目前已经有摄像头监测很多城市,每天产生海量视频,从这里面挑出需求的视频片段来,费时费力。
商汤在成都给当地提供反扒系统。他们发现,把一个场景做好,真正解决问题,需要把多项技术整合在一起。比如,民警有小偷照片库,但是,抓小偷要低成本取证,难度很大。“你不能说这个人当了一次小偷,他一辈子都是小偷,我只要街上看见他,就把他抓起来。”
商汤的方案是通过技术从海量视频里识别出小偷,同时辅助以动作检测。在一些特定场景,比如人群移动缓慢的地方,技术会预判出这里发生偷窃的可能性更高。这时可以布置一个大的远景摄像头,覆盖几百米范围,还有可移动摄像头,对焦点区域进行覆盖。
类似的案例,需要很多不同的细小技术应用和组合。如果移植到金融领域做刷脸支付,应用到交通领域查处违章等等,不难看出,人脸识别技术在细分行业中的潜力非常大。
有时工作多得商汤团队忙不过来。“首先拿需求,定制化产品做完了之后去卖,销售人员坚持一个售卖原则,卖标准化的东西。你要就签,不要就走。”徐立9月底与包括腾讯《深网》在内媒体交流时透露。
整个行业的商业模式建立有些点困扰着徐立,“技术大众化,我们一直讲智能手机是人工智能+手机,人工智能+手机还不如一个手机价钱,人工智能的钱找谁收呢?人工智能加了人脸解锁,加了50元,这个钱向谁收?这是行业困惑。”徐立期待着大众给技术买单的那一天。
技术不能向普通消费者收钱,走to B路线成为另一个选择。在安防领域,商汤所作所为,一直为大华股份研发中心中央研究院院长殷俊所关注。殷俊告诉腾讯《深网》,商汤是大华的合作伙伴,双方一直保持着接触。
但是,作为算法领先的公司,商汤需要不断地升级算法,而算法本身精进会不会有天花板?对此见仁见智。
现有安防领域客户按硬件购买和后期维护付费,商汤要深入这一产业,卖硬件和服务,必须增加人员,与大华、海康等传统安防公司比拼全方位的资本、服务,以及生产乃至供应链管理。
有些软件算法驱动型公司,进入安防领域,先期通过OEM代工摄像头方法弥补短板,这一模式在摸索当中。
另外,大华股份已经雇用了100多人进行数据标注,自主研究人工智能、深度学习等技术进行追赶。就上游数据而言,传统公司有着遍布全国的摄像头和网络,获取原始数据更便捷,成本更低。
一名要求匿名的英伟达人工智能芯片销售人员则向腾讯《深网》表示,安防领域新型算法创业型颠覆传统的安防公司可能性极小,经过2015火热竞争之后,他不认为新型公司有机会颠覆大华和海康,且胜负已分,本人已经将工作重点转向智能驾驶研发。
实际上,商汤创立前一段时间都是不停拿需求,然后做产品,发现满足不了市场需求,再迭代。“到2015年9月份,真正在金融场景大规模试点,跟一些银行、P2P公司签下千万级别的合同。”徐立说。接下来,商汤仍然将继续拓展安防领域业务。
技术底层扎根做平台
12月7日,商汤科技宣布与日本本田汽车签订长期合作协议,共同深耕自动驾驶技术,双方将基于本田的车辆控制技术系统,融合商汤科技的视觉算法和开发平台,共同打造适合乘用车场景的L4级自动驾驶方案。此外,本田未来还将与商汤科技在机器人方面展开合作。
运用商汤科技技术,汽车行驶视觉技术而非高精地图,能够覆盖更广场景的区域。即便车辆行驶至无高精度地图覆盖的区域,车辆自动驾驶功能依然可以使用。
以上是商汤涉及的诸多业务领域之一。经过不断拓展,商汤科技目前有400多家国内外合作伙伴,“做商业化以来,每个工作日签约一个商业客户。”徐立表示。
商汤科技发现国内很多领域有待提升。人力成本过高,中国人口红利下降,未来机器代替人工是一个必然趋势。而且,国内生产效率低下,工业自动化程度与发达国家比起来,效率低很多。最终,利润空间缩小。很多领域已经是红海一片,如果用人工智能去改造传统行业,就出现一个新契机,进入蓝海。
徐立喜欢将商汤科技比作卖人工智能的乐高玩具,“针对特定场景,我们搭建一个乐高的车,卖给行业甲方,甲方根据这个车,直接用,或者改造一下都可以。某种意义上,商汤卖底层人工智能模块,赋能一些行业。”
目前,像高通、英伟达、本田这样的跨国大公司,京东、华为、小米、OPPO、vivo等处于潮流中的国内明星公司,都买了商汤“搭建的车”。
“我们做的事情,就是搭底层平台。通常最底层平台,很多人不愿意花大力气做,比如中国计算机干了这么多年,一直没有自己操作系统。”徐立说。
鉴于当前商业环境,商汤确立了1+1+X发展模型。先是技术上形成产业核心竞争力,+1是跟产业结合, +X是赋能。最终实现+合作伙伴,形成共生共赢生态。
2017年,商汤花大力气招了350个人左右的数据标注团队,慢慢减少对外包数据标注依赖。“一数据标注是一门技术;二,一些数据有安全性要求,脱敏的数据做训练使用,安全更可控。”徐立说。
数据关系到竞争速度,速度关系着创业型公司生死。就深度学习而言,数据很重要。数据量每增加一个数量级,结束是几何级增长。十亿照片,增长到100个亿,不管对小公司,还是大公司,都是一个比较难迈过门槛。
徐立希望商汤利用技术领先时间窗口,将护城河挖得更宽更深。这也意味着商汤的前途既可能是星辰大海,也难免各种险滩暗礁。
评论
查看更多