BAT ,中国互联网公司三巨头,在中国互联网发展的20多年的时代下,不断壮大,引领了中国信息产业,走到了世界的前列。
如今,人工智能正以前所未有的速度掀起新一轮科技的浪潮,继7月份国务院印发《新一代人工智能发展规划》,将人工智能发展上升为国家战略,11月15日,《新一代人工智能发展规划》暨重大科技项目在京启动,会上公布了首批共四家国家人工智能开放创新平台名单,有一家公司和BAT比肩齐名,名列其中,它就是科大讯飞。
国家人工智能开放创新平台
依托百度公司建设自动驾驶国家新一代人工智能开放创新平台,
依托阿里云公司建设城市大脑国家新一代人工智能开放创新平台,
依托腾讯公司建设医疗影像国家新一代人工智能开放创新平台,
依托科大讯飞公司建设智能语音国家新一代人工智能开放创新平台。
为了抓住历史机遇,抢占人工智能的制高点,实现第四次工业革命的弯道超车,战斗即将正式打响了。而在这场战斗中,BAT+科大讯飞将是开路先锋!
1、颠覆来临,无人汽车真的来了!
11月16日,一年一度的百度世界大会正式召开!不同以往的是,这次不再是预想概念,而是直接上货!
李彦宏的一句“如果无人驾驶的罚单已经来了,无人驾驶汽车的量产还会远吗?”全场沸腾!
今年夏天, 李彦宏乘无人车上了五环,没想到华丽丽地违反了试车规定,收到了一张来自“交警叔叔”的罚单。
百度表示已经和金龙客车签定了战略合作。无人小车将在2018年正式量产!没有方向盘,自动驾驶的无人车真的要来了,比我们想象的快多了。
今年4月19日,百度就正式发布了“Apollo(阿波罗)计划”!该计划全面开放,向汽车行业以及自动驾驶领域的合作伙伴提供一个完整、安全的平台,帮助他们结合车辆和硬件系统,快速打造出一套属于自己的完整的自动驾驶系统。截止目前,有6000多个开发者在投票支持Apollo项目;有1700多家合作伙伴使用了Apollo的开源代码;还有100多个合作伙伴申请开放数据。
2、阿里的城市大脑,让人为之癫狂!
阿里云ET城市大脑是目前全球最大规模的人工智能公共系统,可以对整个城市进行全局实时分析。目前ET城市大脑已经在杭州、苏州等地落地。
它将交通、能源、供水等基础设施全部数据化,将散落在城市各个角落的数据进行汇聚,再通过超强地分析、超大规模地计算,实现对整个城市的全局实时分析,让城市智能地运行起来!
杭州城市大脑接管了杭州128个信号灯路口,试点区域通行时间减少15.3%,高架道路出行时间节省4.6分钟。在主城区,城市大脑日均事件报警500次以上,准确率达92%;在萧山,120救护车到达现场时间缩短一半。
今后,城市大脑将让数据来帮城市做思考、做决策!
通过AI技术,癌症的早期筛查变得更加精准!8月初,腾讯发布了一款AI医学影像产品——腾讯觅影。
腾讯觅影是首款AI食管癌筛查系统,准确率超过90%;在肺结节方面,觅影可以检测出3毫米及以上的微小结节,检测准确率超过95%。未来腾讯觅影将与医学院和医疗结构合作助力更多病种检测。可以有效辅助医生发现癌变征兆,将病魔遏制在摇篮里。
承担着建设智能语音开放平台的科大讯飞,又有何能耐可以比肩BAT,担负起国家人工智能发展战略的重任呢?
语音识别龙头——科大讯飞
1、科大讯飞的起点
上世纪90年代, 国内语音分为“南北二王”,“南”指的是中国科技大学的王仁华教授;“北”则是清华大学的王作英教授。刘庆峰正是在这个时期被选中加入了王仁华教授的人机语音通信实验室,并牵头做一个语音合成系统,该系统不但保证了音质,还具备了优良的语音自然度,合成的语句近乎“人声”,成为1998年国家“863计划”成果比赛中最为轰动的科研成果。同年,IBM发布了语音系统,首次靠说话就能让电脑完成指令,被评为当年科技界十件大事之一。
面对国内空白的语音市场,IBM、微软、英特尔、摩托罗拉等纷纷抢占布局,在中国成立研究院。在这样的背景下,刘庆峰产生了创业的想法。
在获得导师首肯后,一边攻读博士学位的刘庆峰一边拉拢一批中科大校友开始创业。1999年6月,安徽硅谷天音信息科技有限公司成立,半年后,改名科大讯飞。
创业之初,刘庆峰对于科大讯飞的定位是开发面向大众消费市场的产品。很快,一款名叫“畅言2000”的电脑软件问世,这是一款针对 PC 的软件,通过语音既可以有指令的操作,又可以有文本输入,第一次把手写输入的随意性和语音输入的快速性无缝整合在一起。
对于这款产品,刘庆峰信心十足,两三年内将带给科大讯飞10亿甚至100亿的营收。但是,畅言2000最终反而让这家初创仅一年的企业面临破产危机,最困难时,刘庆峰自己借钱给大家发工资。
在总结畅言2000失败的时侯,科大讯飞悟出几点:一是盗版猖獗,科大讯飞正版软件刚一面世,盗版已经铺天盖地;二是因为大部分用户是老年人,操作电脑的能力很差,时常因为电脑本身的硬件问题呼叫售后服务,这推高了科大讯飞的运营成本;三是因为团队都是技术出身,缺乏建渠道做市场推广的营销经验;四是PC 已经比较好地解决了人机交互的问题,对语音的需求没那么迫切。
但是,团队坚定初心,并对未来达成3个共识:1.人工智能产业未来有100亿的空间;2.我们能成为这个领域的No.1;3.我喜欢。
科大讯飞要做中国乃至全球语音产业的龙头,
团队及时调整战略,科大讯飞暂时不适合大众消费市场,只能转而攻企业级用户。
2000年以后,中国电信的168电话信息平台开始铺向全国,其原本是人工录音接听,很难应付海量和动态的信息,而科大讯飞的语音合成技术,正好可以解决这一问题。这是一个价值上亿的订单,对于科大讯飞来说势必要拿下。
不过,电信看不上当时还是小团队的科大讯飞,而是具备整个系统集成和企业综合实力的华为。于是,科大讯飞只能退而求其次,选择与华为合作,将技术嵌入到华为的系统平台上。最后,与电信的合作就这样间接的达成了。
与华为的合作模式的成功令科大讯飞在市场得到认可,中兴和联想在内的50多个企业也很快成为其合作伙伴,也吸引联想投资和英特尔在内的三家知名企业相继入股。投资方在资金、资源和经验上的助推,将科大讯飞推向了产业化的快车道。终于,在经过5年的亏损后,科大讯飞在2004年首次扭亏为盈,次年语音产品实现销售收入1.5亿元,利税2500万元,带动相关产业10亿元以上,推动语音产业进入全面爆发阶段。
2007年,科大讯飞完成股份制改造,一年后,2008年5月12日在深圳中小板上市,成为中国在校大学生创业的第一家上市公司,也是国内唯一一家语音产业上市企业。
2、语音合成:英语合成做到了超过普通人说话水平
人工智能是以以深度神经网络为基础,加上大数据、云计算后台的运算平台,和移动互联网源源不断地把各种训练数据收到后台。科大讯飞是中国第一个把深度神经网络用到语音识别领域的公司,并且在 2011年, 在全球首次发布了云平台,宣告语音、手机的听写时代正式到来。在2012 年,在图像识别领域,深度神经网络开始异军突起,接着 2014 年机器翻译取得突破。
今年,科大讯飞即将给大家看到一个又一个行业的令人欣喜的成果,这些是从算法创新,到应用创新和持续数据迭代的一个结果。
在这个结果中,首先是语音合成技术:让机器能听会说,给机器装上一个人工的嘴巴。
今年,在全球的语音合成大赛暴风雪竞赛中,科大讯飞再次获得全球第一名。今年的国际比赛比的是英语合成,而且是英语的故事级合成,也就是要求系统更加深情并茂,难度更大。但是,在今年一堆的国际的顶尖研究机构和产业界全部参加的前提下(因为 IBM 在今年年初就认为人际交互接口会是 2016 年十大技术突破的前 3 名,所以语音合成也是受到了前所未有的关注),科大讯飞再次在英文领域获得全球第一名,而且不仅是全球第一,更是全世界唯一把英语合成做到了超过普通人说话水平的技术!
在国际比赛中,5 分是播音员的水平,4 分是普通人的说话水平,而科大讯飞是 4.2 分,第二名只有 3.9 分。也就是说,全世界,让计算机念小说风格、故事风格的语音合成,只有中国人做的超过了普通人的水平。而且,这已经不是第一年,科大讯飞已经连续 11 年蝉联了全球语音合成大赛的第一名。去年国际组织比的是印度的印地语,照样是全球第一,是 3.9 分。 今年的中文,科大讯飞已经做到了 4.5 分。 当前的中文、英文、印地语的第一名都是科大讯飞所代表的中国做出来的,这意味着我们中国用户享受了全球语音合成最高的成果。
3、语音识别:噪音环境下错误率为 2.24%
在语音合成的进展上,我们再看一下语音识别。 在去年 12 月 21 号发布会上,科大讯飞是全球第一次,敢于在几千人的演讲现场同步把语音自动转成文字,而且现场机器跟人的对比结果表明,机器在转写准确率上大大超过了专业速记人员。
在讯飞发布之后,今年 5 月份谷歌开始发布了英文转写,国内也有一些单位开始跟风。但是 ,即便到今天为止,能够任意不用做任何训练,在不用联网的单机情况下(为应对保密和网络的各种不同异常环境),能够做到超过 90% 的准确率的企业,全行业迄今为止只有科大讯飞一家。
伴随着语音转写,讯飞又发布了万物互联时代最重要的人机交互的几个关键的特征:可以在 3 到 5 米,5 到 8 米之外,用于语音跟机器人跟智能家居交流,可以多轮对话上下文可以随时随地打断。通过这些特征,讯飞定义了万物互联时代的语音交互标准,并且推出了 AIUI 人工智能的人机交互平台。该平台当时以叮咚音响为代表,不光可以听音乐,还可以控制所有家居。
在交互过程中最重要的是远场识别、噪音环境下的语音识别,以及在多个人同时讲话时,语音识别能不能达到使用。
国际上有一个非常著名的语音识别竞赛 Chime,就是在噪音口音和多人情况下进行比赛。这个比赛今年是在谷歌举行的,科大讯飞在所有 3 项指标中都是全球第一名。而且,我们可以看到这个数据指标网站,6 麦克风,这最难的这个麦克风场合下,准确率已经可以做到 97% 以上。 这不是中文,而是英文的在谷歌做的国际比赛结果:在噪音环境下科大讯飞的错误率只有 2.24%。
4、机器翻译:比赛中打破日本、美国垄断
在机器翻译领域,2014 年基于深度神经网络的这些算法上的创新和突破,科大讯飞的机器翻译取得了突破性的历史进展。在 2014 年国际口语翻译大赛( IWSLT)中, 获得了全球第一,这是具有历史意义的。因为以前国际翻译大赛,汉英翻译项目都是日本研究机构全球第一,英汉翻译项目都是美国机构全球第一,2014 年 11 月的这次比赛,终结了这个历史:科大讯飞英汉和汉英都是全球第一名。
在这基础上,2015 年 2 月,美国国家标准技术研究院组织的机器翻译大赛中讯飞继续是全球第一。今年,科大讯飞又面对国家一带一路的重大战略,正式推出面向一带一路的多语种翻译。 这一切,我觉得都是真正的在践行科大讯飞创业之初的理念:我们要实现人类乃至人机信息沟通无障碍。在未来,我们要把世界所有主要语种全部放进去。
5、“认知智能”是未来人工智能的必由之路
人工智能有 3 个层次:计算智能(机器人能计算和存储)、感知智能(机器的视觉、听觉可以超过人工)和认知智能(未来的核心)。而以语音和语言为入口的认知计算,是人工智能的必由之路。在过去一年之中,科大讯飞在人工智能最核心的可以说是皇冠上的明珠的认知计算领域,又取得了令全球瞩目成果,我们在今年参加国际非常知名的 Winogard 的认知智能的测试,这比赛是要用来替代图灵测试的,因为今天移动互联网传输到后台的对话数据越来越多,所以图灵测试已经越来越容易过关,这就是看机器真正的认知结果。
就在不久前,在 11 月 15 号,又一次传来喜讯,由美国国家标准技术研究院组织的国际非常知名 KBP 认知大赛中,在对于实体的发现,以及关联信息的关系的比赛项目中,包括了卡内基梅隆,包括 IBM 这些我们非常尊敬的企业和研究机构都参加了,科大讯飞是全世界第一名。
在这些创新的基础上,讯飞在跟教育部考试中心合作,在事关国家教育未来的考试阅卷中(保证主观题的评分要达到公平公正性),机器已经在今年上海的四六级考试,在江苏、湖南等地的高考和研究生考试中对学生的语文和英语作文判分。机器学习了 500 份专家判分的卷子,就可以对其它几十万份卷子进行判分,其综合效能已经超过人工水平。
6、科大讯飞开放平台数据进展
科大讯飞在去年发布会上把平台开放给所有创业者以来,我们可以看到一些令人鼓舞的数据进展。
首先,人工智能云平台上的总用户数,今天已经达到8.9亿,比去年同期增长48%。8.9 亿是什么概念?——过去18个月,累计下载人工智能相关应用的独立终端数。如果一个手机装了3个跟讯飞人工智能相关的应用,我们只算一个。过去18个月,累计已经有8.9亿不同的终端。
那么第二个更重要的数据是,每天有多少人在用?
一个人用一次叫一人次,去年这个时候每天是10亿人次的使用量。今天,已经突破30亿人次。4月26号习近平***亲临视察科大讯飞的技术成果,当时他非常高兴的看到讯飞每天的数据量是15亿人次。短短半年已经到了30亿人次,并且我们认为很快会突破百亿人次。
再有一个是第三方围绕讯飞的创业团队,去年有7万家,现在已经达到21万家。
这就是人工智能的产业生态,讯飞希望与所有创业者共同成长、共同创造、共同分享人工智能的伟大未来。
ToC还是ToB?
近日,战略上全线押宝AI的百度高调喊出“智能语音技术全系列永久性免费”的口号,由此引发了人工智能领域最大规模的轩然大波。A股有着人工智能第一股的科大讯飞首当日直接封死跌停板。
尽管科大讯飞对外澄清称,人工智能的市场很大,足以容纳更多企业千帆竞发,科大讯飞不需要“保卫”。但市场似乎没有那么乐观:科大讯飞的技术壁垒以及规模壁垒究竟有多高,成为当下市场最为关注的问题。
既然被称为A股人工智能第一股,并且在很多细分领域与国际巨头比肩,科大讯飞在智能语音领域的技术实力18年的技术积累,应该非一朝一夕能被超越的。数据显示,目前科大讯飞已经占到了语音识别市场60%以上的市场份额,语音识别技术在多项比赛中多次蝉联第一,对标的企业是国际上的谷歌、微软、亚马逊这些巨头,技术上或许压根没把BAT放在眼里。
为了加强技术壁垒所带来的规模效应,科大讯飞也看到了ToC端消费市场的巨大前景,在这点上,科大讯飞是有战略眼光,也有相应的储备。
早在2010年,科大讯飞就推出了讯飞语音开放平台。截至2017年11月,开放平台累计覆盖终端数已经突破了15亿,日均交互次数达到40亿,覆盖的开发者团队有46万。
就在百度DuerOS在全国范围内向开发者投出橄榄枝后,今年10月24日,科大讯飞又举办了有史以来规模最大的首次开发者大会,拿出了10.24亿元基金扶持开发者。某种程度上,这是科大讯飞维护自身智能语音生态吸引力的“防护”举措。既是实质性动作,又表明了一个态度——不会任由BAT切割走开发者的市场和人群。
科大讯飞董事长刘庆峰也感叹,“目前,科大讯飞构建的技术壁垒依然存在,比如智能语音技术可识别22种方言,由于积累时间较长,在这一能力上,BAT暂时还无法企及,但留给讯飞的窗口期只有三到五年。”
在这场围剿与“反围剿”的战斗中,科大讯飞过去的业务集中在教育、医疗、司法等ToB市场里,接下来如何巩固这些领域的固有优势,不被BAT粗暴的免费模式所破,既是科大讯飞当下最重要的挑战,也是对其智能语音技术壁垒最严酷的考验。
智能语音技术确实存在准入门槛。虽说当前科大讯飞的技术领先性依然存在,但互联网多年来的竞争事实表明,技术的差异性和差距已经越来越小了。更何况,BAT根本不缺钱,完全能请得起大牛的专家,也有足够多的资金可以砸向市场,甚至还可以购买成熟的技术或公司。
而且,人工智能技术的成熟度依赖于后天的多应用场景的训练与学习,在拓展C端应用场景方面,科大讯飞还是有不少要补齐的部分,其中有两点值得说一下:
一是,BAT每一家手里都有强势的产品,每一个产品和入口都是智能语音的关键应用场景,比如百度的搜索和携程的订票订酒店,腾讯的QQ、微信两大入口及延伸出来的开放服务平台,还有当二股东后所能控制的滴滴、摩拜、美团点评、京东等外围援手,阿里的淘宝、天猫、支付宝、优酷、虾米音乐等产品矩阵。这些都是BAT碗里的,也是科大讯飞动不了的奶酪。
二是,虽然科大讯飞在智能语音技术上要比BAT更成熟,用户体验更好,但这要看是个什么玩法,一旦到了开放平台和生态的场子里,无论是拼钱、拼资源、拼开发者的号召力和控制力,科大讯飞恐怕都占不到便宜。因为BAT这么多年,最大的势能就在流量生态和资源整合上。过去可能是站长联盟、APP联盟,如今到了智能语音的赛道上,其实玩法大同小异,只需要迁移一下就过来了。
这些都是科大讯飞所面临的挑战,也是难以逾越的高墙。
那么问题来了,既然麻烦很大,后果很严重,面对BAT扔过来的降维攻击,科大讯飞究竟如何应对呢?到底该怎么破呢?
其实,不论在任何行业,一家企业通过精耕细作,建立起自己的护城河是首当其冲的任务,也是企业立足之本。
与其在本不占优势的消费级市场里与BAT血拼,参与烧钱大战,还不如深耕教育、医疗、司法等TO B行业市场,结合行业应用特征做深做透,在细分领域垒砌起高高的围墙,建立起抵抗巨头进攻的堡垒。
科大讯飞只要“绑”好政府、教育、司法等部门,提供垂直化的智能语音解决方案,体现出差异化价值,BAT的免费套路就很难适用,不易被攻破。
在上述这些领域,科大讯飞有先入为主的优势。科大讯飞发布的2017年上半年财报数据显示,其营收中有29.65%来自于教育类行业产品,公司中有三分之一的技术投入到了教育产品研发领域,教育相关费用同比增长了21.27%。此外司法、医疗、车载等几个关键领域,也是科大讯飞智能语音技术应用的重要赛道。科大讯飞只要守好“大门”,将护城河越挖越深,BAT的战火就殃及不到这里,让科大讯飞可以守好产粮区。
BAT的围剿,对任何一个行业或者企业来说,都是一次危机,既有危,也有机。网宿科技固守阵地不盲从的策略,或许会给科大讯飞提供一个可借鉴的经验。
刘庆峰在朋友圈说了一段意味深长的话,“人工智能+时代,不仅是属于科大讯飞的时代,更是属于人工智能领域万千开发者和科学家的新时代。这里空间广阔,完全容纳得下千帆竞发的产业生态。”
-
人工智能
+关注
关注
1789文章
46566浏览量
236890 -
科大讯飞
+关注
关注
19文章
787浏览量
61131
原文标题:人工智能创新平台,它与BAT齐名
文章出处:【微信号:WW_CGQJS,微信公众号:传感器技术】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论