1024程序员日,也是科大讯飞的1024开发者节,在合肥奥体中心,科大讯飞把它们的开发者节办成了演唱会的形式。
虽然开场的氛围很热烈,但显然科大讯飞带来的惊喜并不多,一款新品讯飞听见M1转写机器人、1024计划的2.0版本以及聚合科大讯飞所有AI能力的iFLYOS。
刘庆峰:我们从来不认为机器翻译超过顶级同传的水平
科大讯飞董事长刘庆峰先上台强调了我们需要源头技术创新,不能所有开放创新是在别人的院子里建大的。
此前网上曝出的科大讯飞同传造假问题,刘庆峰也在会上委婉地再三强调,目前机器翻译和好的同传和译者相比还有很大差距,“我们从来不认为机器翻译超过顶级同传的水平。”
刘庆峰进一步指出,“能理解、会思考”的AI通常是在一些可以训练,有数据逻辑规律可循的场景,但是在一些无先验知识的常识推理领域,机器推理并没有达到六龄童水平。
关于此前科大讯飞争议颇多的人机耦合论,刘庆峰说,人机耦合是AI推向应用落地的关键,我们不能让机器完全替代人,人应该在AI平台上,享受人工智能。“2029年80%的工作可能是机器帮我做,20%的决策判断自己来。”
“人机耦合正在成为全球的共识。”刘庆峰特地提到李飞飞从谷歌回到斯坦福后,最近专门成立了以人为本的人工智能研究院,也是在推动人和机器的融合。
刘庆峰强调:人机耦合不仅仅是技术发展趋势,更是社会伦理发展要求,比人类更强大的不是AI,而是掌握了 AI的人类。
当前关于数据隐私问题的讨论一直也是甚嚣尘上,刘庆峰认为“用技术赋予用户选择权”非常关键,为此,科大讯飞推出离线语音识别、语音合成、离线机器翻译。
在讯飞今天发布的讯飞听见2.0中,其宣布首次实现了离线机器翻译,并且其可理解度提升到了83%。
不过,科大讯飞是如何实现这种离线语音识别以及翻译处理的,刘庆峰并未做过多解释。有趣的是,在科大讯飞1024开发者节的同一天,百度于硅谷展示了名为STACL的同传AI,据报道该同传系统不仅能实时翻译就,最大的特点是可预测以及延时可控。
科大讯飞的危机感越来越重了。
发布iFLYOS,聚合科大讯飞所有AI能力
在去年的1024开发者节上,科大讯飞首次公开了其在AI上的三大布局:AI生态计划、AI教引计划和AI公益计划。科大讯飞执行总裁胡郁分别总结了三大布局取得的成果:
在AI生态计划方面,科大讯飞的AI众创空间入驻企业数量超过600家,智能科技产业规模超800亿,选出了超过54个AI钻石团队,其中13个获得下一轮融资,总估值60亿美元。同时为开发者和创业者提供AI服务市场。
在AI教引计划方面,科大讯飞的AI大学学员达到了24万,拥有100+节线上课程,签约教授55位,与北京大学、浙江大学等高校联合培养在校生,同时与CSDN、启迪之星等联合培养开发者。
AI公益计划方面,他们收集了20万条方言语言,目前已经支持23种方言语音识别,而三声有幸的两个重点项目:音书科技服务了40万听障者和10所聋哑人学校;心智互动累计服务6万的实力障碍者。
胡郁指出,科大讯飞的护城河包括工具性业务、内容性产品以及平台性产品,现在它们统一将之归为讯飞的iFLYOS。iFLYOS中除了既有的iFLYTEK INSIDE、AIUI以及MORFEI,还包括讯飞1024 AI计划的2.0版本。“这不仅仅是一个操作系统,也是适应了未来社会的发展趋势。”
胡郁谈到了未来我们AI发展的几个趋势:
交互方式从图形交互、触摸交互向基于视觉呈现的语音交互发展;
单纯软硬件模式向软硬一体的云+端模式变化;
面向最终用户的产品从大C向小C发展;
参与生态的物种向多样化和去寡头化发展;
中国特色的计划经济与市场经济的融合;
商业生态从中心化向去中心化发展。
在下午的生态发布会上,胡郁具体阐述了iFLYOS,它就是科大讯飞软硬件一体化的智能硬件整合解决方案,包括为开发者提供一站式的解决方案和开放的技能平台,以及为消费者提供跨场景的一致性体验。
iFLYOS之外,胡郁还介绍了他们的iFLYIoT为例,这是一个可以构建智能物联网的基础设施,能让每个设备相互联通。通过这一平台,开发者就可在三小时内快速开发出Demo。
而在1204计划2.0中,科大讯飞会为开发者开放200多项能力。生态计划中,将构建1024应用服务链条,项目服务、品牌推广以及业务支持升级;以及构建1024生态投资链条,包括生态VC基金、天使基金、种子基金。
方言计划中,科大讯飞要完整复制10种方言,招募方言保护计划成员,赋能24省方言。
公益计划方面,科大讯飞今年的重点是AI医疗公益计划,项目首期投入公益基金1000万。
相比较去年的的1024开发者节,今年科大讯飞带来的惊喜并不多,只是在原有平台、计划的基础上做了小规模的升级和优化。另外,在今天早上1024发布会的尾声,科大讯飞还推出了一款新品——讯飞听见M1转写机器人,这是一款拥有7+1环形麦克风、远场拾音芯片以及加密功能的新一代硬件产品。
科大讯飞的AI故事说的怎样?
作为最早一批的智能语音入局者,即将走过二十年的科大讯飞已经成为了中国最大的语音识别人工智能公司。其产品占据了中文语音识别服务市场70%的份额,国内智能语音市场份额则占据了44.2%,遥遥领先于百度、苹果等公司。
可谓是真正占据了中国智能语音市场半壁江山的企业。
但科大讯飞的软肋在如今人工智能快速发展的时代,也越发明显。一直围绕语音、语言开展业务的科大讯飞最早主要针对TO B企业,但近年来,它也意识到单纯的行业市场不足以长远支撑其未来的发展。
于是,从2016年开始科大讯飞转型走向C端。这一年,科大讯飞消费者、智慧教育、智慧城市三大事业群正式成立,其中讯飞二号人物胡郁担任消费者事业群总裁。该事业群拥有讯飞输入法、灵犀、讯飞听见、智慧家庭等一系列C端产品,也是目前科大讯飞最为关键的业务。
一方面推出面向C端的消费级产品;另一方面,科大讯飞的野心也昭然若揭,想要对标亚马逊、谷歌、百度等公司。不仅在美国硅谷设立研究院,计划拓展改外市场,同时也朝着更广阔的领域迈进,在业务上做了更多的尝试。
去年,科大讯飞终于像很多巨头科技公司那样,举办了首届全球1024开发者节,公布了《1024计划》,包含AI生态、AI教育以及AI公益三个部分。还一口气发布了10多款人工智能产品,包括翻译机、机器人、智能音箱等。
随后在今年的CES(亚洲消费电子展)上,科大讯飞首次参展就带来了翻译机、智能麦克风、音箱、阿尔法蛋、莫比斯耳机、讯飞语音合成系列芯片,涵盖翻译、家庭、汽车等多种场景的人工智能产品。
科大讯飞一直对外强调其“平台+赛道”战略布局,其中平台就是把科大讯飞人工智能相关的核心能力,如语音合成、语音识别、语义理解等以开放平台的方式共享、赋能给开发者,据刘庆峰介绍,讯飞AIUI上的第三方开发团队数量从去年十月的47万已经增长到今年的86万。赛道则是科大讯飞的AI技术在一些垂直行业的应用,比如医疗、政务、教育等等。
然而以语音识别和交互为核心技术的科大讯飞,这一路走来并不顺畅。自带流量属性的BAT,曾经如胶似漆的合作伙伴,纷纷都有了自己的AI开放平台,并且在各个赛道上交出了不俗的成绩。
科大讯飞感受到了来自四面八方的危机,以语音技术为核心的平台+赛道的发展模式面临更多的挑战。
两三年的窗口期,科大讯飞能把握住机遇吗?
刘庆峰曾认为,未来三到五年是人工智能的窗口期。
但在这个短暂的窗口期内,科大讯飞的日子过得并不顺畅。不仅仅是面对BAT的“围剿”,同时其自身业务也遇到了一些质疑,留给科大讯飞的时间越来越短,而他们需要解决的问题却越来越多。
今年的1024开发者节正好给了科大讯飞对外展示肌肉的机会,主论坛之外,从AI+车载、AI+医疗、AI+客服、AI+营销等一大批分论坛的举办就能管中窥豹。
毋庸置疑,科大讯飞的商业模式高度依赖其技术,同时这条商业化之路上有不少竞争对手,所以它不可能大包大揽,做所有赛道的第一,有的放矢,有选择性的找到壁垒点是上策。
8月,科大讯飞发布了2018年上半年财报,实际营收32.1亿元,同比增长52.86%,其中教育和政法业务是主要收入来源,B端业务仍然是讯飞的强项,但是繁荣背后也隐藏着不少危机。其教育产品表现虽是可圈可点,但是根据既有数据整理,从2014年到2018年,科大讯飞的教育业务增速并不理想,虽有波动但整体在趋缓。
这意味着每个行业赛道都可能出现瓶颈期,科大讯飞需要不断地挖掘出新的潜力市场,去保障自己的业务营收能力。
在1024开发者节的前一天,科大讯飞公布今年第三季度报告,前三季度科大讯飞实现营业收入52.83亿元,较去年同期增长56%,毛利同比增长53.40%;前三季度实现归属于上市公司股东的扣除非经常性损益的净利润为2462万元,同比下降79.75%。
官方解释是因为正值AI产业爆发的关键窗口期,科大讯飞持续加大技术的研发、重点赛道的市场投入以及员工规模的扩张等等。
确实,近几年来科大讯飞在语音合成、机器翻译以及图像识别上获得过诸多国际赛事奖项,不过这些技术成果是否能快速转化成产品并且产生差异化的竞争力,显然是科大讯飞AI布局的关键。
上上周,华为发布了AI战略、推出昇腾910/310 AI芯片以及全栈解决方案。
拥有ET大脑、城市大脑、达摩院等的阿里在上月举办的云栖大会上宣布成立独立半导体公司“平头哥”,旨在自研深度神经网络芯片并促成商用。
百度在今年发布了“无人车成功量产”、“云端AI芯片昆仑”、“DuerOS设备激活量破9000万”等多个实质性成果。
回顾竞争对手们最近的大动作,平台+赛道能否成就科大讯飞的AI野心是摆在它们面前的难题。当科大讯飞遇上这些头部伙伴,技术壁垒有多高、行业资源优势有多强也决定了他们能否把话语权紧紧握在手中。
红利窗口即将关上,科大讯飞能成功进入安全期吗?
评论
查看更多