0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度与科大讯飞的竞争正在从语音交互延伸到视觉交互等多模态技术上

电子工程师 来源:未知 作者:李倩 2018-03-22 09:28 次阅读

近两年来,随着人们越来越频繁使用智能产品,所产生的数据越来越庞大,这些数据又被大公司所利用,庞大的数据也将催生“机器人大脑”。

目前市面上已经诞生出越来越多的机器人产品,如:早教机器人、陪护机器人、商场机器人、银行机器人、法务机器人等等,但是在实际的场景应用中,机器人并不能带来真正的智能。

最主要的功能就是体现在机器人大脑,用专业术语讲就是“语义”,我们在语义的采集上还处在非常初级的阶段,如果处理不了语义理解,那机器人在实际场景中的应用就是一个“呆子”。

让机器人开口说话,除了语义之外,语音也是关键的技术,国内科大讯飞在语音技术上的造诣,让国内很多做机器人的企业受惠,其语音处理技术基本上已经能满足人们日常生活中的使用需求。

但是国内机器人产业接下来的发展将会开始加速,在这次1号机器人网研讨会上,不管是百度,还是科大讯飞所传递的信息就是已做好全面出击的准备。

虽然国内语音语义的发展正在加速,但是对机器人企业而言,速度还不够快,目前不管是百度,还是科大讯飞所提供的语音语义还是不能满足机器人在实际应用中的要求。

城市漫步总经理李正说:“在人们与机器人对话的过程中,一些简单的问题,机器人是可以回答,但是稍微复杂一些的问题,机器人就回答不了,BAT或科大讯飞所提供的语义,让机器人处在小孩3岁左右的智力水平。对很多机器人企业而言,目前的瓶颈也是在这里,很难有所突破。”

科大讯飞销售总监廖凯说:“其实讯飞也很苦恼,语音助理已经通过国家各种考试,很难说它的智力不行,讯飞高考机器人基于目前的成长速度,到2020年会考上一本,去年的数据显示,语文考了90多分,数学考了110多分。”

只能说人们日常交流中,所体现的语言很复杂,目前的大数据还不能够支撑人们复杂的日常交流。

百度自然语言技术开放负责人张晶晶说:“人工智能聪明程度其实很大程度上取决于数据,百度为什么在人工智能领域国内领先,因为背后是庞大的数据,比如百度搜索,每天有60亿次搜索,这些数据支撑百度深度语义理解,像这种过亿用户的APP,百度有14个,这些数据支撑了百度大脑每时每刻都在进化。”

“国内各大平台,如:百度UNIT、讯飞AIUI、小i机器人、思必驰等,其实各家的侧重点不同,因此,最终的测试结果也会不同,像百度的对话效果只有达到95%以上才会放出来。”

但是在这次1号机器人网研讨会上,机器人企业对各大平台所提供的语义依然不是特别满意。

或许国内各大机器人企业过于依赖BAT等企业,希望依靠BAT大企业的投入完善语音语义技术,但是百度已经在语音语义上投入了3亿元,虽然技术积累很快,但是目前的瓶颈是依然还不能支撑机器人日常复杂的对话交流。

狗尾草联合创始人张博说:“3至5岁小孩,同一个问题,在每个年龄段寻求的答案都不同,所以对语义的要求非常高,如果真要做好语义理解,就需要把语义理解做的足够细,再接入知识图谱,如果是批量的知识图谱,那就需要各大平台开放知识库,让机器人企业去调用,满足更高级开发的产品需求。”

从这次1号机器人网研讨会上反馈,现阶段让各大平台完全开放知识库不现实,像百度、科大讯飞、小i机器人等投入巨资打造知识库,机器人企业想调用深层次语义,就需要支付相应的报酬。

当然很多机器人企业对语音还是另有看法,比如AI与UI,明明很多场景直接通过UI就可以解决的事情,干嘛非要用语音,把简单的事情复杂化。

这个问题的着重点在于,目前看来语音确实还不是最好用的产品,但是长远看语音将会是最便捷的交互方式。

当汽车和火车刚发明的时候,跑起来还没有马车快,但是终究汽车和火车是发展方向。

科大讯飞廖凯说:“人与机器发生交互的时候,输入输出信息有两种,我们从机器身上获取的信息,最简单的方式就是视觉,一目了然;但我们输出的信息最自然的方式是语音。这是语音的特性,未来一定会颠覆传统以键盘或触屏的输出方式。”

接下来,我们回到产品上来,对机器人企业而言,现阶段就算依靠BAT等企业的语音语义技术,也不能让产品具备高智慧,充其量只能达到小孩3岁左右的智力水平。

所以未来的方向在于细分场景,比如:订机票、订酒店等,采用百度和科大讯飞的语音语义可以非常成熟的完成,让用户从查询机票到预订票到购买机票等全过程,期间进行的多轮复杂人机对话可达7层以上。

因此,在一些细分商用场景,语音已经可以做到替代客服的工作,对机器人企业而言,如何让机器人+语音语义+使用场景落地才是接下来重点思考的方向。

百度张晶晶认为,通过百度大数据分析,儿童故事机的市场规模很大,目前正是更新换代的时间节点,因此,百度对儿童领域的投入会有所加大。

科大讯飞廖凯说:“今年大型商用机器人会有所发展,目前讯飞晓曼机器人已经入驻红星美凯龙、居然之家,以及一些零售商场。晓曼机器人目前已经可以做到导航领路、提供资讯、针对商场还提供了一套机器人营销方案,通过大数据帮助商家提高客户的转化率。”

目前国内大型商用机器人研发投入大,但是相对售价高、利润高,很多机器人企业在大型商用机器人身上舍得投入,因此,对科大讯飞而言,也有更强的动力去做技术的迭代。

如果从竞争的角度去分析,目前百度和科大讯飞提供的语音语义方案是旗鼓相当。

但是接下来的竞争将会更加深入,涉及到多模态技术交互。

科大讯飞在AIUI的构架下,加入手势识别、图像识别,使得人机交互技术更加复杂;百度也是一样,在提供语音交互的基础上加入图像识别,提供一站式服务。

因此,百度与科大讯飞的竞争正在从语音交互延伸到视觉交互等多模态技术上,对机器人企业而言,全新的时代即将来临,在主流人工智能企业激烈的竞争下,能够享受到的技术红利是,可以以低成本的方案去创造一台全新的机器人。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28413

    浏览量

    207036
  • 科大讯飞
    +关注

    关注

    19

    文章

    800

    浏览量

    61249
  • 自然语言
    +关注

    关注

    1

    文章

    288

    浏览量

    13348

原文标题:百度与科大讯飞竞争将从语音扩散到视觉

文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    科大AI虚拟人交互平台荣获行业最高评级

    近日,科大的AI虚拟人交互平台顺利完成中国信通院人工智能研究所组织的大模型数字人基础能力分级测试,并获得最高等级L5认证,系国内首批。
    的头像 发表于 12-13 11:39 262次阅读

    科大发布星火4.0 Turbo大模型及星火多语言大模型

    近日,科大正式推出了其最新研发成果——星火4.0 Turbo大模型。这一发布不仅标志着科大
    的头像 发表于 10-24 13:58 380次阅读

    2024科大全球1024开发者节官宣

    在这场属于开发者的年度人工智能盛会上,不仅有产学研大咖现场分享,升级行业大模型及更多应用产品,首发模态视觉交互及超拟人虚拟人交互能力,
    的头像 发表于 10-14 10:01 757次阅读

    科大将首发模态视觉交互及超拟人虚拟人交互

    近日,科大传来喜讯,第七届世界声博会暨2024科大全球1024开发者节将于10月24日至
    的头像 发表于 10-11 16:48 351次阅读

    科大发布星火极速超拟人交互,重塑智能对话新体验

    8月19日,科大震撼宣布了一项关于其明星产品——星火语音大模型的重大革新,即将推出的“星火极速超拟人交互”功能,预示着人机
    的头像 发表于 08-20 16:46 351次阅读

    科大发布星火大模型V4.0

    在科技创新的浪潮中,科大再度引领潮流,于北京隆重发布了星火大模型V4.0及其在领域的人
    的头像 发表于 07-01 10:33 876次阅读

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/模态交互/英语评测SDK合集)

    丰富外设配件 配套模态应用示例,支持快速上手体验大模型语音交互、智能视觉 AI 应用 板载
    发表于 06-18 17:33

    科大华中总部已封顶 年内交付使用

    科大华中总部已封顶 年内交付使用 科大华中总部位于武汉经开区车谷资本岛,投资额50亿;计
    的头像 发表于 04-16 14:49 1543次阅读

    【有奖】 百度智能云目推出首款模态 AI 模组,应用场景有奖征集!

    他来了,他来了 大模型时代悄然到来 百度首款大模型落地的硬件产品 模态AI模组LUCA系列正式亮相 目LUCA深度集成
    的头像 发表于 02-26 15:19 540次阅读

    科大发布“星火V3.5”:基于全国产算力训练的全民开放大模型

    科大,作为中国领先的智能语音和人工智能公司,近日宣布推出首个基于全国产算力训练的全民开放大模型“
    的头像 发表于 02-04 11:28 1503次阅读

    科大发布星火语音大模型

    科大行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年01月31日 09:17:28

    大模型星火V3.5,1月30日正式发布

    2024年1月30日14:00星火再升级;这一次首个基于全国产化算力平台训练的全民开放大模型 星火V3.5正式发布逻辑推理、语言理解、文本生成、 数学答题、
    的头像 发表于 01-23 09:06 813次阅读

    华为智能座舱与百度地图签署生态合作协议 共创导航出行新体验

    此次签约,百度地图和华为智能座舱将在智能座舱领域共同打造车机版百度地图,将手机端百度地图的丰富体验延伸到车端,包括车道级导航、红绿灯倒计时、实时停车场导航、个性
    的头像 发表于 01-19 15:50 659次阅读

    科技创新与智能助力:揭秘科大智能键盘D1的独特魅力

    魅力,从多个功能角度进行介绍,并探讨其适用于年会采购、企业送礼以及办公采购场景。   一、语音翻译:打破语言壁垒 智能键盘D1搭载了科大
    的头像 发表于 01-03 11:02 646次阅读
    科技创新与智能助力:揭秘<b class='flag-5'>科大</b><b class='flag-5'>讯</b><b class='flag-5'>飞</b>智能键盘D1的独特魅力

    语音识别技术最新进展:视听融合的模态交互成为主要演进方向

    多种模态(声学、语言模型、视觉特征)进行联合建模,基于深度学习的模态语音识别取得了新进展。
    的头像 发表于 12-28 09:06 3889次阅读
    <b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>最新进展:视听融合的<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>交互</b>成为主要演进方向