0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2018年Q3中国最火的智能音箱!秘密竟然是远场语音技术

章鹰观察 来源:电子发烧友原创 作者:章鹰 2019-01-19 00:01 次阅读

本站原创,作者:章鹰,电子发烧友执行副主编。

美国研究公司Strategy Analytics近日发布了《2018年第三季度全球智能音箱市场报告》。报告显示,全球智能音箱出货量第三季度达到2270万,同比增长197%,创历史新高。亚马逊在第三季度依然市场占有率最高,占据了32%的份额,谷歌以23%的份额紧追其后。百度的加入改变了全球智能音箱的市场格局,市场占有率猛增至8%,进入全球前四名。

“据IDC统计,2018年第三季度,搭载百度DuerOS的智能音箱在中国市场出货量第一名,小度系列智能硬件在中国市场增速最快,市场份额增至24%。百度在远场语音技术上有很大的突破。我们和Duer OS生态一起发展,上周Duer OS产品的出货量突破2亿。这与百度远场语音技术的突破是密切相关的。“百度语音部门负责人在1月16日深圳举办的百度大脑硬件及平台发布会现场表示。

远场语音技术三大关键点

2017年年初,各家开发厂商针对远场语音技术进行军备竞赛,智能音箱的市场大战,从2017年开始到现在,是从近场语音技术到远场语音技术的过度阶段,厂商会介绍自己的远场语音技术多么厉害,现在很少有人提手机语音识别的效果。

远场语音技术的三大关键点:第一、信号处理,没有信号处理,就没有现在的远场语音的效果,信号处理用于定位,定位算法才能创造远场语音智能;第二、软硬结合,在远场交互时代,需要与硬度深度结合,将算法、软件在硬件上打磨好,提升用户体验;第三、端到端语音语言一体化,信号处理基于端到端建模,声学模型是匹配好场景的,还有唤醒技术,采用端到端思路,对端到端词汇进行建模,再将唤醒技术和信号处理技术结合,下沉到Duer OS系统层,才能达到很好的唤醒效果。

语音技术软硬一体化解决方案

教会机器听懂人话的过程,就是通过深度神经网络训练声学模型和语言模型的过程。而一些公司宣传的机器识别准确率过高,速记员都达不到这一水平,还有很多相关的工作需要去完成,不能单靠深度神经网络的方法来实现。语音识别准确率涉及多方面原因,例如远场精确识别就是业界难题。

最新一年百度在语音技术上两大进展:一次唤醒多次交互技术,技术特点是信号尾点和语义尾点联合优化模型;第二点,针对声学模型和语义模型做双重的置信度模型,在唤醒一次后可以和机器进行自由交谈,技术的关键点是将干扰信息去除。需要端到端的思路,用信号衰减的思路,配合声纹技术,进行交互。这个技术会在小度系列的硬件产品落地。” 百度语音部门负责人解释说。

百度在远场语音交互技术突破,包括一次唤醒多次交互技术以及 SMLTA 模型,SMLTA 模型在百度输入法正式发布这个技术,特点是语言和语义进行建模训练,这个模型可以跑在手机端,取得和在线识别媲美的效果。

百度历经一年多的打磨和开发,全新推出了百度远场语音开发套件,包括远场语音端到端技术、两款分别主打高性能和高性价比的计算板卡、3种形态的麦克风阵列,形成了环形6+1麦、线形4麦和车载3麦的多形态麦克风阵列套件方案。

“让硬件制造商、ODM、OEM做智能音箱、智能电视、语音机器人、可穿戴设备和车载可以在百度大脑上找到和使用语音开发套件。我们希望提供一条产业链,让上下游合作起来。” 百度语音部门负责人强调说。“这套开发套件的优势,灵活、快速让开发者对接自己在场景中的资源,对接语义理解能力,对接知识库。“

百度远场语音开发套件基于端到端方案,严格按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法,一、三、五米识别和唤醒效果优于同类产品,目前已落地150多款产品。

车载三麦克阵列,车上语音识别要求比较高,不仅是主音区,而且是双音区的语音识别,除了主驾驶位,还包括副驾驶位,百度车载三麦克钝角阵列放置在车顶,可以轻松实现主音区和双音区的语音识别,解决方案已经在百度车联网联盟内的被多个车厂采用。百度还在做DSP相关技术,配合麦克风阵列,价格更有竞争力。

主流芯片价格透明,两年原厂开发经验,主板方案非常有竞争力。合作模式:语音端到端产品,开发时间长,需要重新开模和设计,直接贴牌,提供产品原型,在这个基础上做二次开发;线下做开发,把方案放入适用的产品内部。

百度大脑AI硬件生态联盟

发布会现场,百度联合首批合作伙伴成立百度大脑硬件生态联盟,首批联盟伙伴包含芯片厂商赛灵思,摄像头模组厂商奥比中光、睿识、慧谷航天,开发套件厂商天启,终端设备厂商华正联等等。作为联盟发起人和组织者,百度大脑希望与联盟伙伴一起,共同制订端计算与AI硬件标准,共同促进和繁荣AI落地应用。



百度大脑也将对联盟合作伙伴提供深度技术支持、渠道支持、品牌授权、产品折扣和运营资源等权益,全面开启AI技术终端化的大门,赋能合作伙伴的同时为产业带来加速的交流和融合。正如百度AI技术生态部总经理喻友平所言,人工智能若要长期推动各个产业的升级与优化,需要合作伙伴的共同努力,打造适合AI发展的健康环境。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2293

    浏览量

    90863
  • 语音识别
    +关注

    关注

    38

    文章

    1745

    浏览量

    113015
  • 智能音箱
    +关注

    关注

    31

    文章

    1784

    浏览量

    78825
收藏 人收藏

    评论

    相关推荐

    2025中国(华东)智能家居技术创新研讨会

    2025中国(华东)智能家居技术创新研讨会 时间:2025 3月21日 主办单位:Big-Bit商务网 承办单位:《半导体器件应用》杂志
    的头像 发表于 01-22 13:52 120次阅读
    2025<b class='flag-5'>中国</b>(华东)<b class='flag-5'>智能</b>家居<b class='flag-5'>技术</b>创新研讨会

    OptiFDTD案例:二进制光栅建模及近场和模拟

    入射光束。 检测采样波长的传输光束(对于图案1) 传输功率谱 转换 (1)FDTD主要进行近场模拟,更长距离的模拟要求更多CPU时间和内存使用。 (2)然而,OptiFDTD提供
    发表于 01-20 10:26

    「2024中国AIEV产业智驾创新企业」揭榜,文知行光荣上榜

    知行在过去的发展,展现出了非常大的创新能力。202412月20日,知名信息平台亿欧网公布了「2024中国AIEV产业智驾创新企业」的榜单,“全球Robotaxi第一股”的文
    的头像 发表于 01-08 11:37 153次阅读
    「2024<b class='flag-5'>中国</b>AIEV产业智驾创新企业」揭榜,文<b class='flag-5'>远</b>知行光荣上榜

    离线语音识别技术引领智能语音灯具市场——NRK3502

    智能语音灯具集高科技与人性化设计,内置NRK3502离线语音识别芯片,支持识别与自定义指令,提供便捷
    的头像 发表于 12-30 15:04 269次阅读
    离线<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>引领<b class='flag-5'>智能</b><b class='flag-5'>语音</b>灯具市场——NRK3502

    AI芯片驱动台积电Q3财报亮眼!3nm和5nm营收飙涨,毛利率高达57.8%

    10月17日,台积电召开第三季度法说会,受惠 AI 需求持续强劲下,台积电Q3营收达到235亿美元,同比增长36%,主要驱动力是3nm和5nm需求强劲;Q3毛利率高达57.8%,同比增长3.5%。
    的头像 发表于 10-18 10:36 3538次阅读
    AI芯片驱动台积电<b class='flag-5'>Q3</b>财报亮眼!<b class='flag-5'>3</b>nm和5nm营收飙涨,毛利率高达57.8%

    鲁大师2024手机Q3季报:顶级旗舰激烈角逐,骁龙、天玑新芯片发布前最后一战

    2024Q3季度的手机市场,迎来了属于搭载骁龙8 Gen3和天玑9300系列机型的最后一回合战斗。
    的头像 发表于 10-09 11:41 526次阅读
    鲁大师2024<b class='flag-5'>年</b>手机<b class='flag-5'>Q3</b>季报:顶级旗舰激烈角逐,骁龙、天玑新芯片发布前最后一战

    应用的模拟麦克风和ADC系统

    电子发烧友网站提供《应用的模拟麦克风和ADC系统.pdf》资料免费下载
    发表于 08-28 09:39 0次下载
    <b class='flag-5'>远</b><b class='flag-5'>场</b>应用<b class='flag-5'>中</b>的模拟麦克风和ADC系统

    使用bq40z50-R2过程Q4可以防止在适配器反接的时候,损坏Q3

    在使用bq40z50-R2过程,规格书上声称,Q4可以防止在适配器反接的时候,损坏Q3?这句话怎么理解??它怎么就能起到保护作用了??感觉加这个mos管没什么用啊,还浪费成本,可以麻烦解释一下吗???
    发表于 08-15 07:02

    乐鑫声学前端算法:打造智能语音交互新体验,ESP32-S3 SOC技术方案

    ,它正为解决这一问题提供了强大的技术支持。噪声的清晰对话在噪声环境
    的头像 发表于 08-03 08:04 1189次阅读
    乐鑫声学前端算法:打造<b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互新体验,ESP32-S<b class='flag-5'>3</b> SOC<b class='flag-5'>技术</b>方案

    摩尔线程亮相2024中国元宇宙大会

    20247月13日-14日,由中国人工智能学会主办的2024中国元宇宙大会在杭州隆重举行。大会期间举行6专题论坛,分别聚焦AIGC与数字人、人机交互与混合现实、AR/VR与光
    的头像 发表于 07-18 11:36 1037次阅读

    奥迪全新Q3即将亮相,尺寸升级,设计新颖,或采用插电式混合动力

    显然,新款Q3借鉴了e-tron Q6的不少设计元素。两辆车都采用了崭新的窄条状LED日间行车灯,可展示出各种图案和信息。这表示着新Q3可能会采用分体式大灯设计,这种设计已经在奥迪的多款SUV车型上运用。
    的头像 发表于 04-08 14:17 464次阅读

    这个电路Q1和Q3会同时导通吗?

    在这个电路图中,MCU_CTL是MCU发出的数字控制信号,有没有可能在某种条件下,上管Q1和下管Q3同时导通?
    发表于 03-29 16:31

    语音芯片究竟如何写入语音?思泽科技为您详细解答

    在现代科技的发展语音芯片已经成为了我们生活不可或缺的一部分。它可以被广泛应用于各种设备,如智能手机、平板电脑、智能家居等,为我们提供便
    的头像 发表于 03-27 14:41 1001次阅读
    <b class='flag-5'>语音</b>芯片究竟如何写入<b class='flag-5'>语音</b>?思泽<b class='flag-5'>远</b>科技为您详细解答

    思泽语音芯片:让智能生活触手可及

    随着科技的飞速发展,人工智能已经逐渐走进我们的生活。在这个过程语音识别技术作为人工智能的重要分支,也得到了迅速的发展。今天,我们要介绍的
    的头像 发表于 03-19 15:20 525次阅读
    思泽<b class='flag-5'>远</b><b class='flag-5'>语音</b>芯片:让<b class='flag-5'>智能</b>生活触手可及

    车内语音识别技术智能驾驶的应用与前景

    详细介绍车内语音识别技术智能驾驶的应用、挑战以及未来的发展趋势。 二、车内语音识别技术
    的头像 发表于 02-19 11:46 973次阅读