0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

回顾人工智能开发者大会上声智科技远场语音交互技术实力获认可

声智科技 来源:djl 作者:声智科技 2019-08-12 17:53 次阅读

2018年10月16日,由国家发展和改革委员会高技术司,国家互联网信息办公室网络数据与技术局共同指导,中国人工智能产业发展联盟(AIIA)主办的AIIA人工智能开发者大会(苏州)在苏州国际博览中心落下帷幕。本次大会上正式发布了第一批智能音箱智能化评级结果。搭载声智科技自主研发的软硬件一体的远场语音交互技术,小度智能音箱、小米AI音箱等产品荣获中级智能证书。

此次评测,参照中国人工智能产业发展联盟(AIIA)组织起草的《人工智能产品智能化等级指标要求和评估方法第1部分:智能音箱》,将智能音箱智能化程度一共分为六个等级:无智能、自动化、初级智能、中级智能、高级智能、完全智能。测试了包括材料检查和技术测试两个维度的12项指标,涵盖基本信息和安全信息审查、语音唤醒准确率、误唤醒率、语音识别能力、智能交互能力、技能领域、响应速度、安全防护等方面。经过技术测试、企业答辩、专家评审会评分, 6家参评企业中,5家企业的智能音箱获得中级智能的证书。5款智能音箱产品中,三款产品采用了声智科技提供的智能语音交互技术与服务。

获奖企业及产品(排名不分先后)

企业名称 产品名称
百度在线网络技术(北京)有限公司 小度智能音箱
北京小米科技有限责任公司 小米AI音箱
北京猎户星空科技有限公司 小豹AI音箱
北京灵隆科技有限公司 京东叮咚mini2
上海证大喜马拉雅网络科技有限公司 小雅AI音箱

小米AI音箱

声智科技独家为小米AI音箱提供了产品系列中的定制环形6麦克风阵列、低功耗高性能远场语音唤醒和语音端点检测技术。

声智科技的算法优化能力一直处于行业领先地位,在智能音箱最复杂的场景,即立体声回声抵消过程中的打断唤醒,声智科技的算法复杂度也远优于市面同类技术,采用更轻量级的算法解决更复杂的问题。

而语音端点检测技术,是语音识别响应速度的决定性因素,声智科技通过对唤醒模型的不断训练,将机器应答时间做到了400~500毫秒的最佳体验速度。

此外,声智科技的动态应答词匹配检测技术,将应答内容也做到了最大可能的人性化。小爱同学唤醒之后的随机应答词,包括“我在”,“哎”等,均可以根据系统音量自动调整。

小度智能音箱

声智科技为小度智能音箱量身打造了全球首款3麦环型麦克风阵列,并提供了完整的远场语音唤醒和识别服务。

3麦环型麦克风阵列,构型灵活,不仅打破了音腔设计的局限,释放更多ID设计的空间,同时,还保持了成本和效果之间的良好平衡。

声智科技自主知识产权的宽场景高灵敏唤醒技术和低成本高容错唤醒技术,采用全新的唤醒模型,可在提升强噪环境下的唤醒率的同时,降低误唤醒率,即便在一致性和失真度非常大的情况下,也能够出色的保证用户体验的效果。

针对场景深度优化,声智科技为小度智能音箱独家定制了儿童模式和极客模式,可根据不同用户的用语习惯,进行自适应的样本训练和机器学习,让人机交互更加智能化、人性化。例如:儿童生理上发育不够成熟,不善于掌握发音部位与方法,辅音发音分化不明显。而且,儿童发音单音重复较多,往往发出单个的、重叠的音,他们会说“车车”、“糖糖”、“兔兔”、“饭饭”,而不说“汽车”、“糖”、“兔子”、“饭”这样的儿童的交流方式,声智科技通过优化声学模型优化,打造了升级版的语音识别技术,使儿童识别准确率更高,更贴合儿童的语音交互习惯。

声智科技全链条智能语音交互系统SVK

无论是声智科技为百度、腾讯、小米等客户打造的智能音箱,还是为华为、阿里等客户提供的智能机顶盒、智能电视、智能手机/平板、智能玩具、智能车载、智能安防等解决方案,都离不开声智科技自主研发的技术引擎——全链条智能语音交互系统SoundAI Voice Kit(以下简称SVK)。

SVK融合远场语音交互和远场实时通话,集成了声波配网、波束形成、声源测向、噪声抑制、混响消除、回声消除、语音唤醒、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话、自然语言处理等核心技术,可赋予智能终端设备以更加敏捷、人性化的语音交互能力。

极致仿生物行为的响应时间。SVK精准的远场语音唤醒、远场语音识别(Far-Field ASR)服务,面向垂直领域深度优化,平均准确率达96%以上。极大提升的识别率,确保了更人性化的语音交互速度体验,使产品从唤醒到内容的全链条响应速度达到全球领先的1.4S以内,同时,用户唤醒以后的机器应答响应速度则达到400~500毫秒的极致水平。

完美匹配场景应用的语音识别。远场智能语音产品具有场景特殊性,相对更加垂直,比如智能音箱的识别偏重于音乐和百科领域,而智能汽车的识别则偏重于地图和音乐领域。为了确保SVK的远场语音识别自如应对众多垂直领域的场景应用难题,并保证云端服务的稳定性和并发能力,声智科技采用端云强耦的技术架构,合理在端云分配计算能力,采用与Amazon AWS、阿里云等主流云计算平台相同的服务可靠性标准,SLA高达99.99%。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1797

    文章

    47890

    浏览量

    240904
  • 语音交互
    +关注

    关注

    3

    文章

    287

    浏览量

    28095
  • 智能音箱
    +关注

    关注

    31

    文章

    1784

    浏览量

    78829
收藏 人收藏

    评论

    相关推荐

    2024 RT-Thread开发者大会精彩回顾

    近30位重量级嘉宾,围绕AI、大模型、虚拟化、工业应用、车控、PLC、智能设备开发等热点主题进行了分享,吸引了近千名来自全球的开发者和企业家。本次大会上还重磅发布
    的头像 发表于 01-21 18:53 192次阅读
    2024 RT-Thread<b class='flag-5'>开发者</b><b class='flag-5'>大会</b>精彩<b class='flag-5'>回顾</b>

    《HarmonyOS第一课》焕新升级,赋能开发者快速掌握鸿蒙应用开发

    ,为职业发展增添有力筹码。 目前,该课程成绩斐然,学习人次已超过150万,页面访问量突破440万,4.8分用户好评,超50万开发者通过认证考试。 未来,华为将持续丰富课程内容,帮助开发者掌握前沿
    发表于 01-02 14:24

    AI行业大咖云集 2024边缘智能开发者生态大会圆满落幕

    应用大赛最高奖项得主的诞生。活动聚焦全球人工智能发展浪潮与生态驱动力,为边缘智能从业者、开发者搭建了展示和交流的平台,促进边缘智能技术的进步
    的头像 发表于 12-09 14:48 311次阅读
    AI行业大咖云集 2024边缘<b class='flag-5'>智能开发者</b>生态<b class='flag-5'>大会</b>圆满落幕

    risc-v在人工智能图像处理应用前景分析

    和使用该技术,无需支付专利费或使用费。这大大降低了人工智能图像处理技术的研发成本,并吸引了大量的开发者、企业和研究机构参与其生态建设。 灵活性则体现在RISC-V可以根据不同的应用场景
    发表于 09-28 11:00

    YOGO ROBOT亮相2024世界人工智能大会

    “世界人工智能大会人工智能全球治理高级别会议”在上海盛大开幕。这不仅是一科技的盛宴,更是全球智慧的集结。在这场高规格的大会上,YOGO
    的头像 发表于 09-18 18:16 653次阅读

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    呈现、产业展览、技术交流、学术论坛于一体的世界级人工智能合作交流平台。本次大会暨博览会由工业和信息化部政府采购中心、广东省工商联、前海合作区管理局、深圳市工信局等单位指导,深圳市人工智能
    发表于 08-22 15:00

    百度WAVE SUMMIT深度学习开发者大会,文心大模型4.0 Turbo震撼发布

    6月28日,科技界的目光聚焦在了百度WAVE SUMMIT深度学习开发者大会上,这场盛会不仅是技术交流的盛宴,更是百度展示其在人工智能领域最新成果的舞台。在此次
    的头像 发表于 06-28 16:30 551次阅读

    86box开发板在出厂测试固件下ui界面无法语音唤醒控制是什么情况?

    我在官方组织的开发者大会上看见86box开发板的出厂例程可以在UI界面语音唤醒并响应打开空调指令,界面会跳转到空调UI并打开,但是我的板子出厂例程进入ui后就对
    发表于 06-11 08:50

    云知声出席AICon全球人工智能开发与应用大会

    近日,由极客邦旗下 InfoQ 中国倾力打造的 AICon 全球人工智能开发与应用大会在北京举办。此次大会以“智能未来,探索 AI 无限可能”为主题,汇聚 60 位行业头部企业嘉宾,带
    的头像 发表于 05-27 18:08 752次阅读
    云知声出席AICon全球<b class='flag-5'>人工智能开发</b>与应用<b class='flag-5'>大会</b>

    微软Build 2024开发者大会来袭

    微软将于今年5月21日至23日,在西雅图盛大举办Build 2024开发者大会。作为科技界的年度盛事,此次大会备受瞩目,预计将公布人工智能(AI)领域的最新突破。
    的头像 发表于 05-21 11:49 822次阅读

    报名开启!第二届OpenHarmony开发者大会2024重磅来袭!

    OpenHarmony 开发者大会2024,为开发者、产业组织、生态伙伴和行业用户搭建一个交流、分享和学习的平台。大会以 OpenHarmony 4.1 Release版本根
    发表于 05-14 15:23

    润和软件HopeOS闪耀亮相鲲鹏昇腾开发者大会2024

    5月9日,鲲鹏昇腾开发者大会2024在北京盛大召开。本次大会是面向开发者技术盛会,分享计算产业趋势、前沿AI
    的头像 发表于 05-11 09:52 580次阅读
    润和软件HopeOS闪耀亮相鲲鹏昇腾<b class='flag-5'>开发者</b><b class='flag-5'>大会</b>2024

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2) 课程类别 课程名称 视频课程时长 视频课程链接 课件链接 人工智能 参赛基础知识指引 14分50秒 https
    发表于 05-10 16:46

    MediaTek 天玑开发者大会MDDC 2024启幕

    Conference, 简称MDDC)是一面向全球开发者的行业盛会,旨在与生态合作伙伴和开发者共同探讨行业发展趋势,分享知识、经验和先进技术成果。本届
    的头像 发表于 05-07 10:25 742次阅读

    微软发布11项人工智能访问原则,助开发者决策,确保安全与隐私

    他强调,这份原则旨在赋予全球组织和个人全面的技术访问权,从而推动人工智能开发及应用以服务社会公益。值得一提的是,微软在此次公告中推出了包括赋能开发者、提供选择和安全与责任等在内的11
    的头像 发表于 02-27 14:43 707次阅读