0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

编译SDK新绝招快速赋能产品语音交互能力

思必驰 来源:思必驰 作者:思必驰 2022-08-24 14:44 次阅读

编译SDK新绝招

快速赋能产品语音交互能力

每个人或许都想过像科幻片里的主角一样,用意念去解决工作问题。时代变迁,在AI时代,意念工作尚未实现,但人类已经能够“动口不动手”通过语音去操控机器,让一些枯燥的工作变得乐趣横生。

目前,人机对话交互方案主要有纯离线交互、在线交互和基于“云+端”的离在线交互。在线交互和离在线交互方案主要满足智能音箱、车载语音等有云端交互需求的智能产品,纯离线方案主要满足台灯、晾衣架、风扇等一些语音交互需求较小的产品。在助力家居、家电产品智能化升级的进程中,离线语音交互方案发挥了重要作用。

84f447c2-2360-11ed-ba43-dac502259ad0.jpg

思必驰智云译芯(CUI)平台可通过界面化的方式快速编译SDK,助力家居、家电厂商快速打造离线低功耗语音芯片,让产品更智能。在该平台,家居及家电厂商可选择YT系列芯片,根据产品方案进行软硬件功能的配置,通过平台的自动化编译功能,短时间内即可输出配套的SDK和固件,将固件烧录至芯片,赋予产品语音交互能力。

目前,思必驰智云译芯(CUI)平台可满足家居厂商以下几类产品需求:

●有语音交互刚需的AI产品

做饭时,手上沾满水,此时却需要去手动开关吸油烟机;劳累一天躺在床上,怎么也找不到空调遥控器;卫生间,手动冲水马桶容易传播细菌。

此时“打开吸油烟机”“打开空调”“冲水”等一些看似不起眼的简单语音操作,却解放了人类双手,在提升用户体验中发挥了关键性作用。家电厂商将语音功能应用到产品中,可为产品加分不少。

●无需依赖网络的AI产品

在一些网络信号不好的地区或密闭空间,通过云端进行语音交互反馈,产品响应速度比较慢,不适合晾衣架、台灯、净水器等仅需“开关””调节大小”“调节高低”等交互需求少的产品。相较于在线语音,离线语音可摆脱对网络的依赖,反应速度更快、功耗更低,需求匹配度更高。

●需控制成本的AI产品

智能家居产品“能听会说”,离不开语音芯片的功劳,厂商可以选择性价比更高的YT系列芯片,通过思必驰智云译芯(CUI)平台,快速编译 SDK 和固件,大大降低人力、物力与时间成本。

8504228c-2360-11ed-ba43-dac502259ad0.png

目前,思必驰智云译芯(CUI)平台赋能的语音芯片已经覆盖到各类家居场景,例如,厨房中的油烟机、集成灶、净水器,客厅场景中的空调、电灯、风扇、茶吧机、按摩椅、晾衣架等,助力家居产品的智能升级。

五大优势,开发So Easy

为了降低开发门槛,让开发更简单,思必驰近期已上线发音人音色训练平台,并对思必驰DUI标注训练一体化平台完成2.0升级。

思必驰智云译芯(CUI)平台以“低门槛、高效开发”为出发点,通过简易的界面,进一步提高开发效率,具有以下优势:

8541ac88-2360-11ed-ba43-dac502259ad0.jpg

(1)默认声学模型:智云译芯(CUI)平台提供适用于多品类的默认声学模型,无需开发定制,可直接应用。

(2)内置丰富合成音:智云译芯(CUI)平台内置了四十余种精品发音人,包括女声、男声、童声,具有多种形象和风格的 TTS 播报,可以满足风扇、茶吧机、按摩椅等产品的多样化需求。

(3)界面化定制SDK:用户可在智云译芯(CUI)平台,通过通俗易懂的界面进行芯片Pin脚的功能设置、自定义唤醒词和命令词、选择音色、设置离线回复语等。

(4)自动化编译:智云译芯(CUI)平台可根据界面上定义的硬件、软件配置,自动编译 SDK 和固件,同时支持一键下载

(5)管理可视化:完成SDK配置后,可通过可视化的界面对编译好的SDK进行删除、编辑等操作,简单易用。

在智能产品中,语音交互能力逐渐成为人机互动的重要桥梁,语音芯片需求不断增加,而语音芯片的“定制化、低功耗、高能效”优势也越发重要。思必驰智云译芯(CUI)平台将不断更新迭代,赋能更多语音交互场景。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SDK
    SDK
    +关注

    关注

    3

    文章

    1026

    浏览量

    45768
  • 语音交互
    +关注

    关注

    3

    文章

    283

    浏览量

    27980
  • 思必驰
    +关注

    关注

    4

    文章

    276

    浏览量

    14268

原文标题:思必驰智云译芯平台,界面化定制SDK赋能离线语音交互场景

文章出处:【微信号:思必驰,微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    RK3588 SDK入门之编译使用篇

    。通过这篇文章,你将能够快速掌握在虚拟机中高效使用RK3588SDK的关键技巧,为后续的开发工作打下坚实基础。图1EVM-RK3588评估板外观(正面)一、编译
    的头像 发表于 11-22 01:07 55次阅读
    RK3588 <b class='flag-5'>SDK</b>入门之<b class='flag-5'>编译</b>使用篇

    云知学院开展AI专项能力提升培训

    为顺应时代潮流趋势,提升员工的工作效率和生产力,培养员工从“能用”到“善用”生成式人工智能工具的能力,近日,元翔厦门空港邀请云知学院开展AI专项能力提升培训。
    的头像 发表于 11-21 14:10 92次阅读

    用户手册 | 全志T113-S3开发板——SDK编译指南

    前言:软件开发套件(SDK)是为软件工程师在特定的平台上进行应用程序开发而提供的一系列软件开发工具的集合。给开发人员提供了为特定产品及其生态系统创建新应用时需要的组件。在SDK环境下进行程序开发
    的头像 发表于 11-01 08:08 757次阅读
    用户手册 | 全志T113-S3开发板——<b class='flag-5'>SDK</b><b class='flag-5'>编译</b>指南

    腾讯云SDK如何使用,如何连接腾讯物联网开发平台。

    一 概述 SDK C SDK 采用模块化设计,分离核心协议服务与硬件抽象层,并提供灵活的配置选项和多种编译方式,适用于不同设备的开发平台和使用环境。 具备网络通讯能力并使用 Linux
    的头像 发表于 09-25 14:34 204次阅读
    腾讯云<b class='flag-5'>SDK</b>如何使用,如何连接腾讯物联网开发平台。

    RK3568 编译sdk技巧

    我司RK3568对外提供源代码是以sdk的形式提供,包括但不仅限于uboot、kernel、buildroot、debian源码。在编译sdk的过程中往往需要安装大量的第三方安装包,同时也要保证宿主
    的头像 发表于 08-30 11:44 416次阅读
    RK3568 <b class='flag-5'>编译</b><b class='flag-5'>sdk</b>技巧

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    大模型语音问答、拍照识图、大模型绘图等丰富供示例,支持语音唤醒、多轮语音交互。 2智能对话除了大模型
    发表于 06-18 17:33

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流和互动。随着现代人工智能在各行业的普及,智能语音
    的头像 发表于 05-23 15:14 356次阅读

    WTK6900G语音识别芯片在车载语音交互氛围灯上的应用案例解析

    随着智能汽车的快速发展,车载语音交互技术逐渐成为提升驾驶体验的关键技术之一。传统的车载灯光控制系统往往依赖于手动操作,不仅操作繁琐,而且在驾驶过程中容易分散驾驶员的注意力。因此,开发一种高效、便捷
    的头像 发表于 05-17 13:57 365次阅读

    快速入门BlueNRG SDK固件开发流程

    本文档指导用户快速地对 BlueNRG SDK 有一个直观、清晰的认识,了解其软件架构,以便顺利地学会利用 SDK 开发自己的用户固件。
    的头像 发表于 01-13 10:43 1869次阅读
    <b class='flag-5'>快速</b>入门BlueNRG <b class='flag-5'>SDK</b>固件开发流程

    思必驰语音算法与芯片的完美结合 人机交互

    工智能人机语音交互解决方案,具有高性能、低功耗等特点。该芯片通过采用软硬融合的方法,使得TH1520具备快速赋予各类设备语音交互
    的头像 发表于 12-29 11:43 911次阅读
    思必驰<b class='flag-5'>语音</b>算法与芯片的完美结合 人机<b class='flag-5'>交互</b>

    DshanMCU-R128s2 SDK 入门

    本章介绍基础的SDK编译,打包等操作,方便快速上手 SDK 开发。
    的头像 发表于 12-22 15:40 624次阅读
    DshanMCU-R128s2 <b class='flag-5'>SDK</b> 入门

    离线语音识别技术:掌控未来的语音交互

    离线语音识别技术的核心优势在于其独立性和实时性。在没有网络连接的情况下,设备依然能够迅速识别用户的语音指令,实现各种功能。这使得语音交互更加自然、流畅,让用户随时随地享受智能科技带来的
    的头像 发表于 12-13 11:12 548次阅读
    离线<b class='flag-5'>语音</b>识别技术:掌控未来的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>

    语音数据集:推动AI语音技术的核心力量

    一、引言 随着人工智能的快速发展,语音技术作为人机交互的重要手段,正发挥着越来越重要的作用。而语音数据集则是推动AI语音技术的核心力量。本文
    的头像 发表于 12-12 11:32 675次阅读

    离线语音识别,“自然说”为产品

    相比于云端语音识别,离线语音识别技术具有更高的识别准确率和更快的响应速度。因为离线语音识别技术是在本地设备上运行,不需要通过网络传输语音数据,因此可以避免网络延迟和不稳定等问题。
    的头像 发表于 12-11 11:20 446次阅读
    离线<b class='flag-5'>语音</b>识别,“自然说”为<b class='flag-5'>产品</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>

    汽车多模态交互研究:大模型及多模态融合,推进AI Agent上车

    语音交互方面:语音交互在AI大模型的下,功能愈加智能化、情感化。唇动识别、声纹识别等技术的上
    的头像 发表于 11-24 16:12 1468次阅读
    汽车多模态<b class='flag-5'>交互</b>研究:大模型及多模态融合,推进AI Agent上车