开发者说 | AI操控机器人系列第三期——语音控制-电子发烧友网

摘要：

在AI操控机器人系列第二期的人体跟随教程中，身为地平线资深程序员的奶爸朱靠，使用地平线发布的机器人开发平台TogetherROS软件栈，搭建了人体跟随机器人。

同为开发者的梁雪，期待AI的世界，想让自己的生活也AI一把，并且一向是个能动口绝不动手的懒人，于是热衷于体验各类AI机器人，尤其是动动口就能操控的机器人，想着有朝一日过上“能只动口绝不动手”的生活，于是乎，就有了下面的这些体验。

产品A：说说话确实是能跟着走一走，but，我真的不想说完话之后还需要自己向右转才能引导它右转呀……

产品B：为什么还是得动动手，遥控来操控……噢，可达不到懒人预期呢。

难道就没有动动口就能让机器人运动，达到控制机器人的目的吗？答案必然是，有！下面地平线AI操控机器人系列——语音控制闪亮登场。

一、功能介绍

大家先看一下最终实现的功能。

从开始语音到机器人依据指令快速且准确的运动，得益于地平线旭日®️X3派上5Tops算力的BPU，可以实现低延迟算法推理能力，以及语音算法模块实现的远场（3~5米）降噪、回声消除，高准确率的asr识别功能。开始码代码前，先来简单分析一下人体跟随机器人需要具备哪些基本模块。

语音输入——麦克风

旭日X3派采用的是麦克风阵列硬件拾音，通过麦克风采集到音频之后交给后面的智能语音分析模块处理。

智能语音感知

智能语音算法对原始音频进行处理，对音频进行降噪并且识别出语音，同时还能输出语音声源定位的DOA角度。

交互

识别出语音之后，定义并且实现不同语音对应的不同功能应用，比如“向前走”语音控制机器人向前运动。

控制

根据“交互”模块输出的控制指令，实现对机器人的机械控制。

机器人本体

当然还需要一个具备运动能力的机器人本体，接收控制指令并控制电机运动，最终实现通过语音控制机器人运动的效果。

地平线发布的机器人开发平台TogetherROS软件栈内置了丰富易用的机器人开发组件，包含搭建一个智能机器人应用（如机器人语音控制）所涉及到的所有功能模块，完全开源免费，并允许开发者二次开发。

二、准备工作

准备搭建机器人人体跟随应用案例的硬件设备和软件包。

硬件

①旭日X3派

②麦克风阵列及转接板

③机器人

本次使用本末的轮足机器人来介绍，没有的开发者们也不用担心，文章后面会介绍自己搭建机器人的方式。

安装系统
参考旭日X3派的用户手册的安装系统章节，安装完成（或者已经安装过）需要更新系统。

系统配置
配置旭日X3派的无线网络，参考旭日X3派的用户手册的无线网络章节。

安装TogetherROS
使用apt命令通过DEB包安装TogetherROS。登录旭日X3派ssh root@192.168.1.147，执行命令：

root@ubuntu:~# sudo apt install hhp
root@ubuntu:/userdata# ls /opt/
tros

可以看到TogetherROS已安装在/opt目录下，说明安装成功。至此，准备工作结束，下面开始使用这些硬件设备和软件包搭建机器人人体跟随App。

三、使用介绍

接下来开始操作各个功能模块，再一步步组装起来，分别验证其功能。

安装音频麦克风

首先需要将旭日X3派与音频转接板连接起来，安装好的旭日X3派以及音频板图如下：

直接使用TogetherROS中的ROS package测试麦克风阵列的功能，通过脚本加载麦克风阵列驱动，并且启动智能语音识别模块。登录旭日X3派ssh root@192.168.1.147后，在终端（以下默认终端都是通过ssh登录）中输入以下命令启动：

# 配置TogetherROS环境
source /opt/tros/setup.bash
# 从TogetherROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加载音频驱动，设备启动之后只需要加载一次
bash config/audio.sh
#启动launch文件
ros2 launch hobot_audio hobot_audio.launch.py

智能语音识别模块默认发布的智能语音消息话题名为：/audio_smart, 在另一个终端执行使用ros2 topic list命令可以查询到此topic信息：

$ ros2 topic list
/audio_smart

语音识别和命令词控制小车运动功能

旭日X3派上打开一个终端，启动语音识别和控制的脚本

# 配置TogetherROS环境
source /opt/tros/setup.bash
# 从TogetherROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加载音频驱动，设备启动之后只需要加载一次
bash config/audio.sh
#启动launch文件
ros2 launch audio_control hobot_audio_control.launch.py

在当前终端执行ros2 topic echo /cmd_vel命令查询旭日X3派上的话题信息，当语音控制“向前走”，终端输出如下：

linear:
  x: 0.30000001192092896
  y: 0.0
  z: 0.0
angular:
  x: 0.0
  y: 0.0
  z: 0.0

说明智能语音识别算法和交互功能的软件包已安装成功，并能够通过/cmd_vel话题对外发布机器人运动控制消息。

将旭日X3派安装在机器人上

首先，需要将音频板安装在旭日X3派上，其次，将安装了线性四麦麦克风阵列的旭日X3派直接固定在机器人上，并将机器人的USB控制接口插到旭日X3派上。安装效果如下图：

安装好后，可以通过控制机器人运动查看是否成功安装。在旭日X3派上启动本末双足机器人运行控制Node，打开一个终端，执行如下命令：

# 配置TogetherROS环境
source /opt/tros/setup.bash
#启动本末机器人运动控制package
ros2 run diablo_sdk ros_bridge_example

旭日X3派上重新打开一个终端，通过发布/cmd_vel话题消息控制机器人以0.3r/s的速度转动：


# 配置TogetherROS环境
source /opt/tros/setup.bash
ros2 topic pub -r 10 /cmd_vel geometry_msgs/Twist '{linear: {x: 0, y: 0, z: 0}, angular: {x: 0, y: 0, z: 0.3}}'

机器人收到控制指令后转动的效果如下：

四、完整的机器人语音控制效果

旭日X3派上打开一个终端，启动智能语音识别和语音控制脚本

# 配置TogetherROS环境
source /opt/tros/setup.bash
# 从TogetherROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加载音频驱动，设备启动只需要加载一次
bash config/audio.sh
#启动语音控制launch文件
ros2 launch audio_control hobot_audio_control.launch.py

旭日X3派上打开一个终端，启动机器人运动控制Node

# 配置TogetherROS环境
source /opt/tros/setup.bash
#启动本末机器人运动控制Node
ros2 run diablo_sdk ros_bridge_example

通过语音控制机器人运动

五、原理分析

对于一个复杂的机器人系统，一般在机器人上配置上位机和下位机两种处理器。语音控制机器人由两部分组成，分为上位机和下位机。各部分详细组成如下图：

六、语音控制进阶

智能语音识别Node中，设备唤醒词和命令词默认配置/opt/tros/lib/hobot_audio/config/hrsc/cmd_word.json文件下（当然，若用户将此config文件夹拷贝到了其他路径，那以实际使用的配置路径为准）：

{
    "cmd_word": [
        "地平线你好",
        "向前走",
        "向后退",
        "向左转",
        "向右转",
        "停止运动"
    ]
}

配置文件的第一项为唤醒词，后面的是命令词，用户可以根据需要进行配置，实现语音操作的自定义。

本文转自地平线开发者社区，完整文章内容详见：https://developer.horizon.ai/forumDetail/109609560406362625

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

语音识别

语音识别

+关注

关注
38

文章
1741

浏览量
112675
人工智能

人工智能

+关注

关注
1791

文章
47314

浏览量
238629
语音控制

语音控制

+关注

关注
5

文章
483

浏览量
28252

汤姆猫发布AI语音情感陪伴机器人研发进展

汤姆猫公司近日透露了其AI产品的研发进展，其中AI语音情感陪伴机器人备受瞩目。据官方介绍，这款机器人预计将于2024年12月底前正式发售，为

发表于 12-17 11:27 •602次阅读

ROSCon China 2024 | RDK第一本教材来了！地瓜机器人与古月居发布新书《ROS 2智能机器人开发实践》

12月7日-8日，为期两天的ROSCon China 2024在上海圆满落幕，来自全球的ROS专家学者、开发者、企业代表齐聚一堂，共享机器人前沿技术成果。地瓜机器人携手众多RDK生态产品亮相，并联手古月居共同推出首本基于RDK

发表于 12-10 18:48 •397次阅读

ROSCon China 2024 | RDK第一本教材来了！地瓜<b class='flag-5'>机器人</b>与古月居发布新书《ROS 2智能<b class='flag-5'>机器人</b><b class='flag-5'>开发</b>实践》

云端AI开发者工具怎么用

云端AI开发者工具通常包括代码编辑器、模型训练平台、自动化测试工具、代码管理工具等。这些工具不仅降低了AI开发的门槛，还极大地提高了开发效率

发表于 12-05 13:31 •134次阅读

MagicLab开发第三代人形机器人，洽谈字节豆包大模型合作

人形机器人创业公司MagicLab近日宣布，正在积极开发第三代人形机器人产品，并聚焦于其实地应用与落地。据悉，这款机器人已在某家电工厂的流水

发表于 12-03 17:38 •603次阅读

机器人的语音功能

在AI时代，“会说话”的机器人已经十分常见，在许多酒店、餐厅、医院、图书馆，我们都能碰到这些小个头大智慧的服务机器人，它们开口的瞬间，你可能会听到熟悉的声音：樱桃小丸子、蜡笔小新、哆啦A梦...这些

发表于 12-02 10:50 •376次阅读

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

早就听大佬们说，具身智能是人工智能的下一波浪潮，也是AI未来的趋势！最近，具身智能的概念更是炙手可热，备受瞩目！不论是这几天稚晖君开源人形机器人全套图纸+代码，引发圈内热议。还是各类具身智能

发表于 11-11 10:20

兆易创新亮相2024地平线地瓜机器人开发者日

日前，以“加速智能生长”为主题的“2024地瓜机器人开发者日暨新品发布”活动在深圳成功举办。兆易创新作为地瓜机器人优质生态合作伙伴，受邀出席大会。中央市场部王霄受邀参加议程中的DUP教育生态联盟研讨会并做了《“兆易创新+地瓜

发表于 10-17 09:47 •391次阅读

软通动力云梦山院第三期管理者集训营圆满举办

软通动力云梦山院第三期管理者集训营在西安圆满举办。本期集训营以“聚战略、耕业务”为主旨，通过优秀产品实践经验分享、核心业务研讨、政策与业务策略赋能、跨部门协作通路探讨等形式，从理论知识到实战结论，从

发表于 10-10 10:27 •587次阅读

地瓜机器人发布一系列通用机器人套件

在“机器人+”浪潮的推动下，地瓜机器人近日隆重推出了一系列面向未来的软硬件产品组合，旨在赋能新一代通用机器人的发展。此次发布的亮点包括旭日5智能计算芯片、RDK X5

发表于 09-25 15:56 •332次阅读

地瓜机器人与广和通深度合作，共驱智能机器人商用落地

9月20日，2024地瓜机器人开发者日暨新品发布在深圳顺利举办。广和通作为地瓜机器人官方授权硬件IDH合作伙伴，受邀出席大会并展示了一系列基于地瓜旭日5的

发表于 09-23 16:27 •291次阅读

地瓜<b class='flag-5'>机器人</b>与广和通深度合作，共驱智能<b class='flag-5'>机器人</b>商用落地

英伟达打造人形机器人训练平台，引领AI新纪元

英伟达近日宣布了一项重大举措，为全球机器人制造业与AI领域注入强劲动力。公司推出了专为人形机器人设计的训练平台，旨在为行业领先的制造商、AI模型开发

发表于 08-05 11:45 •744次阅读

ROS让机器人开发更便捷，基于RK3568J+Debian系统发布！

。 ROS系统主要特点有哪些 (1) 提供丰富的机器人算法库 机器人的各种控制以及通信离不开算法库的支持，ROS系统提供丰富且功能强大的机器人算法库，如坐标变换、运动

发表于 07-09 11:38

Al大模型机器人

金航标kinghelm萨科微slkor总经理宋仕强介绍说，萨科微Al大模型机器人有哪些的优势?萨科微AI大模型机器人由清华大学毕业的天才少年N博士和王博士团队

发表于 07-05 08:52

NVIDIA将全球数百万开发者转变为生成式 AI 开发者

，开发者能够轻松地为 copilots、聊天机器人等构建生成式 AI 应用，所需时间从数周缩短至几分钟。 NVIDIA 创始

发表于 06-03 18:21 •1039次阅读

字节跳动推出AI聊天机器人Coze扣子

近日，字节跳动正式推出了名为“Coze扣子”的AI聊天机器人开发平台。自2月1日起，这一平台已正式上线，为开发者和用户提供了一个全新的交互体验。

发表于 02-03 09:31 •1836次阅读

搜索历史

开发者说 | AI操控机器人系列第三期——语音控制

摘要：