资料介绍
描述
2020 年 6 月更新:DeepSpeech 0.7.* .Screenshots 的更新命令,除了 Raspberry Pi 4 保持不变。直到最近的问题是缺乏用于该任务的简单、快速和准确的引擎。大约一年前,当我研究这个主题时,当你必须在树莓派 3 上运行 ASR(不仅仅是热词检测,还有大词汇量转录)时,有几个选择是:
- CMUS狮身人面像
- 卡尔迪
- 碧玉
链接:
还有其他几个。它们都不容易设置,也不特别适合在资源受限的环境中运行。因此,几周前,我再次开始研究这个领域,并在一些搜索中偶然发现了 Mozilla 的 DeepSpeech 引擎。它已经存在了一段时间,但直到最近(2019 年 12 月)他们才发布了 0.6.0 版本的 ASR 引擎,其中包含 .tflite 模型以及其他重大改进。它已将英文模型的大小从 188 MB 减少到 47 MB。“带有 TensorFlow Lite 的 DeepSpeech v0.6 在 Raspberry Pi 4 的单核上运行速度比实时速度更快。”Mozilla 的 Reuben Morais 在新闻公告中声称. 所以我决定亲自验证这一说法,在不同的硬件上运行一些基准测试,并制作我自己的带有热词检测的音频转录应用程序。让我们看看结果如何。
提示:我没有失望。
。
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.tflite
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.pbmm
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.scorer
下载示例音频文件
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/audio-0.7.1.tar.gz
tar xvf audio-0.7.1.tar.gz
树莓派 4 运行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
如果成功,您应该看到以下输出
不错!1.975 秒的声音文件为 1.529 秒。它比实时更快。
Nvidia Jetson Nano 运行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
嗯..比树莓派慢一点。这是意料之中的,因为 Nvidia Jetson CPU 不如 Raspberry Pi 4 强大。到目前为止,还没有用于 arm64 架构的预构建二进制文件支持 GPU,因此我们无法利用 Nvidia Jetson Nano 的 GPU 进行推理加速。我认为这个任务不在 DeepSpeech 团队的路线图上,所以在不久的将来我会在这里自己做一些研究,并尝试编译该二进制文件,看看使用 GPU 可以实现哪些速度提升。但几秒钟的速度仍然相当不错,根据您的项目,您可能希望选择在 CPU 上运行 DeepSpeech 并让 GPU 用于其他深度学习任务。
视窗 10/Linux
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
或者如果使用启用 GPU 的版本:
deepspeech --model deepspeech-0.7.*-models.pbmm --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
如您所见,.tflite 模型在现代 CPU 系统上实现了亚实时,这对于创建离线 ASR 应用程序的人们来说是个好消息。
以下是对比结果表:
好吧,我们对预先录制的声音样本进行了基准测试,但我们真的想做一些实时转录。让我们这样做吧!
从https://github.com/mozilla/DeepSpeech-examples下载 DeepSpeech 示例
导航到 mic_vad_streaming 并安装依赖项
pip3 install -r requirements.txt
sudo apt install portaudio19-dev
将麦克风连接到您的系统(我使用的是 Raspberry Pi 4 1 GB)。对于麦克风,尽管您可以使用任何麦克风,包括笔记本电脑的内置麦克风,但声音的质量确实对结果有很大影响。对于这个演示,我使用的是 Seeed Studio 的ReSpeaker USB 麦克风阵列。它支持 5m 远场拾音和 360° 拾音模式,并实现以下声学算法:DOA(到达方向)、AEC(自动回声消除)、AGC(自动增益控制)、NS (噪音抑制)。
python3 ../DeepSpeech-examples/mic_vad_streaming/mic_vad_streaming.py --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer
从包含模型的文件夹中执行此命令。-v 参数允许您调整 VAD(语音活动检测)的阈值。这是演示的结果。
好,太棒了!我们可以改进吗?是的。我们真的不希望我们的设备一直在转录对话。谈论隐私噩梦和浪费电力。
。
- Raspberry Pi支持电视上的视频通话
- 使用Google Coral和Raspberry Pi进行ML鸟类识别
- Raspberry Pi 4B+ IoT板上的并行计算变得简单
- Raspberry Pi Pico上的ADC采样和FFT
- 使用Bittle和Raspberry Pi 4的ROS SLAM
- 用Raspberry Pi的视觉识别事物
- 带Raspberry PI的红外遥控器
- 使用Raspberry Pi 4和RFID模块的考勤系统
- Raspberry Pi 0 W带温度传感器和LCD
- Raspberry Pi和Arduino上的手写数字识别
- 适用于Raspberry Pi 4的Raspberry Pi Pico开发板
- NRK330X语音识别芯片离线语音唤醒模块资料说明书!
- 树莓派Raspberry Pi 4 Model B的电路原理图免费下载 427次下载
- 《爱上Raspberry Pi》中译版-电子书籍.pdf 0次下载
- raspberry_pi各版本差别 0次下载
- 影响离线语音识别灵敏度的因素 565次阅读
- 离线语音控制技术特点 539次阅读
- 基于Raspberry Pi 5的蜂窝物联网项目 1312次阅读
- 使用Raspberry Pi Pico W和MicroPython开发物联网应用 2180次阅读
- 用于测试项目的4个最佳树莓派Raspberry Pi模拟器 6823次阅读
- 基于树莓派产品 Raspberry Pi微控制器板的优缺点 2984次阅读
- 如何从Raspberry Pi Pico的模数转换器捕获数据计算? 2772次阅读
- 基于Raspberry Pi Pico开发先进的家庭自动化系统 3004次阅读
- 基于在Raspberry Pi Zero W的基础上实现设计微型机器人 2251次阅读
- 微雪电子ZeroW| Raspberry Pi ZeroW主板简介 2618次阅读
- 微雪电子Raspberry Pi 3 Model主板简介 3145次阅读
- 微雪电子Raspberry Pi 3 Model扩展板简介 1667次阅读
- 微雪电子树莓派4代B|Raspberry Pi主板介绍 6488次阅读
- 利用Raspberry Pi构建存储和虚拟化时间序列数据 952次阅读
- 一文了解Raspberry Pi 4各项性能跑分 3w次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多