如何使用TensorFlow Lite快速构建移动端声音分类应用-电子发烧友网

声音分类是机器学习任务中的一项，您向机器学习模型输入一些声音将其分类成预定义的类别，例如犬吠声、汽车鸣笛声等。目前，已有许多声音分类应用，检测非法砍伐活动、检测座头鲸的声音以更好地了解它们的自然行为。

测非法砍伐活动
https://v.youku.com/v_show/id_XMzQ4MTUxOTIxNg==.html?spm=a2hzp.8253869.0.0

检测座头鲸的声音
https://ai.googleblog.com/2018/10/acoustic-detection-of-humpback-whales.html

我们很高兴地宣布，现在 Teachable Machine 可用于训练您自己的声音分类模型，并可导出 TensorFlow Lite (TFLite) 格式模型。然后，您可以将 TFLite 模型集成到移动应用或物联网设备。这是快速运行声音分类的简便方式，分类之后，您可以在 Python 中探索构建生产模型，再将其导出到 TFLite。

Teachable Machine
https://teachablemachine.withgoogle.com/

模型架构

Teachable Machine 使用小型卷积模型对 1 秒音频样本进行分类。如上图所示，模型接收声谱图（通过傅里叶变换获取的声音的 2D 时频表示形式）。它首先会处理具有连续二维卷积层和最大池化层的声谱图。模型以多个全连接层结束，这些层与随机 dropout 层交错，用于减少训练过程中的过拟合。模型的最终输出是一个概率分数数组，要训练模型识别的每个声音类都有一个概率分数。

在 Python 中使用此方式训练您自己的声音分类模型，请查看此教程。

教程
https://tensorflow.google.cn/tutorials/audio/simple_audio

使用您自己的数据集训练模型

使用您自己的数据集训练声音分类模型有如下两种方式：

简单方式：连一行代码都不需要写，使用 Teachable Machine 收集训练数据，并且全部在浏览器中训练模型。这种方式适用于想通过交互方式快速构建原型的用户。

稳健方式：提前录制要用作训练数据集的声音，然后使用 Python 训练并认真地评估模型。当然，这种方法的自动化以及可重复性也高于简单方式。

使用 Teachable Machine 训练模型

Teachable Machine 是一款可用于创建训练数据集和训练多种机器学习模型的 GUI 工具，包括图像分类、姿态分类和声音分类。Teachable Machine 底层使用 TensorFlow.js 训练机器学习模型。您可以将训练的模型导出为 TensorFlow.js 格式，以在网络浏览器中使用，或者导出为 TensorFlow Lite 格式，以在移动应用或物联网设备中使用。

下面是训练模型的步骤：

前往 Teachable Machine(https://teachablemachine.withgoogle.com)网站

创建一个音频项目

为您想要识别的每个类别录制一些声音片段。每个类别只需要 8 秒的声音

开始训练。完成后，您就可以在实时音频源上测试您的模型

以 TFLite 格式导出模型

使用 Python 训练模型

如果录音长达几个小时或者有数十个类别，则在网络浏览器上训练声音分类可能耗时很长。在这种情况下，您可以提前收集训练数据集，将它们转换成 WAV 格式，然后使用此 Colab Notebook（包括将模型转换成 TFLite 格式的步骤）训练声音分类。Google Colab 提供免费的 GPU，帮助您大幅提升模型训练的速度。

Notebook
https://colab.research.google.com/github/tensorflow/tfjs-models/blob/master/speech-commands/training/browser-fft/training_custom_audio_model_in_python.ipynb

通过 TF Lite 将模型部署到 Android

在 TensorFlow Lite 声音分类模型训练完成后，您便可将其放到此 Android 示例应用中试用。只需按照以下步骤操作： 1. 从 GitHub 克隆示例应用：

git clone https://github.com/tensorflow/examples.git 2. 将声音分类 Android 应用导入 Android Studio。您可以在 lite/examples/sound_classification/android 文件夹中找到它。 3. 将模型（soundclassifier.tflite 和 labels.txt）添加到 src/main/assets 文件夹中，替换其中已有的示例模型。

4. 构建应用并将其部署到 Android 设备上。现在，您就可以实时对声音分类啦！

要将该模型集成到您自己的应用中，您可以将 SoundClassifier.kt 类从示例应用和已经训练的 TFLite 复制到您的应用。然后，您可以按如下方式使用该模型：

1. 从 Activity或 Fragment类初始化 SoundClassifier实例。

var soundClassifier: SoundClassifier soundClassifier = SoundClassifier(context).also { it.lifecycleOwner = context }

2. 开始从设备的麦克风捕获实时音频，并实时分类：

soundClassifier.start()

3. 作为可读类名称的映射接收实时分类结果，以及当前声音属于每个特定类别的概率。

let labelName = soundClassifier.labelList[0] // e.g. "Clap" soundClassifier.probabilities.observe(this) { resultMap -> let probability = result[labelName] // e.g. 0.7 }

未来计划

我们正在开发 iOS 版本的示例应用，它将于几周后发布。我们还会扩展 TensorFlow Lite Model Maker 以简化 Python 中声音分类的训练。敬请期待！

Model Maker
https://tensorflow.google.cn/lite/guide/model_maker

致谢

此项目由 Google 内部的多个团队联合开发。特别感谢：

Google Research：Shanqing Cai、Lisie Lillianfeld

TensorFlow 团队：Tian Lin

Teachable Machine 团队：Gautam Bose、Jonas Jongejan

Android 团队：Saryong Kang、Daniel Galpin、Jean-Michel Trivi、Don Turner

责任编辑：xj

原文标题：使用 TensorFlow Lite 快速构建移动端声音分类应用

文章出处：【微信公众号：TensorFlow】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8422

浏览量
132740
移动端

移动端

+关注

关注
0

文章
41

浏览量
4420
tensorflow

tensorflow

+关注

关注
13

文章
329

浏览量
60537
TensorFlow Lite

TensorFlow Lite

+关注

关注
0

文章
26

浏览量
642

原文标题：使用 TensorFlow Lite 快速构建移动端声音分类应用

文章出处：【微信号：tensorflowers，微信公众号：Tensorflowers】欢迎添加关注！文章转载请注明出处。

用TAS5711把一路声音分到两路输出，为什么在GDE生成的数组写进去对应的寄存器，滤波器并不起作用？

我用TAS5711 ，把一路声音分到两路输出，我想使用这个芯片做两路分频，想用CH1 的BQ1做滤波器。我软件上初始化声音出来了，但是我不知道为什么在GDE 生成的数组写进去对应的寄存器，滤波器

发表于 10-16 06:18

快速部署Tensorflow和TFLITE模型在Jacinto7 Soc

电子发烧友网站提供《快速部署Tensorflow和TFLITE模型在Jacinto7 Soc.pdf》资料免费下载

发表于 09-27 11:41 •0次下载

<b class='flag-5'>快速</b>部署<b class='flag-5'>Tensorflow</b>和TFLITE模型在Jacinto7 Soc

第四章：在 PC 交叉编译 aarch64 的 tensorflow 开发环境并测试

本文介绍了在 PC 端交叉编译 aarch64 平台的 tensorflow 库而非 tensorflow lite 的心酸过程。

发表于 08-25 11:38 •1134次阅读

第四章：在 PC 交叉编译 aarch64 的 <b class='flag-5'>tensorflow</b> 开发环境并测试

利用TensorFlow实现基于深度神经网络的文本分类模型

要利用TensorFlow实现一个基于深度神经网络（DNN）的文本分类模型，我们首先需要明确几个关键步骤：数据预处理、模型构建、模型训练、模型评估与调优，以及最终的模型部署（尽管在本文中，我们将重点放在前四个步骤上）。下面，我将

发表于 07-12 16:39 •885次阅读

TensorFlow是什么？TensorFlow怎么用？

TensorFlow是由Google开发的一个开源深度学习框架，它允许开发者方便地构建、训练和部署各种复杂的机器学习模型。TensorFlow凭借其高效的计算性能、灵活的架构以及丰富的工具和库，在学

发表于 07-12 16:38 •728次阅读

tensorflow和pytorch哪个好

：2015年由Google Brain团队发布。语言支持：主要使用Python，也支持C++、Java等。设计哲学：TensorFlow是一个端到端的机器学习平台，支持从研究到生产的所有阶段

发表于 07-05 09:42 •704次阅读

tensorflow简单的模型训练

TensorFlow开始，然后介绍如何构建和训练一个简单的神经网络模型。 1. 安装TensorFlow 首先，我们需要安装TensorFlow。T

发表于 07-05 09:38 •705次阅读

keras模型转tensorflow session

在这篇文章中，我们将讨论如何将Keras模型转换为TensorFlow session。 Keras和TensorFlow简介 Keras是一个高级神经网络API，它提供了一种简单、快速的方式来

发表于 07-05 09:36 •555次阅读

如何在TensorFlow中构建并训练CNN模型

在TensorFlow中构建并训练一个卷积神经网络（CNN）模型是一个涉及多个步骤的过程，包括数据预处理、模型设计、编译、训练以及评估。下面，我将详细阐述这些步骤，并附上一个完整的代码示例。

发表于 07-04 11:47 •971次阅读

TensorFlow的定义和使用方法

数据流图，从而简化机器学习模型的构建、训练和部署。自2015年11月开源以来，TensorFlow迅速成为数据科学家、软件开发者以及教育工作者广泛使用的工具，广泛应用于图像识别、自然语言处理、推荐系统等多个领域。本文将深入解读Tenso

发表于 07-02 14:14 •800次阅读

基于神经网络的呼吸音分类算法

架构以端到端的方式进行训练，以同时检测呼吸周期中的噪声，并将肺部声音分为几个类别，如：正常、喘息、爆裂或喘息和爆裂。换句话说，我们的模型它本身决定了它应该使用什么信息以及从什么时间点进行呼吸声

发表于 05-31 12:05

后摩智能助力中国移动构建算力网络

后摩智能助力中国移动构建算力网络，MWC展示边端大模型运行成果

发表于 03-14 14:48 •636次阅读

OpenHarmony 移植：build lite 编译构建过程

这些疑惑，会对 build lite 编译构建过程有个更深入的理解。 1、产品解决方案代码是如何被调用编译的在文件 buildliteBUILD.gn 配置文件中的构建目标 //build/

发表于 02-19 16:19 •974次阅读

基于TensorFlow和Keras的图像识别

TensorFlow和Keras最常见的用途之一是图像识别/分类。通过本文，您将了解如何使用Keras达到这一目的。定义如果您不了解图像识别的基本概念，将很难完全理解本文的内容。因此在正文开始之前

发表于 01-13 08:27 •840次阅读

如何使用TensorFlow构建机器学习模型

在这篇文章中，我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。

发表于 01-08 09:25 •1005次阅读

搜索历史

如何使用TensorFlow Lite快速构建移动端声音分类应用

评论

用TAS5711把一路声音分到两路输出，为什么在GDE生成的数组写进去对应的寄存器，滤波器并不起作用？

快速部署Tensorflow和TFLITE模型在Jacinto7 Soc

第四章：在 PC 交叉编译 aarch64 的 tensorflow 开发环境并测试

利用TensorFlow实现基于深度神经网络的文本分类模型

TensorFlow是什么？TensorFlow怎么用？

tensorflow和pytorch哪个好

tensorflow简单的模型训练

keras模型转tensorflow session

如何在TensorFlow中构建并训练CNN模型

TensorFlow的定义和使用方法

基于神经网络的呼吸音分类算法

后摩智能助力中国移动构建算力网络

OpenHarmony 移植：build lite 编译构建过程

基于TensorFlow和Keras的图像识别

如何使用TensorFlow构建机器学习模型