AI算法5秒钟就能克隆你的声音-电子发烧友网

今天，给大家介绍一个算法。

AI 算法 5 秒钟，就能克隆你的声音，你信吗？

听听这段音频，猜猜看是 AI 合成音，还是真人录音？

答案是：AI 合成。

这个人的原始声音在这里：

你给这个 AI 克隆声音的算法打几分？

录制一段音频，就可以根据输入的文字，5s 即可自动生成对应的合成音。

突然有个大胆的想法，你说女朋友要是哪天突然不承认自己说过了某句话，我就给她造一份！

兄弟们，我做的对吗？

MockingBird这个算法是基于比较著名的 Real Time Voice Cloning 实现的。

MockingBird 是最近开源的中文版。

论文的名字是：

Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis

简单介绍下：

算法分为三个模块：encoder模块、systhesis模块、vocoder模块。

encoder模块将说话人的声音转换成人声的数字编码（speaker embedding）

synthesis 模块将文本转换成梅尔频谱（mel-spectrogram）

vocoder模块将梅尔频谱（mel-spectrogram）转换成（波形）waveform

具体的算法原理，大家可以先看论文：

https://arxiv.org/pdf/1806.04558.pdf

今天主要聊聊，这个算法怎么玩。

项目地址：https://github.com/babysor/MockingBird

有深度学习基础的话，这个应该不难。

就是部署环境，分四步：

Anaconda 配置 Pytorch 开发环境

根据项目 requirements.txt 安装第三方库依赖

下载权重文件

下载训练集，这个几十G，有点大

具体的配置方法，直接看这里：

https://github.com/babysor/MockingBird/blob/main/README-CN.md

环境搭建搞定后，就可以运行代码了。

有两种模式可以启动，Web 模式和工具箱模式。

在项目根目录运行：

python web.py

即可开启 Web ，打开地址 http://localhost:8080 就能操作了。

这个界面比较简陋，建议使用工具箱模式。

python demo_toolbox.py -d 《datasets_root》

datasets_root就是下载好的数据集的地址。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

语音

语音

+关注

关注
3

文章
385

浏览量
38038
AI

AI

+关注

关注
87

文章
30887

浏览量
269066

原文标题：危险！我克隆了女朋友的声音

文章出处：【微信号：LinuxHub，微信公众号：Linux爱好者】欢迎添加关注！文章转载请注明出处。

Luma AI Ray 2视频模型即将发布

能够在短短10秒内，根据用户提供的文本和图像提示，生成高质量的视频内容。 Luma AI Ray 2视频模型是Luma AI为视频创作者量身打造的“视觉思维合作伙伴”。与前代模型相比，Ray 2不仅具备更强大的视频生成能力，而且

发表于 12-20 11:37 •216次阅读

TPA3110D2上电瞬间有输出，大概几s后没有声音输出，为什么？怎么解决？

十几秒，如果直接就是15V或者5V升压，几秒钟输出就没了，喇叭是4欧姆5W的，输出采用磁珠时会有输出但是声音很小也很杂，采用电感时声音正常，

发表于 10-31 07:23

使用PPS打通AIC3254播放电脑音乐，有4秒左右延时才有声音，为什么？

使用PPS打通AIC3254播放电脑音乐为何会有4秒左右延时才有声音？

发表于 10-25 06:21

TPA6112在静音时将6脚拉低，测量6脚电压已为0时，在关闭时间还有4秒钟的延时是什么原因？

请问如图所示，在静音时将6脚拉低，测量6脚电压已为0时，但功放关闭时间还有4秒钟的延时是什么原因？直接将6脚接低功放也还有4秒钟的声音才能关闭，此时声音会变小4

发表于 10-24 06:33

用TAS5630芯片做了一个2.1功放板，通电的音箱没声音，须要开机后再插音箱才会有声音，为什么？

有一秒钟的声音出现。如果单独只接低音炮，低音炮有声音，如果接2.1，则全部没有声音，我们不知道是什么缘故，另外如何排除，请工程师指导一下。

发表于 10-14 07:09

用TPA3112设计的一个音频功放电路，上电1-3秒后就没有声音输出了，怎么解决？

用TPA3112设计的一个音频功放电路输入采用差分的，后来把1个输入接地，变成了单端的了问题很奇怪接信号发生器，上电后，1-3秒内有音频输出，能够听到声音然后就没有声音了 FAULT输出低折腾了很久，望高手指点一二

发表于 10-12 07:17

旗晟机器人智慧AI算法#人工智能

AI算法

jf_57022734

发布于 :2024年07月18日 17:44:48

搜索历史

AI算法5秒钟就能克隆你的声音

评论

Luma AI Ray 2视频模型即将发布

TPA3110D2上电瞬间有输出，大概几s后没有声音输出，为什么？怎么解决？

使用PPS打通AIC3254播放电脑音乐，有4秒左右延时才有声音，为什么？

TPA6112在静音时将6脚拉低，测量6脚电压已为0时，在关闭时间还有4秒钟的延时是什么原因？

用TAS5630芯片做了一个2.1功放板，通电的音箱没声音，须要开机后再插音箱才会有声音，为什么？

用TPA3112设计的一个音频功放电路，上电1-3秒后就没有声音输出了，怎么解决？

旗晟机器人智慧AI算法#人工智能

平衡创新与伦理：AI时代的隐私保护和算法公平

ai大模型和算法有什么区别

基于深度学习的鸟类声音识别系统

云知声AIGC内容创作平台蓝藻AI全新升级

程序提取克隆芯片程序的优劣

PCBA电路板克隆开发流程

云知声全新推出AIGC内容创作平台蓝藻AI

AI克隆技术可用于创建虚拟人物形象！它的技术原理和发展趋势