0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Python在音频(Audio)领域中,如何进行数据扩充呢?

机器学习算法与人工智能 来源:未知 作者:李倩 2018-04-15 10:35 次阅读

Python音频的数据扩充

经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类效果。在深度学习的图像领域中,通过平移、 翻转、加噪等方法进行数据扩充。但是,在音频(Audio)领域中,如何进行数据扩充呢?

音频的数据扩充,主要有以下四种方式:

音频剪裁(Clip)

音频旋转(Roll)

音频调音(Tune)

音频加噪(Noise)

音频解析基于librosa音频库;矩阵操作基于scipy和numpy科学计算库。

以下是Python的实现方式

01

音频剪裁

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/love_illusion.mp3")

# 读取音频print y.shape, sr wavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])

# 写入音频

02

音频旋转

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 读取音频ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)

# 写入音频

03

音频调音

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 读取音频ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)

# 写入音频

04

音频加噪

import librosa

from scipy.io import wavfile

import numpy as np

y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 读取音频wn = np.random.randn(len(y)) y = np.where(y != 0.0, y + 0.02 * wn, 0.0)

# 噪声不要添加到0上!print y.shape, sr wavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)

# 写入音频

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    29

    文章

    2825

    浏览量

    81139
  • python
    +关注

    关注

    54

    文章

    4763

    浏览量

    84339

原文标题:Python音频的数据扩充

文章出处:【微信号:machinelearningai,微信公众号:机器学习算法与人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    labview中如何进行数据存储?

    labview中如何进行数据存储?
    发表于 07-26 09:19

    请问问手机与电脑之间没有网络的情况下如何进行数据传输!

    请问问手机与电脑之间没有网络的情况下如何进行数据传输!
    发表于 05-31 21:15

    HX711如何进行数据处理?

    HX711如何进行数据处理?
    发表于 11-21 22:03

    利用Python进行数据分析之时间序列基础

    《利用Python进行数据分析》 112时间序列基础
    发表于 03-20 09:30

    如何利用Python进行数据分析

    《利用Python进行数据分析》 122高阶GroupBy应用
    发表于 04-23 07:29

    何进行数字信号处理?有哪几个基本步骤

    数字信号处理是如何定义的?如何进行数字信号处理?有哪几个基本步骤
    发表于 06-22 06:46

    串口通信中外设与开发板串口通信是如何进行数据传输的?

    串口通信中外设与开发板串口通信是如何进行数据传输的?使用外设时怎样将外设的数据返回给开发板
    发表于 07-07 07:58

    STM32 USART串口是如何进行数据处理的

    STM32 USART串口接收数据的具体步骤有哪些?STM32 USART串口是如何进行数据处理的
    发表于 11-25 08:56

    PC机的串口调试助手与STM32是如何进行数据收发的

    怎样通过PC机的串口调试助手将数据发送至STM32?PC机的串口调试助手与STM32是如何进行数据收发的?
    发表于 12-09 07:17

    什么是信号处理?如何进行数字信号处理

    什么是信号处理?如何进行数字信号处理我们的周围存在着为数众多的"信号"。如:从茫茫宇宙中的天体发出的微弱电波信号,移动电话发出
    发表于 03-06 10:13 3316次阅读

    Python信息安全领域中的运用

    Python信息安全领域中的运用
    发表于 09-07 09:51 27次下载
    <b class='flag-5'>Python</b><b class='flag-5'>在</b>信息安全<b class='flag-5'>领域中</b>的运用

    数据库教程之如何进行数据库设计

    本文档的主要内容详细介绍的是数据库教程之如何进行数据库设计内容包括了:1 数据库设计概述 ,2 数据库需求分析 ,3 数据库结构设计 ,4
    发表于 10-19 10:41 21次下载
    <b class='flag-5'>数据</b>库教程之如<b class='flag-5'>何进行数据</b>库设计

    数据库系统概论之如何进行数据库编程的资料概述

    本文档的主要内容详细介绍的是数据库系统概论之如何进行数据库编程的资料概述主要内容包括了:1、嵌入式SQL 2、存储过程3、ODBC编程
    发表于 11-15 15:12 13次下载
    <b class='flag-5'>数据</b>库系统概论之如<b class='flag-5'>何进行数据</b>库编程的资料概述

    风格迁移中如何进行数据增强

    这是一篇关于风格迁移中如何进行数据增强的论文。introduction部分,informal--formal 的风格迁移问题,最大的障碍是训练数据的不足。为了解决此问题,本篇论文提出三种数据
    的头像 发表于 01-13 09:41 2485次阅读

    蓝牙midi和蓝牙音频或者蓝牙audio有什么区别

    、什么是蓝牙midi,这个一般问这个问题的人,基本都懂,蓝牙midi实际就是标准midi协议的基础上扩充为无线连接而已,原先的midi是靠usb传输,现在换成蓝牙 3、什么是蓝牙audio,这个就更简单了,蓝牙音箱或者蓝牙耳
    的头像 发表于 01-09 15:22 1083次阅读
    蓝牙midi和蓝牙<b class='flag-5'>音频</b>或者蓝牙<b class='flag-5'>audio</b>有什么区别<b class='flag-5'>呢</b>