0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI语音克隆技术,或是播客行业长久发展的终极解决方案

如意 来源:科技行者 作者:科技行者 2020-10-08 14:10 次阅读

播客行业正朝着更加轻松自然、非正式性的音频叙事方向发展。这种较少使用严肃用语的传播形式,也成功拉近了主播与听众间的沟通距离。

换句话说,主播们尽可能使用口语表达,降低表述内容的理解与反应难度。也正是凭借着这种通俗易懂优势,音频叙事变得越来越流行,相关调查数据也证明了这一发展趋势。

根据Statista公布的统计结果,2018年全美播客收听者已经达到7500万;预计到2024年,月收听用户将增长至1.64亿。由此估计,2019年至2023年之间播客听众的复合年增长率将高达17%。

2020年,四分之三的美国民众明确知晓播客为何物,其中超过半数(55%)的受访者已经开始收听播客。而作为全球收入最高的播客,乔·罗根(Joe Rogan)的《乔·罗根体验》(The Joe Rogan Experience)节目在2019年获得高达5000万美元销售额,月均下载近2亿次。

目前,播客行业面对的主要问题在于如何在维持内容独立性的同时,获取支持行业快速增长的必要资源。终于进入正题——人工智能等突破性技术带来的语音克隆功能,也许能够带来重要的解决手段,或者至少是部分解决方案。

以尼克松(Nixon)项目为例,其以令人信服的结果证明AI技术完全能够重现出与人类对象没有任何区别的语音效果。麻省理工学院的一组研究人员、新闻工作者及艺术家,同语音克隆厂商Respeecher及VDR公司Canny AI开展合作,共同创造出模拟得出的首次登月通话记录——只是这一次,宇航员阿姆斯特朗与奥德林未能完成任务,并被困在了月球上。

他们甚至还“伪造”了时任美国总统的尼克松的视频,向全世界宣告此次登月之旅的悲惨失败。

当播客遇上AI

计算机化语音的主要挑战,在于如何复制人类表达以及其中的种种细微差别,同时尽力避免机器音的存在。而在识别并重现细微声音变化元素方面,以人工智能为基础的语音转换技术为我们指明了一条可行的发展道路。

苹果Sir、Amazon Alexa、微软Cortana以及Google Assistant等语音助手仍在使用文本到语音转换技术。虽然这种技术的实用性确实很高,但却很难带来不同的语音类型。以Siri为例,要想实现老年男性的语音效果,除了需要引入庞大的预录制文件之外,Siri还无法处理该音频文件中未能包含的单词。在这方面,AI支持下的语音到语音转换就成了新的突破口。

如何将AI语音克隆应用于播客领域?

人工智能不仅能够实现语音克隆,还能够在任意播客节目中完美复制一切语音效果。其中使用的是一项名为“智能鸡尾酒”的经典数字信号处理算法,外加专用的深度生成建模技术——允许内容制作者使用最适合的声音解决以往难以实现的录制效果(例如播报员有其他工作,或者需要重现某位已经去世的配音演员的音色等)。

下面来看几种语音克隆技术在播客制作领域的可行用例:

1. 让名人加入您的节目

我们很难请到知名演员、作家、运动员等参与您的节目,但如果使用人工智能技术复制他们的声音,就可以既轻松实现同样的效果、又不必劳烦他们亲自到录音棚跑一趟。以此为基础,听众们能够听到自己喜爱的声音,节目制作方与名人们也省去了劳顿之苦。

2. 重现旧日之声

语音克隆能够让已经去世的演员们再次献声。想不想让肯尼迪总统为历史播客配上旁白?没有问题,语音转换技术能够精确重现他的声音——是的,不只是“相似”,而是真正的完美还原。

3. 使用童声朗读,又不用强迫孩子们长时间工作

孩子们讲话总是非常有趣,这种趣味性不一定体现在内容上,而更多在于他们的语音、语气和语调当中。但与孩子们一同工作可是相当费心费力。通过语音合成技术,我们可以让专业演员念出孩子的台词,再将其转换为童声效果,大大简化节目制作流程。

4. 快速推进节目制作进度,保证播客及时播出

AI可以瞬间重现人声,而且短时间内就可以提供高质量的目标语音成果。

总结

2017年,全球播客市场带来的广告收入高达2.2亿美元,且每年都在翻番。而用户参与度的提升,将成为吸引潜在广告客户的核心动力。更重要的是,播客中的广告其实效果极佳,调查显示此类广告拥有近90%的播放完成率。

此外,广告客户甚至愿意为某些播客节目支付 高达30美元的CPM(广告每千次展示成本)。单说这个数字大家可能没有概念,但Facebook上的每千次广告展示成本约为6美元。

网络电视正在缓慢但坚定地取代着有线电视,播客与传统广播之间的关系似乎也是这样。而单纯从传统广播类广告出发,播客行业至少还能够吸引到额外约200亿美元收入。而正如我们在文章开头提到,播客节目能够吸引到大量原本根本不听广播的群体,因此其利润增长期望可谓一片光明。

这些调查数字表明,播客业务将长久存在,同时也迫切需要音频内容制作者们找到效率更高、效果更好的节目产出方法。

也许AI语音克隆技术,正是帮助播客行业在内容独立性与节目制作资源需求间找到完美平衡的终极解决方案。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    29

    文章

    2839

    浏览量

    81378
  • 语音
    +关注

    关注

    3

    文章

    384

    浏览量

    37997
  • AI
    AI
    +关注

    关注

    87

    文章

    30252

    浏览量

    268489
收藏 人收藏

    评论

    相关推荐

    AI与HPC技术推动先进封装行业发展

    “随着人工智能(AI)和高性能计算(HPC)技术的迅猛发展,半导体行业也迎来了新的变革浪潮。”——这句话在2024年的今天,早已被喻为行业
    的头像 发表于 10-22 11:22 370次阅读

    赛富时将收购AI语音代理公司Tenyx

    科技巨头赛富时近日宣布了一项重要战略举措,正式达成收购人工智能语音代理公司Tenyx的协议。此次收购旨在进一步巩固赛富时在AI领域的领先地位,通过整合Tenyx的先进技术,加速其人工智能驱动
    的头像 发表于 09-04 16:30 368次阅读

    基于Realtek的智能语音服务解决方案

    最为著名的应用之一是语音助手。自从苹果推出SIRI以来,智能语音互动应用得到了迅猛发展。为满足这一趋势,瑞昱半导体(Realtek)推出了智能语音服务
    发表于 06-14 16:08 1次下载

    MK米方德的AI智能存储解决方案

    随着人工智能(AI技术的飞速发展,我们正步入一个前所未有的智能时代。AI不仅在改变着我们的生活方式,也在深刻影响着各行各业的发展。在众多领
    的头像 发表于 05-27 10:04 398次阅读
    MK米<b class='flag-5'>客</b>方德的<b class='flag-5'>AI</b>智能存储<b class='flag-5'>解决方案</b>

    广和通引领数字技术革命,推动行业创新与发展

    轮数字技术变革与融合的趋势,并率先采取行动,通过智能边缘计算、AI机器人、高性能低功耗无线通信等一系列解决方案,推动新质生产力的提升与可持续发展
    的头像 发表于 05-17 09:51 425次阅读

    USB AI话务语音降噪音频方案

    USB AI话务语音降噪音频方案
    的头像 发表于 04-25 18:16 540次阅读
    USB <b class='flag-5'>AI</b>话务<b class='flag-5'>语音</b>降噪音频<b class='flag-5'>方案</b>

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型

    数据基础设施峰会上华为正式发布四大AI创新解决方案,包括中心AI、边缘AIAI数据保护、AI
    发表于 04-15 12:32 400次阅读

    [技术干货] AI 助手全套开源解决方案,自带运营管理后台,开箱即用

    方案介绍 随着人工智能技术的不断发展和普及,越来越多的企业和个人开始关注和使用 AI 助手来提高工作效率和生活便利性。该解决方案基于
    的头像 发表于 04-05 23:23 1188次阅读
    [<b class='flag-5'>技术</b>干货] <b class='flag-5'>AI</b> 助手全套开源<b class='flag-5'>解决方案</b>,自带运营管理后台,开箱即用

    英伟达与ServiceNow合作推出通信行业专用生成式AI解决方案

    英伟达,全球知名的图形处理器(GPU)制造商,以及企业级IT服务管理和运营管理云端平台供应商ServiceNow,近日宣布将进一步深化合作,为通信行业推出专用的生成式AI解决方案。这一创新举措旨在通过先进的
    的头像 发表于 02-28 10:13 472次阅读

    深入探讨工业AI/ML技术发展趋势及相关解决方案

    芯科科技已经创建了一套完整的硬件和软件解决方案,可支持开发用于工业市场的工业AI/ML解决方案。具体来说,我们的Sub-GHz、蓝牙和802.15.4产品内置了硬件加速功能,可优化边缘的AI
    的头像 发表于 01-29 09:42 463次阅读

    宁畅推出电力行业解决方案

    近日,宁畅“智领能源,赋能未来”新能源行业研讨会在南京隆重举行。面向新型电力系统转型,宁畅带来电力行业解决方案,助推AI技术在能源领域的应用
    的头像 发表于 01-18 11:23 543次阅读

    AI克隆技术可用于创建虚拟人物形象!它的技术原理和发展趋势

    电子发烧友网报道(文/李弯弯)AI克隆技术主要指的是人工智能技术用于复制或克隆人类的行为、声音、形象等方面的技术。这种
    的头像 发表于 01-08 08:28 2616次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>克隆技术</b>可用于创建虚拟人物形象!它的<b class='flag-5'>技术</b>原理和<b class='flag-5'>发展</b>趋势

    AI技术在医疗保健产业的应用与发展

    人工智能(AI)已经是当前最热门的话题之一,随着AI技术的快速发展,应用面也越来越广泛。得益于AI相关
    的头像 发表于 12-14 15:56 806次阅读

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音技术的灵
    的头像 发表于 12-14 14:33 984次阅读

    语音数据集:推动AI语音技术的核心力量

    一、引言 随着人工智能的快速发展语音技术作为人机交互的重要手段,正发挥着越来越重要的作用。而语音数据集则是推动AI
    的头像 发表于 12-12 11:32 679次阅读