0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软智能语音实现技术升级,新增了5 个声音角色

工程师邓生 来源:IT之家 作者:玄隐 2020-12-11 18:03 次阅读

12月11日消息 近期,微软智能语音实现技术升级,一次性新增了 5 个声音角色供用户自由选择,覆盖男女声和不同年龄段,以及不同性格和声线特征,包括阳光活泼的男青年(云希)和独立自信的女青年(晓萱),温柔大方的女中青年(晓涵)和多才多艺的女青年(晓墨),以及成熟睿智的女中老年(晓睿)。另外,中年男声(云野)也同步更新了多种声音风格。他们与此前多个声音角色一起,共同组成了微软丰富的中文智能语音 “家族”。

下面是新增以及更新角色声音 demo:

类似人类主播在播讲一个有声小说时会模拟不同的角色,微软最新的智能语音也支持声线变换,一人模拟多个角色,比如女生扮演男生,年轻人扮演老人的声音,做到 “声随境转”,大秀声音 “演技”。同时,不同的声线变化也包含多种情感变换,让角色更加活灵活现。

正是基于这些丰富多样且功能强大的声音角色,用户得以自由组合出丰富的音频产品

IT之家获悉,这些新声音在开发过程中采用了最新的迁移学习技术,仅利用少量表现力语料数据,便可以训练出具有高质量、高自然度表现力语音生成能力的源模型。该源模型通过对人类语音表现力特征的深入挖掘,获取了稳定性高,适应性强的语音情感表征,极大地丰富了合成语音的表现力与可控性。微软还进一步构建了基于角色和风格变换的隐式表达空间,可以灵活地将多个不同的角色和风格适应到一个新的表现力丰富的说话人模型。

目前,微软语音合成多角色可应用在有声书、儿童故事、新闻串讲等多种场景,满足不同的产品矩阵。

对于音频内容产业而言,微软此次语音合成多角色技术更新不仅令声音风格更为多样且具有感染力,也将进一步降低音频内容生产成本、提高制作速度和质量。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6573

    浏览量

    103965
  • 声音
    +关注

    关注

    0

    文章

    22

    浏览量

    16231
  • 智能语音
    +关注

    关注

    10

    文章

    781

    浏览量

    48714
收藏 人收藏

    评论

    相关推荐

    离线语音实现智能家居的无缝互操作

    在今天,“会说话”的公共设施正逐步渗透进我们生活的每一角落,预示着未来每一空间都将成为智能语音的赛道,至少拥有一可进行
    的头像 发表于 11-15 01:02 173次阅读
    离线<b class='flag-5'>语音</b>:<b class='flag-5'>实现</b><b class='flag-5'>智能</b>家居的无缝互操作

    离线语音实现智能家居的无缝互操作

    智能语音智能家居新增长点,离线语音技术解决网络等问题,广泛应用于家居、TOB领域。NRK系列芯
    的头像 发表于 11-14 10:56 171次阅读
    离线<b class='flag-5'>语音</b>:<b class='flag-5'>实现</b><b class='flag-5'>智能</b>家居的无缝互操作

    微软Copilot Studio新功能:支持定制Agent 赋能用户构建自主智能

    微软宣布重大更新,用户可通过Microsoft Copilot Studio构建自主智能体。麦肯锡、汤森路透等全球知名企业己利用智能体,实现
    的头像 发表于 11-10 09:59 509次阅读
    <b class='flag-5'>微软</b>Copilot Studio新功能:支持定制Agent 赋能用户构建自主<b class='flag-5'>智能</b>体

    微软发布智能办公工具OfficePLUS V 3.0版本

    近日,微软发布智能办公工具 OfficePLUS V 3.0 版本。全新升级的 OfficePLUS V 3.0 新增
    的头像 发表于 06-27 09:26 702次阅读

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术
    的头像 发表于 05-23 15:14 359次阅读

    微软网页版PPT新增语音识别及字幕生成功能

    据报道,微软计划于今年六月份推出网页版PowerPoint全新语音识别功能。此项功能将能够监控PowerPoint视频中的声音,进而自动生成字幕。
    的头像 发表于 05-16 14:36 373次阅读

    **十万级口语识别,离线自然说技术,让智能照明更懂你**

    随着人工智能技术的普及,智能家居设备开始走进千家万户。而智能照明系统作为其不可或缺的一部分,占据着举足轻重的地位。 所谓智能照明,就是通过语音
    发表于 04-29 17:09

    JXW56语音芯片,智能家居安全新升级

    智能升级烟雾语音IC
    的头像 发表于 04-28 10:48 304次阅读

    语音IC-智能语音芯片方案-您身边的智选升级

    语音IC方案开发-智能语音升级OTP开发应用场景
    的头像 发表于 04-12 17:00 454次阅读

    车内语音识别技术智能驾驶中的应用与前景

    一、引言 随着智能驾驶技术的快速发展,车内语音识别技术逐渐成为智能驾驶领域的研究热点。语音识别
    的头像 发表于 02-19 11:46 766次阅读

    语音合成技术智能驾驶中的创新与应用

    一、引言 随着智能驾驶技术的不断发展,人机交互变得越来越重要。语音合成技术作为人机交互的重要手段,在智能驾驶中发挥着越来越重要的作用。本文将
    的头像 发表于 02-01 18:09 605次阅读

    语音数据集:智能语音技术的燃料与推动力

    随着人工智能技术的不断进步,语音技术作为人机交互的重要方式,正在逐渐渗透到我们的日常生活中。而语音数据集作为智能
    的头像 发表于 12-29 11:11 383次阅读

    语音数据集:开启智能语音技术的新篇章

    随着人工智能技术的飞速发展,语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据
    的头像 发表于 12-29 11:06 641次阅读

    WT588F02KD-24SS语音芯片集成数码管显示驱动算法:声音播放提示的智能升级

    语音技术的不断发展中,一颗新型的WT588F02KD-24SS语音芯片引起了广泛关注,其特色在于集成了可直接调用的数码管显示驱动算法。本文将深入探讨这一创新技术的好处,以及它对
    的头像 发表于 12-15 08:38 351次阅读
    WT588F02KD-24SS<b class='flag-5'>语音</b>芯片集成数码管显示驱动算法:<b class='flag-5'>声音</b>播放提示的<b class='flag-5'>智能</b><b class='flag-5'>升级</b>

    唯创知音WTR096A-16S语音芯片:引领喊话器声音还原新时代

    随着科技的不断发展,声音在各种场景中扮演着至关重要的角色。在喊话器领域,唯创知音的WTR096A-16S语音芯片以其卓越的性能和声音还原度的提高,为喊话器应用带来了全新的体验。1.
    的头像 发表于 12-06 09:26 563次阅读
    唯创知音WTR096A-16S<b class='flag-5'>语音</b>芯片:引领喊话器<b class='flag-5'>声音</b>还原新时代