0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰TTS技术上线语音编辑功能

思必驰 来源:思必驰 2023-09-10 11:23 次阅读

“苏州街站到了,请带好随身物品准备下车。”

“巴沟站到了,请带好随身物品准备下车。”

——地铁语音播报编辑站名

随着人工智能技术的发展,智能语音已融入我们日常生活的方方面面。在人机共生的智能时代,让人机交互更自然、更流畅一直是人类不断探索的目标。

近期,思必驰TTS技术上线语音编辑功能。语音编辑,即在一段语音中间插入语音内容,或根据之前的语音风格续写,使得插入或续写的语音内容与之前的语音风格完美融合,带给用户更自然、流畅的语音服务体验。该技术可应用于自媒体语音修正,轨交、电商、快递、银行等行业中的智能客服语音播报场景,目前,思必驰语音编辑支持中文语音编辑及英文语音编辑。

语音编辑,像文本一样修改音频

点击下方音频,感受思必驰优化后的语音编辑效果

普通语音编辑,手机号部分能听出明显差异

思必驰语音编辑,手机号部分与原有音频自然融合

日常生活中,如音频中所展示的智能客服已被广泛应用于快递、银行、电商等行业场景中,为行业降本增效带来显著作用。厂商通过语音编辑技术,仅需对固定话术中的人名、数字等变量进行替换,便可获得针对不同用户的差异性播报语音,批量通知用户,大大提高了生产效率。

在语音编辑过程中,最大的挑战就是如何使得编辑后的语音接近原有音频的自然和流畅。情感的细微差别、语调变化、节奏等稍有不连贯,听众便能从中听出明显的语音差异。因此,为了让此类编辑后的语音播报更自然,人类不断优化语音合成技术水平。

点击试听思必驰语音编辑续写后的文本

原有音频风格

后半句为根据原有音频风格进行编辑续写

思必驰对语音编辑技术优化更新,应用深度合成技术,基于大模型实现零样本高质量语音编辑,可对中英文语音进行插入文本、根据之前风格续写等操作。经思必驰语音编辑后的语音更流畅、更自然,带给用户媲美原声的听觉体验。

适用各种场景,音频创作更高效

目前,语音编辑已经应用于快递、电商、银行等场景的智能客服以及自媒体短视频配音修正中,为各行各业带来更自然的语音服务。

智能客服固定话术修改变量

在快递、电商、银行、轨交等场景的智能客服中,常常需要用到固定话术,但与用户通话时,固定话术需要根据不同用户、场景对其中的变量进行修改。如:

应用场景

·张先生您好,请到楼下凭取件码123取件;

·王女士您好,您近日在我店铺购买的商品,如果满意请给5分好评;

·刘先生您好,您的信用卡还款日为8月15日,请记得及时还款;

·苏州街站到了,请带好随身物品准备下车;

·北京,天气晴转多云,气温25-30℃。

在此类语音播报中,应用思必驰语音编辑技术,可对固定话术中的人名、地名、数字、日期等变量进行编辑,从而快速获得接近原声的语音,满足不同用户、场景需求。

短视频修正录音口误

修正前音频

修正内容后音频

视频博主在视频创作过程中,视频素材往往有口误、词不达意或冗余的内容,此时,重新对某一句话进行配音,则很难还原当时的环境音,出现该句配音与其他音频存在些许差异的情况。如果对视频一帧一帧进行修改,则需要花费大量时间。在修改音频时,使用思必驰语音编辑技术,可对个别字词及冗余内容进行替换,替换后的字词可完美融入之前的语音环境,降低语音编辑前后的差异性,获得更自然、流畅的语音。

为了保证语音编辑技术合法使用,思必驰可通过声纹识别对用户上传的公众人物、敏感话题等音频进行屏蔽,拒绝编辑合成,保证技术安全。

除语音编辑外,思必驰声音复刻、本地合成、情感音色合成等多项语音合成技术都迎来更新,敬请期待!

未来,思必驰将基于DFM-2大模型,结合语音合成技术进行技术联动,为智能汽车、智能家居消费电子,以及金融、轨交、政务等数字政企行业场景客户带来更加自然、流畅的语音交互服务。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1206

    浏览量

    55380
  • TTS
    TTS
    +关注

    关注

    0

    文章

    41

    浏览量

    10787
  • 思必驰
    +关注

    关注

    4

    文章

    284

    浏览量

    14282
  • 短视频
    +关注

    关注

    1

    文章

    124

    浏览量

    8923

原文标题:语音编辑,让智能播报更自然,思必驰TTS技术上新第一更!

文章出处:【微信号:思必驰,微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    携手长城汽车入选2024年人工智能先锋案例集

    日前,中国人工智能产业发展联盟《2024年人工智能先锋案例集》正式发布,长城汽车与联合申报的“长城汽车Coffee Al语音助手”成功入选。
    的头像 发表于 11-26 17:56 917次阅读

    智能组合仪表全方位守护驾驶者的出行安全

    近日,瑞汽车旗下智能电动超级VAN——瑞EC75智驾超充版开启预售,这款车型搭载由打造的智能组合仪表,具备专业的ADAS 3D渲染
    的头像 发表于 11-24 15:08 612次阅读

    带来全新办公体验!发布AI办公本Turbo

    是基于千万小时的会议训练数据进行优化的。它能够实现手写输入、图像扫描、语音输入以及历史笔记文档的跨模态融合,从而极大地提升了用户在会议记录、整理等方面的效率。 智能笔记是AI办公
    的头像 发表于 11-06 11:30 495次阅读

    发布AI办公本Turbo,搭载专业级跨模态会议大模型

    近日,正式发布了其最新的AI办公本Turbo,该设备搭载了专业级的跨模态会议大模型。这一创新技术的引入,标志着
    的头像 发表于 10-31 17:03 474次阅读

    AI办公本Turbo重磅发布

    近日,AI办公本新品发布会如约而至,IOT事业部首席产品官马斌斌详细介绍了
    的头像 发表于 10-31 14:23 420次阅读

    10月份大事件盘点

    日前,省科技厅党组书记、厅长徐光辉一行在进行调研。董事长、CEO高始兴,副总裁李春梅
    的头像 发表于 10-30 15:01 341次阅读

    助力极氪7X上市,树立纯电SUV新标杆

    日前,极氪汽车旗下全新大五座纯电SUV——极氪7X正式上市。作为极氪汽车又一力作,极氪7X在设计、配置和技术上都展示了极氪品牌的积淀与创新。为极氪7X提供全链路智能
    的头像 发表于 10-14 14:12 310次阅读

    携手新一代哈弗H6共创智能出行新未来

    随着汽车行业迈入智能化的新时代,消费者对智能交互体验的期待也在不断提升。新一代哈弗H6搭载了由提供语音交互技术的Coffee OS 2
    的头像 发表于 09-18 11:37 450次阅读

    获得TISAX最高等级AL3级认证

    近日,经过充分的准备和严格的评审,科技股份有限公司已成功获得TISAX最高等级AL3级的认证标签,这一认证标志着
    的头像 发表于 07-25 10:49 618次阅读

    广西柳州的智能制造基地正式投入试运行

    近日,随着一台台智能智造设备的陆续进厂和调试完成,位于广西柳州的智能制造基地正式投入试运行。
    的头像 发表于 05-29 10:32 467次阅读

    AWE现场 | ×康佳:智能声控,视听随心

    (AWE2024)在上海新国际博览中心盛大开幕。展会现场,展台展示的康佳电视吸引了大批消费者和媒体记者的驻足。 作为国内知名品牌,康佳电视无论是在画质还是音质上都表现的非常出色。在
    的头像 发表于 03-18 12:15 343次阅读

    北汽研究总院与签署战略合作协议

    2月29日,北汽研究总院与科技股份有限公司(以下简称)签署战略协议,将依托各自优势,
    的头像 发表于 03-11 14:59 651次阅读

    为极氪007全面提升智舱空间流畅性

    近日,极氪宣布首款纯电豪华轿车极氪007正式上市,并于1月1日开启交付。新车将搭载由提供智能语音技术的ZEEKR 007 OS 6.0
    的头像 发表于 01-22 13:52 847次阅读

    完成新一轮首期两亿元融资

    科技股份有限公司(以下简称“”)完成新一轮首期两亿元融资,后续
    的头像 发表于 01-11 10:37 633次阅读

    语音算法与芯片的完美结合 人机交互

    TH1520芯片解决方案AISpeech深圳羲顿科技有限公司TH1520是深聪智能(
    的头像 发表于 12-29 11:43 995次阅读
    <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>驰</b><b class='flag-5'>语音</b>算法与芯片的完美结合 人机交互