0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI语音服务新增7种语言和31种声音

电子那些事儿 2019-03-01 10:37 次阅读

2月24日消息,为了扩展AI语音服务的市场,谷歌除了加强语音辨识模型、语言支持数量和声音种类之外,也调整了语音服务的价格。

谷歌更新文字转语音和语音转文字服务,除了优化语音辨识模型、新支持7种语言和31种声音之外,也调整了语音服务的价格,在特定的应用情境中,用户最多可以省下约50%的支出,而谷歌也提供每月前60分钟免费的语言转文字服务。

谷歌指出,语音辨识和生成技术在人机互动的应用中非常关键,要让人机互动更加自然、简单且普遍,并不容易,即便使用准确度高达90%的语音辨识模型,还是很难真正达到有效的对话,由于许多企业的语音辨识模型都是要在电话中运行,受到噪音的干扰,产生的文字资讯让模型难以处理,谷歌于去年4月针对这种应用场景推出电话和影片的语音转文字服务。

经过不断优化,现在电话的文字错误已降低了62%,而影片的语音转文字模型错误率也降低了64%,除此之外,影片的语音转文字模型在辨识多个说话者的情境中,像是会议或是广播,也有很好的表现。

在价格方面,为了吸引更多用户,谷歌将影片语音转文字模型收费调降了25%,而在标准和影片模型服务中,选择加入资料收集计画的用户,收费价格会减少33%,因此,若使用影片模型且选择加入收集资料计画的用户,将能够减少约50%的支出。

此外,支持的语言也是企业使用语音转文字辨识模型的一大考量,现在谷歌新增了7个语言和方言,包含丹麦语、葡萄牙语、俄语、波兰语、斯洛伐克语、乌克兰语和挪威语,加上上述新增的语言,目前总共支持持21种语言,这些新增的语言都还是测试版。在语音生成模型方面,谷歌的语音生成系统WaveNet也新增了31种声音,目前总共有包含21种语言的57种声音。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    串口屏支持哪些编程语言和开发环境?

    串口屏作为一常用的显示和交互设备,支持多种编程语言和开发环境。以下是对串口屏支持的编程语言和开发环境的详细归纳:
    的头像 发表于 11-13 11:45 146次阅读
    串口屏支持哪些编程<b class='flag-5'>语言和</b>开发环境?

    HarmonyOS NEXT应用元服务开发Intents Kit(意图框架服务)技能调用方案概述

    一、概述 技能调用是意图框架依托系统AI多模态大模型能力做深度用户输入理解,并通过解析的用户意图对接应用或元服务内的功能和内容。 二、场景体验 用户通过对小艺对话进行自然语言输入实现内容查询,知识
    发表于 11-08 15:38

    MCU编程语言和开发环境介绍

    微控制器单元(Microcontroller Unit,简称MCU)是嵌入式系统的核心,广泛应用于各种电子产品中。随着技术的发展,MCU编程语言和开发环境也在不断进步,以适应不同的应用需求。 1.
    的头像 发表于 11-01 11:51 460次阅读

    C语言和C++中结构体的区别

    同样是结构体,看看在C语言和C++中有什么区别?
    的头像 发表于 10-30 15:11 133次阅读

    什么是AI服务器?AI服务器的优势是什么?

    AI服务器是一专门为人工智能应用设计的服务器,它采用异构形式的硬件架构,通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合来满足高吞吐量互联的需求,为自然
    的头像 发表于 09-21 11:43 596次阅读

    谷歌推出Gemini Live,开启AI语音聊天新纪元

    在万众瞩目的Pixel 9系列手机发布会上,谷歌震撼宣布了一项创新服务——Gemini Live,该服务自今日起,率先向使用英语的Gemini Advanced订阅用户敞开大门。这一举措标志着
    的头像 发表于 08-15 17:29 679次阅读

    nlp神经语言和NLP自然语言的区别和联系

    神经语言(Neuro-Linguistic Programming,NLP) 神经语言是一心理学方法,它研究人类思维、语言和行为之间的关系。NLP的核心理念是,我们可以通过改变我们的
    的头像 发表于 07-09 10:35 701次阅读

    语音识别和自然语言处理的区别和联系

    Recognition) 1. 定义 语音识别,又称为自动语音识别(Automatic Speech Recognition, ASR),是指将人类的语音信号转换为计算机可识别的文本信息的过程。它是一
    的头像 发表于 07-05 10:09 1398次阅读

    PLC编程语言和C语言的区别

    在工业自动化和计算机编程领域中,PLC(可编程逻辑控制器)编程语言和C语言各自扮演着重要的角色。尽管两者都是编程语言,但它们在多个方面存在显著的区别。本文将从多个维度深入探讨PLC编程语言和
    的头像 发表于 06-14 17:11 2474次阅读

    三星Galaxy AI将支持19语言,覆盖粤语及法语等

     截止当前,三星Galaxy AI共支持13个语言,此举将让全球更多三星用户享受到该产品的便利。此外,三星计划至今年底再增加对罗马尼亚语、土耳其语等8语言的支持。
    的头像 发表于 04-15 15:56 954次阅读

    谷歌Pixel 8将采用Gemini Nano模型,新增两项AI功能

    谷歌披露,Pixel 8 在配备 Gemini Nano 后,首先将增加两大创新 AI 功能:其中之一是 Recorder 应用内新增 Summarize 功能,无网络情况下可记录并归纳更多关于对话、采访和演示的有用信息。
    的头像 发表于 03-29 15:46 546次阅读

    plc编程语言与c语言的联系 c语言和PLC有什么区别

    PLC编程语言与C语言的联系 PLC(可编程逻辑控制器)是一针对自动化控制系统的特殊计算机。PLC编程语言是为了控制和管理自动化生产过程中的各种设备而设计的。与之相比,C
    的头像 发表于 02-05 14:21 3840次阅读

    vb语言和c++语言的区别

    VB语言和C++语言是两不同的编程语言,虽然它们都属于高级编程语言,但在设计和用途上有很多区别。下面将详细比较VB
    的头像 发表于 02-01 10:20 2047次阅读

    labview声音采集与处理

    LabVIEW是一用于数据采集与处理的编程语言和开发环境。它具有强大的声音采集和处理功能,可以帮助用户实现声音信号的采集、分析和处理。本文将详细介绍LabVIEW在
    的头像 发表于 01-04 10:48 2167次阅读

    如何选择创建c语言和c++

    选择创建 C 语言和 C++ 都需要综合考虑多个因素。在决定使用哪种语言之前,我们需要对这两语言的特点、优缺点、适用场景、学习成本等进行全面的了解和对比。下面是关于选择创建 C
    的头像 发表于 11-27 15:58 566次阅读