0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出免费Android服务,面向听力残障人士,支持超过70种语言

电子工程师 来源:YXQ 2019-04-29 11:15 次阅读

近日,谷歌邀请媒体在京举行视频电话会议,谷歌产品经理Sagar Savla介绍了Live Transcribe软件,这是一项免费的Android服务,通过将自动字幕技术融入日常会话,减少现实世界中的对话障碍。

据了解,通过自动语音识别技术 (ASR),计算机能够检测有声语言并将其现场转录为供阅读的文本,由Google云提供技术支持,Live Transcribe可以进行实时的对话字幕转录,支持超过70种语言,覆盖全球80%以上的人口。

Sagar Savla表示,虽然依靠云ASR能为我们提供更高的准确性,但Google希望可以减少Live Transcribe所需的网络流量消耗。为此,Google在先前AudioSet的工作基础上,实现了基于神经网络的设备语音检测器。该网络是一种图像式模型,类似于我们之前发布的VGGish模型,它可以检测语音并自动管理与云ASR引擎的网络连接,将长时间使用过程中的数据流量消耗降至最低。

在技术呈现方面,Google曾考虑了几种不同的模式:计算机、平板电脑智能手机、小型投影仪,以迭代方式显示听觉信息和字幕。最后,Sagar Savla的团队决定专注于智能手机模式,因为这类设备无处不在且功能日益强大。

资料显示,世界卫生组织预计,到2055年全球将有九亿人听力受损。谷歌的这项软件可以为他们带去便利。目前该软件在亚洲已经非常流行。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Android
    +关注

    关注

    12

    文章

    3927

    浏览量

    127164
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105125

原文标题:谷歌解读免费实时转录软件:面向听障人士 支持70种语言

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌推出Gemini大型语言模型

    够协助用户完成诸如收集研究资料、购买产品或预订航班等各种日常任务,从而极大地提升用户的生活便捷性和效率。通过智能分析用户的浏览行为和需求,该项目将为用户提供个性化的建议和服务,使用户能够更加轻松地完成各种任务。 此外,知情人士还透露,
    的头像 发表于 10-29 15:11 305次阅读

    Orin芯片的编程语言支持

    Orin是一款高度集成、高性能的车载计算平台,由英伟达推出,并采用了英伟达自家的Volta架构GPU和其他高级处理器技术。关于Orin芯片的编程语言支持,可以从以下几个方面进行介绍: 一、主要编程
    的头像 发表于 10-27 16:45 202次阅读

    谷歌开始推送Android 15稳定版

    近日,谷歌正式向Pixel系列设备推送了Android 15稳定版操作系统。目前,已有部分Pixel设备率先完成了系统升级,预计本周晚些时候,更大规模的更新推送将全面展开。
    的头像 发表于 10-17 16:12 662次阅读

    沃达丰与谷歌深化十年战略合作

    沃达丰近日宣布,其与全球科技巨头谷歌的战略合作伙伴关系得到了进一步深化。这一为期十年的协议,总价值超过10亿美元,旨在将谷歌最新推出的生成式人工智能
    的头像 发表于 10-09 16:22 232次阅读

    鸿蒙原生应用元服务开发-初识仓颉开发语言

    仓颉编程语言是一面向全场景应用开发的通用编程语言,可以兼顾开发效率和运行性能,并提供良好的编程体验,主要具有如下特点: 语法简明高效 :仓颉编程
    发表于 08-15 10:00

    谷歌宣布对Android设备流媒体服务进行重大扩展

    8月8日,谷歌宣布对其Android设备流媒体服务进行重大扩展,此举旨在进一步赋能开发者,让他们能够远程接入并测试更多品牌及型号的真实Android物理设备。自2014年该
    的头像 发表于 08-08 16:30 657次阅读

    鸿蒙原生应用元服务开发-初识仓颉开发语言

    仓颉编程语言是一面向全场景应用开发的通用编程语言,可以兼顾开发效率和运行性能,并提供良好的编程体验,主要具有如下特点: 语法简明高效 :仓颉编程
    发表于 07-30 17:49

    谷歌将于明年8月25日终止goo.gl短链服务

    谷歌公司近日宣布了一项重要决定,将于2025年8月25日正式停止对短链服务goo.gl的解析支持。这一变动标志着谷歌自2009年推出并广受欢
    的头像 发表于 07-22 15:41 611次阅读

    谷歌Gemma 2大语言模型升级发布,性能与安全性双重飞跃

    近日,谷歌面向全球科研界与开发者群体隆重推出了全新升级的Gemma 2大语言模型,标志着人工智能技术在语言处理领域的又一次重大进步。此次发布
    的头像 发表于 07-02 10:20 472次阅读

    谷歌发布新型大语言模型Gemma 2

    在人工智能领域,大语言模型一直是研究的热点。近日,全球科技巨头谷歌宣布,面向全球研究人员和开发人员,正式发布了其最新研发的大语言模型——Gemma 2。这款模型以其高效能和低成本的特点
    的头像 发表于 06-29 09:48 412次阅读

    OpenAI推出ChatGPT新功能:连接微软OneDrive谷歌Drive云盘服务

    据5月17日消息,Kristi Hines发布推文透露,OpenAI为企业客户量身打造了ChatGPT全新版的“Connect Apps”,支持与微软OneDrive及谷歌Drive云盘服务的无缝对接。
    的头像 发表于 05-17 10:21 519次阅读

    谷歌明年6月停用Google Fit API,转用Android Health平台

    自 2022 年起,谷歌加大了对 Android Health 平台的投入力度,以期实现平台统一性以及简化开发流程。公告指出,谷歌正逐步将 Fit 开发服务纳入
    的头像 发表于 05-06 11:27 460次阅读

    高通和谷歌宣布推出面向搭载骁龙的Windows PC的优化版Chrome浏览器

    高通技术公司和谷歌今日宣布,即日起推出面向搭载骁龙的Windows PC的优化版Chrome浏览器,先于2024年年中即将发布的搭载骁龙®X Elite计算平台的PC面市。
    的头像 发表于 03-27 14:05 549次阅读

    谷歌模型软件有哪些功能

    谷歌模型软件通常指的是谷歌推出的一系列人工智能模型和软件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌DeepMind团队开发的一款大型
    的头像 发表于 03-01 16:20 616次阅读

    谷歌Android 15开发者预览版遇问题,OTA更新暂停

    谷歌Android Developer官网发表声明,因发现“已知问题”,将暂时关闭Android 15 DP1的OTA更新订阅服务谷歌
    的头像 发表于 02-21 14:08 634次阅读