0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AndroidQ内置实时字幕功能解读 到底有多实用

454398 来源:工程师吴畏 2019-05-15 09:52 次阅读

在刚刚过去的 Google I/O 2019 上,Google展示了一项名为Live Caption(实时字幕)的新功能。它内置在Android Q中,可以将手机上播放的音频实时转化为字幕,适用于播客、视频网站、语音消息、本地拍摄视频等场景。

更厉害的是,Live Caption的处理过程全部都在手机本地完成,不需要上传到云端,既保证了速度,又保证了安全。Live Caption还有哪些强大之处?这篇文章向你完整介绍。

没网也能用,在本地进行处理

字幕的重要性可能超过了很多人的想象。在一般观众眼里,它是可有可无的选项,而对于听力障碍者,字幕是他们理解内容的重要工具,Live Caption正是为他们而设计。

在此之前,Google已经在YouTube中加入了自动字幕,然而世界上还有很多没有字幕的视频内容,对于听力障碍者来说,它们就像没有声音的默剧。

能不能给手机上的所有音频添加实时字幕?这成为了Google的下一个目标。经过多个团队的努力,这个方案终于被实现出来。

不过在最初,系统需要将音频上传到云端,然后运行一个2GB的机器学习模型,过程耗时又不安全。

后来,他们在手机终端实现了相同的处理效果,并且只需要运行一个80M的模型,它可以在手机联网时自动更新,然后在没网状态下完全离线运行。

Live Caption的优势主要有三个:第一,完全在本地运行,适用于所有场景;第二,数据不会上传到云端,保证数据安全;第三,内容创作者和应用开发者不需要做任何工作,就可以让用户体验到实时字幕。

系统级的实时字幕,支持所有应用

在Google的演示中,Live Caption可以在直播、视频网站、播客、拍摄的本地视频、社交媒体、语音消息等多种场景下使用。打开方式是点击音量键,点击实时字幕按钮。

随着音频的播放,画面中央会显示动态的实时字幕,你可以调整字幕条的显示大小,拖动它们到任意位置。更神奇的,即使在静音状态下Live Caption也能正常运行。

虽然Google主要强调了Live Caption对听力障碍者的作用,但其实它对普通用户也十分有用。

在看视频的同时开启字幕,可以更好地理解内容,Google将这个功能做到了系统底层,就意味着你可以在任何视频中开启字幕。另外在会议和地铁这样的特殊场景,你可以在不开启音频的情况下理解视频内容。

今年晚些时候推出

前几天我们给大家推荐了几个「自动加字幕」的工具,视频创作者可以利用它们来减轻工作负担。

不过Google的思路显然更加彻底,他们将实时字幕做成了系统级的功能,内容创作者和应用开发者不需要做任何工作,就能让用户随时体验到实时字幕。

这个功能集成在Android Q中,一旦普及就能方便大量用户。

目前Live Caption还无法在Android Q系统中进行体验。Android团队的Brian Kemler透露,它将在今年晚些时候推出。

由于对内存和空间有要求,Live Caption会首先出现在高端的Android Q设备上,之后将支持更多设备。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Android
    +关注

    关注

    12

    文章

    3926

    浏览量

    127161
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105118
收藏 人收藏

    评论

    相关推荐

    高铁站网约车数智出行到底有智能‌

    在当今这个科技飞速发展的时代,智能出行已成为我们日常生活中不可或缺的一部分,而高铁站网约车数智出行更是将这一理念推向了新的高度。那么,这种数智出行方式到底有智能呢? 首先,从预约叫车开始,高铁站网
    的头像 发表于 11-14 14:48 165次阅读

    RTOS与Linux到底有什么区别

    很多做嵌入式开发的小伙伴都存在这样的疑惑:RTOS与Linux到底有什么区别?
    的头像 发表于 10-29 09:53 342次阅读

    CMOS运放的输入阻抗到底有多高呢?

    都说CMOS运放输入阻抗高,到底有多高呢?可有一个量化指标?
    发表于 09-06 06:59

    求助,这个电路U1A运放同相端的R1电阻到底有什么作用啊?

    想问下这个电路U1A运放同相端的R1电阻到底有什么作用啊?很郁闷。
    发表于 08-27 07:09

    无人机智能巡检系统到底有哪些作用

    系统到底有哪些作用呢? 无人机智能巡检系统主要由无人机、无人机机库、AI算法、红外相机、红外传感器、无人机智能巡检平台等设备共同构成,这些设备能够实时收集并传输巡检图像和视频信息至系统后台,极大提升了巡检的效率和
    的头像 发表于 08-19 16:49 285次阅读
    无人机智能巡检系统<b class='flag-5'>到底有</b>哪些作用

    谷歌将优化安卓系统的实时字幕功能,用户可更改字幕行数

    Live Captions作为安卓系统的辅助工具,能自动识别并实时将音频转化为字幕。此功能对听力受损或环境嘈杂时难以理解内容的人群十分有用。
    的头像 发表于 05-30 14:28 587次阅读

    EWSTM8-2201 or 3101安装说明上有的说选“是”,有的说选“否”,二者到底有什么区别?对工程什么影响?

    the installation. ......... 安装说明上有的说选“是”,有的说选“否”,二者到底有什么区别?对工程什么影响?
    发表于 04-28 08:08

    谷歌Chrome浏览器实时字幕功能拓展至11种语言,覆盖简繁中文

    这款名为“提供音频和视频自动字幕生成”的功能,不仅能够实现设备间数据零泄漏,而且在IT之家当前所试用的最新稳定版Chrome浏览器环境下,其主要界面将显示为英文,但同时也兼容其他如法语、德语及意大利语的字幕
    的头像 发表于 03-05 14:32 1161次阅读

    谷歌模型软件哪些功能

    谷歌模型软件通常指的是谷歌推出的一系列人工智能模型和软件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌DeepMind团队开发的一款大型语言模型,旨在超越其之前的迭代
    的头像 发表于 03-01 16:20 615次阅读

    网线到底有多少种连接器

    我们在谈论网线的时候,聊得最多的,一定是它的连接器,它在连接过程中扮演着极为重要的角色。网线到底有多少种连接器?本期我们将从工业级使用出发,来看看这根似乎普通的网线,在连接器上有多么努力。
    的头像 发表于 01-26 10:06 573次阅读

    NUC123的USB外设到底有没有DMA功能

    下载最新的TRM 1.07: 在最先前的描述以及USB的寄存器章节都有DMA相关的内容。但是DMA那一章节里的框图没有USB外设。同时关于USB外设DMA的用法也没具体说明。所以USB外设到底有没DMA功能,若是该怎么用?
    发表于 01-16 08:26

    AD7280AWBSTZ和AD7280ABSTZ之间到底有什么区别?

    替代吗?在网上找到的两个芯片的相关数据都是一样的,AD7280AWBSTZ和AD7280ABSTZ之间到底有什么区别?
    发表于 01-08 06:36

    COB与SMD到底有什么不同?

    COB与SMD到底有什么不同?  COB和SMD是两种常见的电子元器件封装技术。它们在电子行业中被广泛应用,尤其在LED照明领域。虽然它们都用于将芯片连接到电路板上,但它们在封装技术和应用方面有一些
    的头像 发表于 12-29 10:34 1663次阅读

    母线槽与电缆到底有何区别?

    母线槽与电缆到底有何区别? 母线槽与电缆是电力传输中常见的两种设备,它们有着各自的特点和应用领域。下面将分别从使用范围、结构设计、传输能力、安装维护等方面详细介绍母线槽与电缆的区别。 一、使用范围
    的头像 发表于 12-26 14:02 1602次阅读

    到底有哪些原因会导致电枢绝缘阻值为零?

    对电机多大影响,现在这样用能安全使用多长时间,为什么电枢会是零呢,到底有哪些原因会导致电枢绝缘阻值为零?
    发表于 12-14 08:30