0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AndroidQ内置实时字幕功能解读 到底有多实用

454398 来源:工程师吴畏 2019-05-15 09:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在刚刚过去的 Google I/O 2019 上,Google展示了一项名为Live Caption(实时字幕)的新功能。它内置在Android Q中,可以将手机上播放的音频实时转化为字幕,适用于播客、视频网站、语音消息、本地拍摄视频等场景。

更厉害的是,Live Caption的处理过程全部都在手机本地完成,不需要上传到云端,既保证了速度,又保证了安全。Live Caption还有哪些强大之处?这篇文章向你完整介绍。

没网也能用,在本地进行处理

字幕的重要性可能超过了很多人的想象。在一般观众眼里,它是可有可无的选项,而对于听力障碍者,字幕是他们理解内容的重要工具,Live Caption正是为他们而设计。

在此之前,Google已经在YouTube中加入了自动字幕,然而世界上还有很多没有字幕的视频内容,对于听力障碍者来说,它们就像没有声音的默剧。

能不能给手机上的所有音频添加实时字幕?这成为了Google的下一个目标。经过多个团队的努力,这个方案终于被实现出来。

不过在最初,系统需要将音频上传到云端,然后运行一个2GB的机器学习模型,过程耗时又不安全。

后来,他们在手机终端实现了相同的处理效果,并且只需要运行一个80M的模型,它可以在手机联网时自动更新,然后在没网状态下完全离线运行。

Live Caption的优势主要有三个:第一,完全在本地运行,适用于所有场景;第二,数据不会上传到云端,保证数据安全;第三,内容创作者和应用开发者不需要做任何工作,就可以让用户体验到实时字幕。

系统级的实时字幕,支持所有应用

在Google的演示中,Live Caption可以在直播、视频网站、播客、拍摄的本地视频、社交媒体、语音消息等多种场景下使用。打开方式是点击音量键,点击实时字幕按钮。

随着音频的播放,画面中央会显示动态的实时字幕,你可以调整字幕条的显示大小,拖动它们到任意位置。更神奇的,即使在静音状态下Live Caption也能正常运行。

虽然Google主要强调了Live Caption对听力障碍者的作用,但其实它对普通用户也十分有用。

在看视频的同时开启字幕,可以更好地理解内容,Google将这个功能做到了系统底层,就意味着你可以在任何视频中开启字幕。另外在会议和地铁这样的特殊场景,你可以在不开启音频的情况下理解视频内容。

今年晚些时候推出

前几天我们给大家推荐了几个「自动加字幕」的工具,视频创作者可以利用它们来减轻工作负担。

不过Google的思路显然更加彻底,他们将实时字幕做成了系统级的功能,内容创作者和应用开发者不需要做任何工作,就能让用户随时体验到实时字幕。

这个功能集成在Android Q中,一旦普及就能方便大量用户。

目前Live Caption还无法在Android Q系统中进行体验。Android团队的Brian Kemler透露,它将在今年晚些时候推出。

由于对内存和空间有要求,Live Caption会首先出现在高端的Android Q设备上,之后将支持更多设备。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Android
    +关注

    关注

    12

    文章

    4035

    浏览量

    134480
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111969
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    单轴/轴 Trinamic 电机驱动模块怎么选?

    最近有工程师朋友在后台问我们:“同样是Trinamic电机驱动模块,单轴和到底有什么不同?我的设备到底该选哪一种?”这个问题问得很到位。其实,单轴和轴模块并没有绝对的“谁更好”,
    的头像 发表于 03-26 13:47 177次阅读
    单轴/<b class='flag-5'>多</b>轴 Trinamic 电机驱动模块怎么选?

    到底有小?

    想知道硅到底有小;CPU 并不比 Wii 上的百老汇芯片大,但功能却无限强大,哈哈。
    发表于 03-25 06:51

    5G SA和NSA到底有啥不一样

    平时刷手机,只要稍微留意过 5G 设备或者运营商的信息,SA 和 NSA 这两个词应该不陌生。大家也知道它们跟 5G 有关,但真要问起它俩到底有什么区别,好像一下子也说不太明白。
    的头像 发表于 03-14 14:10 2495次阅读

    谷歌Android Studio Otter 3功能更新发布

    我们很高兴地宣布,Android Studio Otter 3 功能更新稳定版现已发布!本次更新干货满满,不仅重磅升级了 Android Studio 中的智能体工作流,还为开发者提供了更高的灵活性和掌控力,助力大家轻松利用 A
    的头像 发表于 01-28 14:15 848次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Android</b> Studio Otter 3<b class='flag-5'>功能</b>更新发布

    自动驾驶中毫米波雷达到底有何作用?

    毫米波雷达、超声波雷达等感知硬件,更像是一个配角,成为自动驾驶技术实现的辅助硬件。那在自动驾驶中毫米波雷达到底有何作用?
    的头像 发表于 12-10 17:07 2057次阅读
    自动驾驶中毫米波雷达<b class='flag-5'>到底有</b>何作用?

    汉威科技薄膜铂电阻温度传感器到底有多强

    测量温度简单吗?简单却也不简单,为了测得准,人类已经努力了上千年!薄膜铂电阻温度传感器到底有多强?为何是高端温度传感器的代表?
    的头像 发表于 11-28 11:51 997次阅读

    谷歌查找我的设备配件(Google Find My Device Accessory)详解和应用

    设备(Owner device)通常是指具有Android系统的设备如手机等,且和附件做过关联(配置),是配件的所有者,Google服务器和其它支持Google FMDN功能的手机或平板等Android
    发表于 08-31 21:10

    谷歌全新Android助力提高开发效率

    随着 Android 的更新,加上 AI 的接入与赋能,让 Android 开发新范式正在加速成型。
    的头像 发表于 08-29 09:22 1036次阅读

    TFT显示模组什么功能

    是细问它到底有哪些功能特点,不少人可能就说不上来了,那接下来咱们就一起聊聊 TFT 显示模组到底有哪些关键功能
    的头像 发表于 08-27 10:59 873次阅读
    TFT显示模组<b class='flag-5'>有</b>什么<b class='flag-5'>功能</b>

    电磁干扰“江湖三兄弟”:EMC、EMI、EMS 到底有啥区别?

    电磁干扰“江湖三兄弟”:EMC、EMI、EMS 到底有啥区别?
    的头像 发表于 08-20 15:16 3064次阅读
    电磁干扰“江湖三兄弟”:EMC、EMI、EMS <b class='flag-5'>到底有</b>啥区别?

    HarmonyOS AI辅助编程工具(CodeGenie)代码智能解读

    功能从DevEco CodeGenie 5.1.0 Beta版本开始支持。 CodeGenie提供智能AI能力对框选的代码片段进行逐条解释,总结代码段含义,帮助开发者提升阅读代码的速度和效率
    发表于 07-17 17:02

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)
    的头像 发表于 06-20 20:00 1117次阅读
    漫画科普 | 功率放大器<b class='flag-5'>到底有</b>哪些应用?带你解锁功放经典应用场景!(一)

    谷歌I/O 2025大会前透露:Android 16接入Gemini,智能手机、XR设备升级

    电子发烧友网报道(文/莫婷婷)2025 Google Android I/O将5 月 20 日至 21 日举行,在这场活动之前,谷歌召开了“The Android Show: I/O Edition
    的头像 发表于 05-18 00:03 7802次阅读
    <b class='flag-5'>谷歌</b>I/O 2025大会前透露:<b class='flag-5'>Android</b> 16接入Gemini,智能手机、XR设备升级

    Android Studio中的Gemini支持模态输入功能

    在开发生命周期的每个阶段,Android Studio 中的 Gemini 都已成为您的 AI 助手,助您更轻松地构建高质量的应用。我们很高兴地与您分享一项重大升级:Android Studio 中
    的头像 发表于 05-14 16:44 1289次阅读

    实测 PTR54LS05低功耗到底有

    实测 PTR54LS05低功耗到底有低?
    发表于 04-27 10:57