Google 用三个项目:Live Transcribe、Live Caption、Live Relay,来帮助听障人群融入正常社会,实现无障碍沟通。
1 Live Transcribe(实时转录):打开应用软件后,手机设备可以实时监听周围环境中的语音,并实时显示出对应的文字。
2 Live Caption(实时字幕):使用自动语音识别,为视频添加字幕。适用于播放音频的任何媒体,包括视频,音频等消息,尤其是无字幕的直播,甚至和家人视频聊天,都可以实时添加字幕。
3 Live Relay(实时语音)基于Live Transcribe的实时的文字转语音的产品,以便聋哑人在打电话需求场景下,能打字转换成语音播放达到沟通目的。
Eros Now周二表示,它已与Google Cloud合作,使用后者的AI技术,以自动字幕的形式流式传输其全部电影和原著。
由AI驱动的字幕功能将首先以阿拉伯语提供。该公司表示,语言支持将迎合喜欢印度电影和其他消费印度娱乐内容市场的“大量阿拉伯观众”。
Eros Now还详细说明了其如何在其流媒体平台上使用尖端技术。
“通过使用AI框架和大量预先存在的数据,Eros Now的内部数据科学团队模拟,培训和开发了一种先进的模型,该模型的性能相当于人类,并且能够生成所需的字幕电影和原著中使用的语言”,该公司在一份新闻稿中说。
该公司表示,该部署将有助于推动更高的消费者参与度,并为“文本到语音”自动化打开新的机会窗口。该公司指出,该模型可用于不同类型和语言。
“应对性别非中立语言以及各种使用不同语言的标点符号只是最大的挑战中的几个。自动化过程花了六个月的时间才能使数据科学家完善。”该公司补充说。
Eros Now由Eros STX Global Corporation拥有。OTT平台拥有使用印地语和当地语言发行的12,000多部电影的权利。截至2020年9月,该平台拥有超过2.11亿注册用户和3,620万付费用户。
过去,爱神(Eros)也尝试了其他新时代的技术。去年,它与美国视频游戏和软件公司Epic Games合作,将“虚幻引擎”技术引入了印度电影。以Fortnite之类的游戏而闻名的Epic Games表示,它将提供实时渲染,更好的VFX和虚拟制作等技术。
在2019年,Eros Now与Microsoft合作,利用Azure云平台托管和流传输其数字视频产品。
利用Google Assistant 中由AI驱动的新功能非常方便
在Google助手首次为家庭采用解释器模式大约一年后,该功能终于在移动设备上发布。这是根据最近的报道援引Google自己的话说的,该模式即将到来。
为清楚起见,解释器模式是一种实时翻译器,可以进行对话。因此,使用后,用户将能够阅读和听到某人对他们说的另一种语言的翻译。他们还可以进行交谈或点击智能回复并键入回复。
Google助理会以相应的语言大声朗读所有内容。用户不必为外国的发音和语法上的细微差别而苦恼。目前,一长串可用的语言总共有44种。明显的内容包括德语,法语和类似的通用语言。但是Google也包含了一些在世界许多地方都不太常用的东西。
例如,用于移动设备的新解释器模式可以帮助用户说泰语或其他常用但使用较少的语言。
利用Google Assistant 中由AI驱动的新功能非常方便。实际上,通常只需在“ Okay”或“ Hey Google”之后加上几个字即可使事情向前发展。关键短语也很简单。因此,整个过程和小程序的使用应非常直观,而不是要求口头体操来完成。
例如,用户可以说“嘿Google,帮我说西班牙语”。正如所暗示的那样,该短语将在西班牙语的解释器模式下启动。“好吧,谷歌,当我的泰语翻译者”同样可以很好地工作。
从那里开始,Google的解释器模式将按预期工作。口语单词会在屏幕上翻译并大声说出来。智能答复似乎可以从中选择,当然,还会显示一个键盘图标来键入响应。语音响应也会被捕获,并以其他语言大声朗读。
Google似乎并未提供太多有关哪些移动设备将能够使用由Assistant AI支持的新解释器模式的确切信息。但是,它确实说它正在同时出现在iOS和Android上。该模式将通过更新到达。可以从App Store或Google Play商店中找到专门用于Google Assistant应用程序的内容。
这意味着,尽管它现在正在推出,但要花一些时间才能敲打那里的所有设备。部署通常需要几个星期才能完成。
(慧译讲视频,风尚网,互联网分析沙龙网综合整理 )
责任编辑:lq
-
Google
+关注
关注
5文章
1762浏览量
57509 -
流媒体
+关注
关注
1文章
194浏览量
16659 -
解释器
+关注
关注
0文章
103浏览量
6509
发布评论请先 登录
相关推荐
评论