0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌I/O在音视频领域中有哪些技术值得被关注?

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-05-26 10:58 次阅读

时隔两年Google I/O大会再次与大家见面。虽然去年的大会因新冠疫情被迫取消,但技术的迭代发展却未被打断,反而因疫情的影响促使了技术的创新变得愈加以人们的需求为首要考量,从而变得更具人性化也更具智能化。

“在重要的时刻提供帮助”——是此次谷歌 I/O 2021大会的主题。从充满人情味的主题开场,并围绕AI视频聊天、地图、医疗诊断、数据安全等方面发布了一系列最新的技术进展。而在音视频领域中最值得关注的是:全息视频聊天技术——Project Starline,谷歌AI芯片最新版本——TPU v4,以及基于AI模型的皮肤病问诊应用程序。

Project Starline 3D视频聊天新体验

Project Starline 3D视频聊天互动 演示

该项技术可以说是本次大会的绝对黑科技了,使一些无法进行线下见面的人们(如:疫情影响)能够在同一空间中进行实时的3D互动聊天。据悉,Project Starline利用全息影像技术打破人们身处不同空间的隔阂,并与传统的视频聊天的区别在于,让你想见到的人就“坐”在你对面,感觉像是真的在你身边一样。

而为了实现这一技术,在硬件部分谷歌采用了65英寸的光场显示器,并配备了定制高分辨率传感器和数十个景深扫描传感器,从多个角度捕捉用户的外貌和动作,然后进行融合,并在联合驱动下生成流畅细致的实时3D模型。由于其所产生的数据每秒高达数千兆字节,因此,对于在现有网络上发送如此之大的图像,谷歌研发了新的压缩和流算法,可将数据减少100倍以上。

而在软件部分则是通过在计算机视觉机器学习、空间音频和数据压缩技术等方面数年之久的开发,通过硬件与软件的整合才得以实现今天的Project Starline。除此之外,突破性的光场系统也是支持这一技术的亮点,让人们可以免去佩戴眼镜、耳机就能体验到逼真的体积和深度感。

目前Project Starline仅在谷歌的几个办公室中被应用,由于它依赖于定制的硬件和高度专业化的设备,还未在市场中进行推广。

新定制AI芯片TPU v4:性能提升10倍

在谷歌 I/O大会中还推出了谷歌最新定制的AI芯片——TPU v4。这类定制芯片对其所要处理的AI任务有着数量级的性能优势,如图像识别、语音助手、视频、视觉计算处理等。而TPU v4的动力来源于v4芯片,其速度是v3(上一个TPU版本)的两倍以上。TPU v4:一个Pods里面有4069个v4芯片,可以提供每秒 10^18 次浮点运算;并提供一个exaflop以上的容量,相当于一千万台笔记本电脑的计算能力之和,性能比上一代提升了10倍。Sundar Pichai表示:“这是我们部署过的最快的系统,对我们来说是一个历史性的里程碑”。而全球超算TOP 500排行榜第一名的日本富岳的最高性能也只有它的一半。

TPU v4芯片托盘

谷歌TPU之所以能够做到效率提高是在于:它可将看似相互独立的数百块芯片转为密切互联的单个系统来使用。Sundar Pichai谈到:“每块芯片的互连带宽是其他网络技术的10倍”。并透露会在年底对开发者开放使用。

另外,TPU v4在提高效率的同时,其数据中心也将以90%(或接近)的无碳能源运行。

AI“问诊”:针对皮肤病的诊断新功能

本次谷歌 I/O大会的另一个亮点便是AI“问诊”。这是一个由AI驱动的皮肤病学辅助工具的预览,能够帮助人们了解自身皮肤、头发和指甲等有关的问题。并使用很多与CT扫描相同的技术来检测一些眼部疾病或肺癌。可通过手机的摄像头来识别皮肤病,如手臂上的皮疹。

其具体工作原理是基于Web应用程序,通过上传拍摄的图片,利用AI模型来分析图片中所出现的症状信息,从而为用户提供与之匹配的条件列表。对于条件列表中的每个匹配条件,都源自于皮肤科医生审核过的信息和常见问题的答案,以及来自网络中的类似匹配图像。

然而,值得注意的是该应用程序所得出的匹配结果并不能作为诊断依据,也不能替代医学建议,因为许多情况还是需要在医院中进行专业的检查。因此,该应用的意义在于希望用户在此访问到权威信息,为下一步做出更为明智的决定。

该款应用工具已经过3年的机器学习研究和产品开发,并发表了多篇同行评审的论文,以验证其AI模型。除此之外,谷歌的深度学习方法对皮肤病的评估还曾发表于《自然医学》杂志中,并表明其AI系统可以达到与美国董事会认证的皮肤科医生相同的准确性。目前,为该款应用程序所提供的AI模型已成功通过了临床认证,其应用程序在欧盟也获得了CE标记为I类医疗设备。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    454

    文章

    50430

    浏览量

    421872
  • AI
    AI
    +关注

    关注

    87

    文章

    30172

    浏览量

    268434
  • 计算机视觉
    +关注

    关注

    8

    文章

    1696

    浏览量

    45928
  • 机器学习
    +关注

    关注

    66

    文章

    8378

    浏览量

    132417
  • TPU
    TPU
    +关注

    关注

    0

    文章

    138

    浏览量

    20698

原文标题:谷歌 I/O 2021 在音视频领域中有哪些技术值得被关注?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Amoonsky创新音视频连接技术:全新推出AMS-HE200 HDMI网线延长器

    系统,也被称为200M KVM延长器器,承诺超越传统限制,为HDMI音视频信号提供无缝、可靠且扩展的传输距离。 从广阔距离上传输高质量内容到支持多种信号传输模式,AMS-HE200凝聚了尖端技术的精髓。其无缝桥接设备的能力凭借
    的头像 发表于 10-24 16:09 165次阅读
    Amoonsky创新<b class='flag-5'>音视频</b>连接<b class='flag-5'>技术</b>:全新推出AMS-HE200 HDMI网线延长器

    盘点那些常见音视频接口

    我们熟知的一些常见音视频接口,发展至今日常使用中已经渐渐少了。但是工业领域音视频连接,依然能看到其身影。这些看似消失的接口,它们现在发
    的头像 发表于 09-09 14:34 461次阅读

    常见音视频接口的静电浪涌防护和滤波方案

    音视频接口现代多媒体设备中扮演着至关重要的角色,它们确保了音视频信号不同设备间的顺畅传输,各种类型的音视频接口满足了多样化的应用场景需求
    的头像 发表于 06-25 11:28 606次阅读

    音视频IP化浪潮全面来袭,分布式系统开创音视频行业新时代!

    传统音视频频系统中,厂商们各自采用不同的通讯方式和控制协议,这使得不同的产品之间就像一座座的信息孤岛,要连接起来就需要复杂的转换设备和系统再开发。随着音视频项目的规模不断扩大,各类音频设备产品
    的头像 发表于 05-30 16:55 638次阅读

    音视频产品EMC整改案例解析

    音视频产品EMCRE整改案例解析
    的头像 发表于 05-20 16:49 380次阅读
    <b class='flag-5'>音视频</b>产品EMC整改案例解析

    高清HDMI转USB 3.0音视频多功能音采集卡-测评

    LCC380的设计理念在于全面考虑到各种用户场景下的需求。为了实现高品质的音视频采集效果,卡体搭载了业界领先的音频处理器解决方案。无论您是热衷于游戏直播、视频会议还是其他音视频应用,都能通过LCC380获得出色的音频输入输出体验
    的头像 发表于 05-14 17:45 786次阅读
    高清HDMI转USB 3.0<b class='flag-5'>音视频</b>多功能音采集卡-测评

    【RTC程序设计:实时音视频权威指南】音视频的编解码压缩技术

    音视频所载有的信息通过传输的时候就需要压缩编码。 其中,文本压缩是指通过使用各种算法和技术,将文本数据表示为更紧凑的形式,以减少存储空间。 霍夫曼编码是一种无损压缩算法,它可以根据字符出现
    发表于 04-28 21:04

    音视频SoC与AI技术融合,带来更智能的音视频处理解决方案

    ,如WiFi路由器和物联网设备。安防、智能音频等领域,对SoC芯片的算力要求相比智能手机、服务器等略低。   人工智能技术音视频SoC 的融合                   
    的头像 发表于 04-26 01:20 4217次阅读

    【RTC程序设计:实时音视频权威指南】音频采集与预处理

    闲暇之余,继续学习【RTC程序设计:实时音视频权威指南】这本书。 书中对于音频采集的介绍非常详细和全面,包括原理、方法、技术细节以及实践应用等方面的内容。 音频采集是实时音视频通信中的关键步骤之一
    发表于 04-25 10:41

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本人从事音视频领域的开发,经常接触实时音视频处理相关的技术,看到这本书非常有兴趣阅读,这本书全面介绍实时音视频(RTC)
    发表于 04-22 09:09

    音视频解码生成:打造极致观影体验的关键技术

    现代多媒体时代,音视频解码生成技术已成为提供极致观影体验的核心要素。它不仅能够确保音视频数据的高效传输,还能保证播放的流畅性和画质清晰度,为用户带来身临其境的观影享受。 1. 解码生
    的头像 发表于 02-25 14:43 435次阅读

    音视频解码器优化技巧:提升播放体验的关键步骤

    随着数字多媒体内容的爆炸式增长,音视频解码器现代技术生活中扮演着至关重要的角色。从流畅的在线视频流播放到高质量的本地文件解码,解码器的性能直接影响了我们的观看体验。那么,如何优化
    的头像 发表于 02-21 14:45 751次阅读

    音视频解码生成常见问题及解决方案

    音视频解码生成的过程中,我们可能会遇到一些常见问题,这些问题可能会影响解码的效果和效率。以下是一些常见问题及其解决方案: 问题1:解码失败 原因 :可能是文件本身有问题,如损坏或格式不支持;也
    的头像 发表于 02-21 14:39 1307次阅读

    音视频解码生成多媒体制作中的应用

    音视频解码生成是多媒体制作中不可或缺的一部分,它扮演着将编码的音视频数据转化为可播放、可编辑的内容的关键角色。多媒体制作的全过程中,音视频解码生成
    的头像 发表于 02-21 14:39 353次阅读

    音视频解码生成与流媒体传输的结合

    音视频解码生成与流媒体传输是现代数字媒体技术中两个不可或缺的部分,它们的结合为用户提供了高质量、实时性的多媒体体验。 1. 解码生成与流媒体传输的关系 解码生成是流媒体传输的前提。流媒体服务中
    的头像 发表于 02-21 14:36 367次阅读