0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook研究人员利用视觉和音频探索人工智能技术

lhl545545 来源:比特网 作者:Yu 2021-01-12 16:03 次阅读

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。

研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28455

    浏览量

    207257
  • Facebook
    +关注

    关注

    3

    文章

    1429

    浏览量

    54785
  • 人工智能
    +关注

    关注

    1791

    文章

    47336

    浏览量

    238694
收藏 人收藏

    评论

    相关推荐

    【「具身智能机器人系统」阅读体验】+初品的体验

    解决许多技术的和非技术的挑战,如提高智能体的自主性、处理复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感
    发表于 12-20 19:17

    嵌入式和人工智能究竟是什么关系?

    了重要作用。在未来,随着嵌入式系统和人工智能技术的不断进步,我们可以预见更多创新应用的出现,为社会发展和生活品质的提升带来更多可能性。
    发表于 11-14 16:39

    未来智慧建筑:人工智能技术的无限可能

    随着科技的不断发展,人工智能技术正逐渐渗透到各行各业,其中,在智能建筑领域的应用备受瞩目。智能建筑结合了传统建筑与先进科技的完美融合,在提高建筑效率、节能环保、增强安全性等方面发挥着重要作用。古河云
    的头像 发表于 10-17 14:07 252次阅读

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    了电力的实时平衡和优化,有效降低了电网的运行成本和故障率。 此外,书中还讨论了人工智能在能源科学研究中的挑战和机遇。这些挑战包括数据质量、算法优化、隐私保护等方面,而机遇则体现在技术创新、产业升级
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    很幸运社区给我一个阅读此书的机会,感谢平台。 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们揭示了人工智能技术在生命科学领域中的广泛应用和深远影响。在
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究中的核心技术,包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析复杂的数据集,从而发现隐藏在数据中的模式和规
    发表于 10-14 09:16

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    ,无疑为读者铺设了一条探索人工智能(AI)如何深刻影响并推动科学创新的道路。在阅读这一章后,我深刻感受到了人工智能技术在科学领域的广泛应用潜力以及其带来的革命性变化,以下是我个人的学习心得: 1.
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    和使用该技术,无需支付专利费或使用费。这大大降低了人工智能图像处理技术的研发成本,并吸引了大量的开发者、企业和研究机构参与其生态建设。 灵活性则体现在RISC-V可以根据不同的应用场景
    发表于 09-28 11:00

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    每个交叉领域,本书通过案例进行了详尽的介绍,梳理了产业地图,并给出了相关政策启示。 《AI for Science:人工智能驱动科学创新》适合所有关注人工智能技术和产业发展的读者阅读,特别适合材料科学
    发表于 09-09 13:54

    FPGA在人工智能中的应用有哪些?

    定制化的硬件设计,提高了硬件的灵活性和适应性。 综上所述,FPGA在人工智能领域的应用前景广阔,不仅可以用于深度学习的加速和云计算的加速,还可以针对特定应用场景进行定制化计算,为人工智能技术的发展提供有力支持。
    发表于 07-29 17:05

    研究人员利用人工智能提升超透镜相机的图像质量

    研究人员利用深度学习技术提高了直接集成在 CMOS 成像芯片上的超透镜相机(左)的图像质量。超透镜利用 1000 纳米高的圆柱形氮化硅纳米柱阵列(右图)操纵光线。
    的头像 发表于 06-11 06:34 384次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>利用人工智能</b>提升超透镜相机的图像质量

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践》2.0

    读者更好地把握大语言模型的应用场景和潜在价值。尽管涉及复杂的技术内容,作者尽力以通俗易懂的语言解释概念,使得非专业背景的读者也能够跟上节奏。图表和示例的运用进一步增强了书籍的可读性。本书适合对人工智能
    发表于 05-07 10:30

    探索人工智能技术在太空中的应用

    NASA将人工智能用于许多应用,并成立了人工智能小组,开展支持科学分析、航天器操作、任务分析、深空网络操作和太空运输系统的基础研究
    的头像 发表于 03-12 14:19 613次阅读

    嵌入式人工智能的就业方向有哪些?

    联网ARM开发 NB-IoT开发及实战 七:python工程师,人工智能工程师 python语法基础 python核心编程 基于OpenCV的机器视觉开发 嵌入式人工智能渗入生活的方方面面,广泛应用
    发表于 02-26 10:17

    人工智能技术的优势有哪些

    人工智能技术的优势
    的头像 发表于 01-19 15:58 3149次阅读