0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

能创造出有逼真纹理和形状的一个生成式AI系统

电子工程师 来源:lq 2018-12-06 10:17 次阅读

AI 生成逼真三维物体模型并不像人们以为的那么困难。

近日,在 NeurIPS 2018 会议上接收的论文“视觉对象网络:图像生成与分离式的3D表示”中,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)和 Google 的研究人员介绍了能创造出有逼真纹理和形状的一个生成式 AI 系统。

该系统是视觉对象网络(VON)系统,不仅可以生成比某些最先进的方法更真实的图像,还可以进行形状和纹理编辑、视点转换以及其他三维调整。

“现代深层生成模型学会了合成逼真的图像,”研究人员写道,“但大多数计算模型只专注于生成 2D 图像,而忽略了 3D 世界的美好......这种视角不可避免地限制了它们在许多领域的实际应用,例如合成数据生成、机器人学习、虚拟现实和游戏行业。”

视觉对象网络系统则可以通过合成三维形状和二维图像来解决这个问题,类似于研究人员所称的“分离式的对象表示”。图像生成模型被分解为三种因素:形状、视点和纹理,另外,在计算“2.5 D”草图和添加纹理之前,它需要学习合成三维形状。

重要的是,由于这三个因素是条件独立的,所以模型不需要二维和三维形状之间的配对数据。这使得团队能够在大规模的二维图像和三维形状集上进行训练,如 Pix3D,Google 图像搜索和ShapeNet,后者包含 55 个对象类别的数千个 CAD 模型。

为了让 VON 系统学习如何生成自己的形状,该团队在上述三维形状数据集上训练了一个生成式对抗网络(GAN) 。而纹理生成被归类了到另一个基于 GAN 的神经网络

经过大约两到三天的训练,AI 系统始终如一地生成了令人信服的 128 x 128 x 128 模型,具有优异的反射率、环境照明和反照率(一种漫射光的度量)。

为了评估图像生成模型,团队计算了用于生成三维模型的 Fréchet Inception Distance(弗雷歇初始距离,FID)——一种与人类感知相关的度量。此外,他们还向亚马逊 Mechanical Turk 上的五名测试者展示了由 VON 和其他最先进模型生成的 200 对图像,这些受试者需要在这些图像中选择更真实的结果。

VON 的表现非常出色。它与所有 AI 模型相比具有最低的 FID 值,并且 Mechanical Turk 的受访者表示更喜欢 VON 生成的 74% 到 85%的图像。

研究人员未来将专注于从粗糙到精细化的建模,以产生更高分辨率的生成形状和图像,并将纹理分解为光照和外观(lighting and appearance),并合成自然场景。

“我们的主要想法是将图像生成过程分解为形状、视点和纹理三种因素,”Google 团队写道,“这种分离式 3D 表示使我们能够在对抗学习框架下从 3D 和 2D 视觉数据集合中学习模型。与现有的 2D 生成模型相比,我们的模型合成了更逼真的图像,它还可以做到以前的 2D 方法也无法实现的各种 3D 操作。”

近年来,GAN 的研究突飞猛进,特别是在机器视觉领域。

Google 的 DeepMind 子公司在 10 月推出了一个基于 GAN 的系统,以此创建出令人信服的食物、风景、肖像和动物照片。9 月,Nvidia 的研究人员开发了一种 AI 模型,可以生成脑癌的合成扫描图像,8 月,卡内基梅隆大学的一个团队演示了 AI 可以将人们已存的动作和面部表情转换成另一张照片或视频中的目标对象。最近,爱丁堡大学感知研究所和天文学研究所的科学家设计了一种至少可以产生高分辨率星系图像的 GAN。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46925

    浏览量

    237759
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1922

    浏览量

    73124
  • 计算机科学
    +关注

    关注

    1

    文章

    142

    浏览量

    11357
  • 生成式AI
    +关注

    关注

    0

    文章

    490

    浏览量

    461

原文标题:AI做不了“真”3D图像?试试Google的新生成模型

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.ai小编为您整理
    的头像 发表于 10-28 11:19 188次阅读

    2024学习生成AI的最佳路线图

    本文深入探讨了2024年最佳生成AI路线图的细节,引领我们穿越动态进展、新兴趋势以及定义这尖端领域的变革应用。引言在日新月异的人工智能领域,生成
    的头像 发表于 07-26 08:28 519次阅读
    2024学习<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的最佳路线图

    如何用C++创建简单的生成AI模型

    生成AI(Generative AI)是种人工智能技术,它通过机器学习模型和深度学习技术,从大量历史数据中学习对象的特征和规律,从而能够
    的头像 发表于 07-05 17:53 783次阅读

    生成AI的定义和特征

    生成人工智能(Generative Artificial Intelligence, GAI)是人工智能领域的重要分支,它利用机器学习算法,特别是深度学习技术,使计算机能够模拟人
    的头像 发表于 07-05 17:33 901次阅读

    生成AI的基本原理和应用领域

    生成人工智能(Generative Artificial Intelligence,简称Generative AI)是种利用机器学习算法和深度学习技术,通过模拟人类的
    的头像 发表于 07-04 11:50 1303次阅读

    商汤发布《2024生成AI教育未来》白皮书

    生成AI正在各个行业中展现出巨大的应用前景。在关系国计民生的教育行业,生成AI能够催生哪些创
    的头像 发表于 06-29 09:48 788次阅读

    原来这才是【生成AI】!!

    随着ChatGPT、文心言等AI产品的火爆,生成AI已经成为了大家茶余饭后热议的话题。可是,为什么要在
    的头像 发表于 06-05 08:04 290次阅读
    原来这才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】!!

    生成 AI 进入模型驱动时代

    随着ChatGPT和大型语言模型(LLM)呈现爆炸增长,生成人工智能(GenerativeAI)成为近来的大热词。由此引发了场争论:
    的头像 发表于 04-13 08:12 495次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 进入模型驱动时代

    NVIDIA生成AI研究实现在1秒内生成3D形状

    NVIDIA 研究人员使 LATTE3D (款最新文本转 3D 生成 AI 模型)实现双倍加速。
    的头像 发表于 03-27 10:28 472次阅读
    NVIDIA<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>研究实现在1秒内<b class='flag-5'>生成</b>3D<b class='flag-5'>形状</b>

    NPU是什么?为何它是开启终端侧生成AI的关键?

    生成AI变革已经到来。随着生成AI用例需求在有着多样化要求和计算需求的垂直领域不断增加,我们
    的头像 发表于 03-07 11:25 2050次阅读
    NPU是什么?为何它是开启终端侧<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的关键?

    字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces热榜

    生成 AI 正凭借其根据文本提示(text prompts)创造出惊艳图像乃至视频的能力,赢得全球的瞩目。
    的头像 发表于 02-26 13:47 799次阅读
    字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces热榜

    拨靠Sora赚钱的人已经出现

    随着OpenAI最新发布的人工智能文生视频大模型Sora的问世,科技与创意产业再掀热潮。据悉,Sora不仅能根据文字说明创造出逼真且富有想象力的场景,更因其强大的生成能力引发了市场与消费者的极大兴趣。
    的头像 发表于 02-22 14:05 697次阅读

    NVIDIA生成AI开启药物研发与设计的新纪元

    NVIDIA BioNeMo 现已提供十余生成 AI 模型以及云服务,正在推动计算机辅助药物发现生态系统的发展。
    的头像 发表于 01-10 16:00 514次阅读
    NVIDIA<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>开启药物研发与设计的新纪元

    NVIDIA Research 在 SIGGRAPH Asia 中展示如何使用生成 AI 进行交互纹理绘制

    复杂且不重复的纹理。 该原型展示了 AI 如何像艺术家手中的画笔样“挥洒自如”,而不是只能依靠高级用户的指导才能生成完整的结果。它通过在交互中添加局部细节,实现无限的
    的头像 发表于 12-26 18:05 574次阅读
    NVIDIA Research 在 SIGGRAPH Asia 中展示如何使用<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 进行交互<b class='flag-5'>式</b><b class='flag-5'>纹理</b>绘制

    驾驭创造的力量: 生成 AI 时代的 MLOps 演进

    以下文章来源于谷歌云服务,作者 Google Cloud 驾驭创造的力量: 生成 AI 时代的 MLOps 演进  MLOps 是种将机
    的头像 发表于 12-21 18:05 325次阅读