0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

能创造出有逼真纹理和形状的一个生成式AI系统

电子工程师 来源:lq 2018-12-06 10:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI 生成逼真三维物体模型并不像人们以为的那么困难。

近日,在 NeurIPS 2018 会议上接收的论文“视觉对象网络:图像生成与分离式的3D表示”中,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)和 Google 的研究人员介绍了能创造出有逼真纹理和形状的一个生成式 AI 系统。

该系统是视觉对象网络(VON)系统,不仅可以生成比某些最先进的方法更真实的图像,还可以进行形状和纹理编辑、视点转换以及其他三维调整。

“现代深层生成模型学会了合成逼真的图像,”研究人员写道,“但大多数计算模型只专注于生成 2D 图像,而忽略了 3D 世界的美好......这种视角不可避免地限制了它们在许多领域的实际应用,例如合成数据生成、机器人学习、虚拟现实和游戏行业。”

视觉对象网络系统则可以通过合成三维形状和二维图像来解决这个问题,类似于研究人员所称的“分离式的对象表示”。图像生成模型被分解为三种因素:形状、视点和纹理,另外,在计算“2.5 D”草图和添加纹理之前,它需要学习合成三维形状。

重要的是,由于这三个因素是条件独立的,所以模型不需要二维和三维形状之间的配对数据。这使得团队能够在大规模的二维图像和三维形状集上进行训练,如 Pix3D,Google 图像搜索和ShapeNet,后者包含 55 个对象类别的数千个 CAD 模型。

为了让 VON 系统学习如何生成自己的形状,该团队在上述三维形状数据集上训练了一个生成式对抗网络(GAN) 。而纹理生成被归类了到另一个基于 GAN 的神经网络

经过大约两到三天的训练,AI 系统始终如一地生成了令人信服的 128 x 128 x 128 模型,具有优异的反射率、环境照明和反照率(一种漫射光的度量)。

为了评估图像生成模型,团队计算了用于生成三维模型的 Fréchet Inception Distance(弗雷歇初始距离,FID)——一种与人类感知相关的度量。此外,他们还向亚马逊 Mechanical Turk 上的五名测试者展示了由 VON 和其他最先进模型生成的 200 对图像,这些受试者需要在这些图像中选择更真实的结果。

VON 的表现非常出色。它与所有 AI 模型相比具有最低的 FID 值,并且 Mechanical Turk 的受访者表示更喜欢 VON 生成的 74% 到 85%的图像。

研究人员未来将专注于从粗糙到精细化的建模,以产生更高分辨率的生成形状和图像,并将纹理分解为光照和外观(lighting and appearance),并合成自然场景。

“我们的主要想法是将图像生成过程分解为形状、视点和纹理三种因素,”Google 团队写道,“这种分离式 3D 表示使我们能够在对抗学习框架下从 3D 和 2D 视觉数据集合中学习模型。与现有的 2D 生成模型相比,我们的模型合成了更逼真的图像,它还可以做到以前的 2D 方法也无法实现的各种 3D 操作。”

近年来,GAN 的研究突飞猛进,特别是在机器视觉领域。

Google 的 DeepMind 子公司在 10 月推出了一个基于 GAN 的系统,以此创建出令人信服的食物、风景、肖像和动物照片。9 月,Nvidia 的研究人员开发了一种 AI 模型,可以生成脑癌的合成扫描图像,8 月,卡内基梅隆大学的一个团队演示了 AI 可以将人们已存的动作和面部表情转换成另一张照片或视频中的目标对象。最近,爱丁堡大学感知研究所和天文学研究所的科学家设计了一种至少可以产生高分辨率星系图像的 GAN。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1819

    文章

    50290

    浏览量

    266826
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2382

    浏览量

    84330
  • 计算机科学
    +关注

    关注

    1

    文章

    144

    浏览量

    11823
  • 生成式AI
    +关注

    关注

    0

    文章

    538

    浏览量

    1129

原文标题:AI做不了“真”3D图像?试试Google的新生成模型

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    以全流程校验调试体系为核心,结合十余年工业实践沉淀,给出了工业级嵌入 AI 开发的确定性解决方案。 AI 幻觉的危害与行业困境 在工业嵌入
    发表于 03-18 13:49

    生成AI浪潮如何驱动车载通信模组升级

    随着生成AI浪潮席卷全球,人们对实时算力和海量数据的需求从未如此迫切。想象下,辆智能汽车不仅能流畅地执行自动驾驶任务,还能在行驶中将T
    的头像 发表于 01-06 10:15 451次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>浪潮如何驱动车载通信模组升级

    生成人工智能会让自动驾驶更灵活吗?

    (Generative Artificial Intelligence,GAI)。生成人工智能不仅能实现传统AI的“识别”及“判断”的功能,更能达成“创造”的需求,它能从已有的数据中
    的头像 发表于 12-23 10:05 627次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b>人工智能会让自动驾驶更灵活吗?

    生成AI虚拟调试——fe.screen-sim的架构价值

    生成AI虚拟调试——fe.screen-sim的架构价值
    的头像 发表于 12-04 14:59 1167次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>赋<b class='flag-5'>能</b>虚拟调试——fe.screen-sim的架构价值

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    种快速反应能力,是直接的感知;灵感是种通过思考和探索获得的创造性想法,是种创意。 AI怎么模拟直觉与灵感呢?四、
    发表于 09-17 11:45

    HarmonyOSAI编程万卡片生成

    基于AI大模型理解开发者的卡片需求信息,通过对话的交互智能生成HarmonyOS万卡片工程。 使用约束 建议从以下维度描述卡片需求: 当前不支持在
    发表于 09-08 17:09

    智能体化AI生成AI的区别

    生成 AI 的核心是“生成内容” —— 比如用大模型写报告,是对输入指令的被动响应。而智能体化 AI(Agentic
    的头像 发表于 08-25 17:24 1860次阅读

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    1. 项目概述 本项目旨在开发并部署高精度的深度学习模型,用于自动鉴别张图片是由AI生成(如Stable Diffusion, DAL
    发表于 08-21 13:59

    AI开启更逼真的游戏时代

    ,电子游戏正在借助人工智能创造出越来越逼真的场景和交互体验。GPU不再仅仅局限于图形渲染,如今已广泛应用于多种AI任务,包括生成更真实的非玩家角色(NPC)、动态世界、
    的头像 发表于 08-20 11:22 1473次阅读
    <b class='flag-5'>AI</b>开启更<b class='flag-5'>逼真</b>的游戏时代

    生成 AI 重塑自动驾驶仿真:4D 场景生成技术的突破与实践

    生成AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效生成极端天气等长尾场景?本文为您
    的头像 发表于 08-06 11:20 5360次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 重塑自动驾驶仿真:4D 场景<b class='flag-5'>生成</b>技术的突破与实践

    边缘生成AI面临哪些工程挑战?

    本文由TechSugar编译自electronicdesign当大多数人想到人工智能(AI)时,他们通常想到的是能够生成新文本、图像或语音内容的应用。像ChatGPT这样流行的文本应用(在几天
    的头像 发表于 06-25 10:44 1270次阅读
    边缘<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>面临哪些工程挑战?

    谷歌新生成AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新生成 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1281次阅读

    利用NVIDIA 3D引导生成AI Blueprint控制图像生成

    AI的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在创造出令人惊叹的
    的头像 发表于 06-05 09:24 997次阅读

    生成AI如何重塑设计思维与品牌创新?从工具到认知革命的跃迁

    当MidJourney生成的视觉方案出现在国际设计奖项的决赛名单,当Adobe Firefly成为设计师的标配工具,问题正从行业边缘走向中心:生成
    的头像 发表于 05-30 15:55 726次阅读

    生成人工智能认证:重构AI时代的人才培养与职业跃迁路径

    ,恰似座连接技术前沿与个体成长的桥梁,既承载着时代对人才的迫切需求,也指向着未来职场的核心竞争力。 、技术革命的双重性:赋能与失衡并存 生成人工智能的突破性,在于其首次让机器具备
    的头像 发表于 05-23 09:29 982次阅读