0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI文本到图像模型套件迎来了新的发展里程碑

jf_WZTOguxH 来源:AI前线 2023-06-26 14:34 次阅读

即使公众对创始人产生了诸多质疑,但不影响 Stability AI 在文本生成图像领域的持续推进。

日前,Stability AI 发布了 SDXL 0.9,这是其 Stable Diffusion 文本到图像模型的最新版本,代表 Stability AI 文本到图像模型套件迎来了新的发展里程碑。

继今年 4 月成功发布 Stable Diffusion XL beta 之后,SDXL 0.9 在图像和构图细节方面继续做出大幅突破。SDXL 0.9 是一款强大的工具,可用于在各种创意产业中创建高度逼真的图像。与之前的版本相比,此更新的模型对生成图像的质量和细节带来了重大改进。

SDXL 0.9 有哪些重大升级?

现在用户已可通过 ClipDrop 访问该模型,API 也将在不久后推出。研究人员正在努力完善 1.0 版本,相关成果包括权重设置预计将在七月中旬与大家见面。

SDXL 0.9 在继续保持通过现代消费级 GPU 运行的能力之外,在生成 AI 图像的创意用例方面也实现了飞跃。SDXL 能够为影视剧、音乐和教学视频生成超现实风格的创作结果,也具备在设计和工业用途中一展身手的水平。

示例:

在 SDXL beta(左)和 0.9 版本上以相同提示词进行测试,即可体现该模型在短短两个月内取得的重大进展。

25b0e954-13e3-11ee-962d-dac502259ad0.png

提示词: 美学 外星人拉在拉斯维加斯的人群中,粗砺的胶片摄影

(左图 - SDXL Beta, 右图 - SDXL 0.9)

25f31d74-13e3-11ee-962d-dac502259ad0.png

提示词: 优胜美地国家公园的狼,冷冽的自然纪实胶片摄影

(左图 - SDXL Beta, 右图 - SDXL 0.9)

SDXL 系列还提供一系列超出基础文本提示的功能。其中包括图像到图像提示(输入一张图像,以获取该图像的更多变体)、填充(重建图像内的缺失部分)和外延(根据现有图像无缝向外扩展)。简单来说,它可以让用户更有创意,以更高级有趣的方式对图像进行更改。

SDXL 0.9 背后的力量

那么,SDXL 0.9 的底层技术到底是怎样的?

据 Stability AI 介绍,SDXL 0.9 之所以取得重大进展,核心驱动因素在于参数数量(模型训练时神经网络中所有权重和偏差的总和)较 Beta 版本有了显著增加。

SDXL 0.9 是目前所有开源图像模型中参数量最大的模型之一,基础模型拥有 35 亿参数,模型集成管线拥有 66 亿参数(最终输出由两套模型的运行聚合结果创建而成)。管线的第二阶段模型,专门用于向第一阶段模型生成的输出添加更多精巧细节。

相比之下,之前的 beta 版权拥有 31 亿参数并使用单一模型。

SDXL 0.9 运行在两个 CLIP 模型之上,其中包括迄今为止训练的最大 OpenCLIP 模型之一 OpenCLIP ViT-G/14。它增强了 SDXL 0.9 的处理能力,使其能够创建出更具深度和 1024 x 1024 更高分辨率的逼真图像。

SDXL 团队将很快发布一篇研究博客,详细介绍该模型的规格和测试情况。

尽管具有强大的输出和更先进的模型架构,但 SDXL 0.9 仍能够在现代消费级 GPU 上运行。具体配置要求为:

Windows 10 或 11/Linux 操作系统

16 GB 内存、英伟达 GeForce RTX 20 系列显卡(或更高版本)且至少配备 8 GB 显存;

Linux 用户也可以使用配备 16 GB 显存的 AMD 兼容显卡。

测试版发布期间获得积极反响

Stability AI 因于 2022 年 8 月推出开源图像生成器 Stable Diffusion 而闻名,进一步加剧了其与 OpenAI 的 Dall-E 和 MidJourney 的竞争。

近日,Stability AI 刚被《时代》周刊评为 2023 年最具影响力的公司之一。其他出现在榜单上的人工智能公司还有 OpenAI(ChatGPT)、Hugging Face(协作开源人工智能平台)、Runway AI(生成视频)、Nvidia 和谷歌 DeepMind。

自 4 月 13 日 SDXL beta 版发布以来,Stability AI 在 Discord 社区上收到近 7000 名用户的热烈响应。用户们生成了超过 70 万张图像,平均每天超过 2 万张。超过 5.4 万张图像进入 Discord 社区的“Showdowns”评选,最终有 3521 张 SDXL 图像被评为优秀作品。

可用性和未来计划

SDXL 0.9 现已在 Clipdrop by Stability AI 平台上发布。Stability AI API 及 DreamStudio 客户端将于 6 月 26 日星期一开放该模型,同时提供 NightCafe 等其他领先的图像生成工具。

SDXL 0.9 目前暂时仅供研究学习目的使用,希望在全面发布前收集反馈并充分完善模型。相关代码后续将在 GitHub(https://github.com/Stability-AI/generative-models)上公开。

如果研究人员希望访问这些模型,请通过以下链接申请:

SDXL-0.9-Base 模型:https://huggingface.co/stabilityai/stable-diffusion-xl-base-0.9

SDXL-0.9-Refiner:https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-0.9

Stability AI 一再强调,目前 SDXL 0.9 仅用于研究学习目的。

SDXL 1.0 计划在今年七月中旬(时间选定)全面发布。SDXL 0.9 遵循非商用、仅供研究的许可证发布,并受相关使用条款的约束。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4673

    浏览量

    128555
  • 图像
    +关注

    关注

    2

    文章

    1078

    浏览量

    40373
  • 模型
    +关注

    关注

    1

    文章

    3112

    浏览量

    48646

原文标题:35 亿+66 亿参数双模型,消费级显卡上也能跑!Stability AI 发布重大升级,生成图像真假难辨

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    未来AI模型发展趋势

    上得到了显著提升。未来,算法和架构的进一步优化将推动AI模型在性能上实现新的突破。 多头自注意力机制、前馈神经网络等关键技术的改进,将增强模型的表达能力和泛化能力。 多模态融合 : AI
    的头像 发表于 10-23 15:06 379次阅读

    爱玛机电突破千万台电机产量里程碑

     在电动车行业迎来里程碑的9月25日,爱玛科技集团股份有限公司(以下简称“爱玛科技”)宣布其机电事业部成功实现累计产量从300万台1000万台的飞跃。这一成就不仅标志着爱玛机电在电动车动力领域的行业地位进一步巩固,也充分展示
    的头像 发表于 09-26 17:07 560次阅读

    特斯拉里程碑达成:第1亿颗4680电池震撼问世

    特斯拉的4680电池技术再次跨越重要里程碑,公司于9月15日欣然宣布,其第1亿颗创新性的4680电池已成功下线,这一成就标志着特斯拉在电池制造领域的飞速进展。特斯拉首席执行官埃隆·马斯克通过社交媒体向辛勤工作的电池团队致以热烈祝贺,彰显了公司对这一里程碑事件的自豪与重视。
    的头像 发表于 09-18 15:30 1143次阅读

    Freepik携手Magnific AI推出AI图像生成器

    近日,设计资源巨头Freepik携手Magnific AI,共同推出了革命性的AI图像生成器——Freepik Mystic,这一里程碑式的发布标志着
    的头像 发表于 08-30 16:23 1045次阅读

    泰凌微电子:20亿颗芯片里程碑,创新驱动物联网未来

        泰凌微电子(688591.SH)在近期迎来了一个令人瞩目的里程碑——公司芯片的全球累计出货量突破20亿颗。这一数字不仅彰显了泰凌微在低功耗物联网芯片方向中的稳健发展和行业贡献,也激励着公司在
    发表于 08-15 11:06 417次阅读
    泰凌微电子:20亿颗芯片<b class='flag-5'>里程碑</b>,创新驱动物联网未来

    特斯拉迎来里程碑:全球第1000万个电驱系统下线

    在科技日新月异的今天,电动汽车行业的领军企业特斯拉再次以非凡的成就震撼全球。8月1日,特斯拉官方宣布了一个具有历史意义的消息——全球第1000万个电驱系统正式下线,标志着特斯拉在电动汽车核心技术的自主研发与规模化生产上迈出了坚实的一步,迎来了发展历程中的首个“一千万”
    的头像 发表于 08-01 16:40 1061次阅读

    Anthropic发布最新AI模型Claude 3.5,引入Artifacts新功能

    近日,科技领域又迎来了一项引人注目的进展。Anthropic,这家OpenAI的竞争对手,于6月21日正式发布了其最新且功能强大的AI模型——Claude 3.5 Sonnet。这一里程碑
    的头像 发表于 06-22 17:21 1996次阅读

    它人机器人与俄罗斯的AVIALIFT正式携手,达成里程碑式合作

    4月15日,它人机器人与俄罗斯的AVIALIFT正式携手,达成里程碑式合作。这次合作不仅将我们的机器人产品、尖端技术和优质服务带到了广袤的俄罗斯,更是它人机器人在国际舞台上的一大飞跃。
    的头像 发表于 04-17 09:26 487次阅读
    它人机器人与俄罗斯的AVIALIFT正式携手,达成<b class='flag-5'>里程碑</b>式合作

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该模型以其独特的功能吸引了众多关注。此模型具备从单张
    的头像 发表于 03-22 10:30 746次阅读

    谷歌发布AI基础世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基础世界模型Genie。这一创新技术允许用户通过单张图像提示,生成一个可玩的、交互式的虚拟
    的头像 发表于 02-28 17:41 745次阅读

    Stability AI试图通过新的图像生成人工智能模型保持领先地位

    Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大,而Stable Diffusion是许多其他
    的头像 发表于 02-19 16:03 867次阅读
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>试图通过新的<b class='flag-5'>图像</b>生成人工智能<b class='flag-5'>模型</b>保持领先地位

    小爱同学AI助手已通过大模型备案

    小米公关部总经理王化在微博上宣布,小爱同学AI助手已经成功通过大模型备案。这一里程碑式的进展标志着小爱同学在人工智能领域又迈出了坚实的一步,为用户带来了更加全面和先进的智能体验。
    的头像 发表于 02-06 16:34 5570次阅读

    Stability AI推出迄今为止更小、更高效的1.6B语言模型

    Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。
    的头像 发表于 01-23 10:11 722次阅读
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>推出迄今为止更小、更高效的1.6B语言<b class='flag-5'>模型</b>

    百度地图宣布城市车道级导航取得里程碑突破

    近日,百度地图宣布其城市车道级导航取得里程碑突破,已率先覆盖全国超100城普通道路。
    的头像 发表于 01-09 17:28 1122次阅读
    百度地图宣布城市车道级导航取得<b class='flag-5'>里程碑</b>突破

    Stability AI推出商业版会员计划 对AI模型的商业使用收费

    该公司在一篇博客文章中表示:“随着我们公司的不断成熟和规模化,Stability AI会员将在助力我们未来的核心模型研发方面发挥关键作用。” The Verge联系了Stability
    的头像 发表于 12-26 16:48 809次阅读