0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

隐藏在Microsoft Designer背后的新科技,让人人都是设计师

微软科技 来源:未知 2023-06-25 00:15 次阅读

在视觉图像设计中,用户的需求与最终的设计成品往往是“想象很美好,现实很骨感”。这通常是因为用户在与设计师沟通时,双方理解不一致,导致最终设计结果不尽如人意。但是,如果能够“自给自足”,借助人工智能技术为每个人赋予设计能力,是否会更容易让自己脑海中的画面变为现实?智能化设计工具 Microsoft Designer 就是一个能辅助用户成为设计师的好帮手。

2022年10月,微软在 Ignite 大会上发布了 Microsoft Designer 内测版,为 Microsoft 365 家族再添一个视觉生产力工具。2023年4月27日,经过半年的迭代和改进,微软宣布推出 Microsoft Designer 公开预览版。利用人工智能技术“猜想”用户的想法,智能辅助生成文字提示和视觉图像,Microsoft Designer 大大降低了设计难度,让人人都能成为视觉设计师。

如今,市场上充斥着各种各样视觉的设计工具,然而这些专业软件有很高的技术门槛且操作复杂,非专业人员难以熟练使用。也有一些工具提供了海量的模板库,用户可以基于模板进行修改,虽然这简化了部分操作,但其呈现效果与用户的设想仍有不小的差距。Microsoft Designer 则能够智能理解用户的需求,自动生成文字表述,实现从文字到视觉图像的自动化创造,并将这些素材用于设计项目。

作为智能化的设计工具,Microsoft Designer 将先进的科研成果快速吸纳并转化为生产力,其中包括来自微软亚洲研究院视觉计算组的 Provence、Swin Transformer 模型,自然语言计算组与微软图灵团队合作的图灵通用语言表示模型,系统研究组的SPANN(存储器-磁盘混合索引和搜索系统)算法等众多前沿技术。

6d050b5e-12a9-11ee-962d-dac502259ad0.png

厚积薄发:Provence多模态内容推荐模型助力实现“一键式”设计配图

微软亚洲研究院很早就开始研究通过自然语言生成图像或视频的技术。2018年,正值短视频发展的上升时期,研究员们意识到视频化的传播形态将成为未来互联网主要的沟通交流方式。然而视频内容的制作流程繁杂,高质量视频的拍摄更需要专业人员的参与,那么是否可以通过技术创新创造出一个简化视频制作和生成的工具?在这一目标的驱动下,视觉计算组开始了文字到图像和视觉的生成技术的研究。

经过一年多的潜心钻研,2020年视觉计算组推出了第一代基于检索的文字到视频的生成模型 Provence(Retrieval-based text-to-video generation)。Provence 模型能够根据文本描述搜索相匹配的视频或图像,同时确保跨模态对应具有较高的准确率,达到了“一键式(即检索到的第一个图像推荐就是用户所需)”的水平。

Provence 模型的潜力很快就被微软 Microsoft 365 产品部门发现,并将其引入到了 PowerPoint Design Ideas(PowerPoint 设计器)功能中。为了更好地满足产品端的工程化需求,微软多个研究组的研究员们将 Provence 与 Swin Transformer、图灵通用语言表示模型和 SPANN 算法结合,在 Design Ideas 功能的底层构建了零样本多模态的内容检索引擎,让用户在几秒钟内就能通过文字自动检索出最适合于当前幻灯片的配图,并给出布局设计建议,良好的使用体验让 Design Ideas 功能的用户使用率提升了20%以上。

图1:Provence 模型分别应用于 PowerPoint Design Ideas,Microsoft Designer 及其生态系统中

2021年3月,在微软内部的骇客松(Hackathon)活动期间,Microsoft 365 产品团队通过与研究员们的思想碰撞,更加深入地了解了机器学习领域的前沿技术趋势,不仅看到了走向成熟的 Provence 检索技术,也看到了更多创新的机器学习算法的应用潜力。由此,双方共同发起了 Designer in Edge 的 Hackathon 项目,此后这一项目进入产品化迭代过程,也形成了如今的 Microsoft Designer 和 Designer Platform 这两款由人工智能驱动的产品。

微软 Microsoft 365 产品部副总裁张大川表示,“在与微软亚洲研究院多个研究组的交流中,我们看到了 Provence、Swin Transformer、图灵通用语言表示模型等诸多超前的 AI 技术理念,这些前沿技术完全满足 Microsoft Designer 及其生态系统的需求。双方的紧密合作,不仅大大加速了产品的创新周期,而且还革新了传统设计的流程。下一步,我们将共同致力于创新技术的落地应用,为全球用户提供更加便捷易用的视觉设计工具,更好地激发人们的创造力和创新力。”

“很高兴看到微软亚洲研究院越来越多的创新研究成果走向了实际应用,成为支持产品开发的核心技术。以 Microsoft Designer 为例,它的关键技术始于研究院五年前的创新突破,正是因为微软亚洲研究院持续致力于探索计算机领域前瞻性的基础研究,才使得这种拿来即用的技术转化成为可能。未来,微软亚洲研究院将一如既往地着眼于下一代革命性技术的研究,并将科研成果快速转化到微软的产品中,赋能更多用户。”微软亚洲研究院常务副院长郭百宁表示。

6d050b5e-12a9-11ee-962d-dac502259ad0.png

Microsoft Designer:

从多模态推荐走向具有“创作”能力的AI

生成式视觉设计的一个关键环节是用语言或者文字将用户脑海中想象的画面清晰地表达出来。因此,微软亚洲研究院视觉计算组的研究员们进一步对 Provence 模型进行了升级,让 Microsoft Designer 在从文字描述中精准检索出用户所需图像的基础上,又实现了根据用户意图智能输出文字提示的功能。

其核心思想是基于学习到的自动模板为不同的输入文本创建不同的提示,具体包括三个步骤:

  • 首先,将用户原始输入的文本与一组字符(token)结合,这些字符是对用户所需要的设计图像的视角、样式、氛围、用途等的描述。

  • 然后,根据美术设计的评分,使用学习到的自动模板找到与不同字符匹配的最佳组合。

  • 最后,将输入文本和自动模板提示的组合返回给用户,并使用评分指标对结果进行排序,再从中检索出最佳的图像。

智能输出提示文字,为用户原始的输入文本添加了更多的描述和细节,从而激励视觉模型“创作”出更符合用户需求的结果。如图2所示:用户输入“a cat hacker wearing a VR headset”后,Microsoft Designer 自动输出了相关的提示与图像。

图2:智能输出提示文字的流程

另外,研究员们还提出了一种检索增强提示的推荐方法,通过使用提示数据库来增强自动提示的结果。随着用户对 Microsoft Designer 的频繁使用,模型会学习到更多的提示,而这些数据将能进一步提高提示质量。如图3所示,对于用户输入,Microsoft Designer 会先使用语言模型从提示数据库中检索最相似的提示文本,然后通过评估分数对检索结果排序,再将自动提示与排序检索提示结合,以获得更好的结果。由于模型具有持续学习的特性,最终将有越来越多的用户数据纳入到提示数据库中来增强提示。

图3:检索增强提示

借助智能输出文字提示和智能图像生成的双重加持,用户可以更好地用文字描述出脑海中的画面,让 Microsoft Designer “创作”更符合需求的视觉图像,并从推荐的图像中选择出最匹配需求的用于后续的定制化设计。

由人工智能技术驱动的 Microsoft Designer 极大地降低了设计工作的专业门槛,让设计更加大众化,人人都能成为设计师。未来,Microsoft Designer 还将引入更多的人工智能算法,比如个性化的智能修图、借助大模型实现平面布局等等,以此丰富 Microsoft Designer 的功能,为更多用户带来更高水平的创意和创造力生产工具。

点击“阅读原文”即可试用 Microsoft Designer,开启属于你的 AI 设计之旅吧!

随着人工智能技术的快速发展,确保相关技术能被人们信赖是一个需要攻坚的问题。微软主动采取了一系列措施来预判和降低人工智能技术所带来的风险。微软致力于依照以人为本的伦理原则推进人工智能的发展,早在2018年就发布了“公平、包容、可靠与安全、透明、隐私与保障、负责”六个负责任的人工智能原则(Responsible AI Principles),随后又发布了负责任的人工智能标准(Responsible AI Standards)将各项原则实施落地,并设置了治理架构确保各团队把各项原则和标准落实到日常工作中。微软也持续与全球的研究人员和学术机构合作,不断推进负责任的人工智能的实践和技术。

相关论文链接:

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

https://arxiv.org/abs/2103.14030

SPANN: Highly-efficient Billion-scale Approximate Nearest Neighbor Search

https://arxiv.org/abs/2111.08566

BEiT: BERT Pre-Training of Image Transformers

https://openreview.net/forum?id=p-BhZSz59o4

关注微软科技视频号

了解更多科技前沿资讯


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6566

    浏览量

    103956

原文标题:隐藏在Microsoft Designer背后的新科技,让人人都是设计师

文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    特信自主研发双通道无人机反制设备:创新科技守护空域安全

    随着无人机技术的快速发展,无人机在航拍、农业、物流等多个领域展现出了巨大的应用潜力。然而,无人机的非法使用也给公共安全带来了新的挑战。为了应对这一挑战,我们自主研发了一款双通道无人机反制设备,旨在通过创新科技守护空域安全。
    的头像 发表于 10-14 11:00 213次阅读

    新科技,智能温控电吹风 —— Bestow Mascot® 非接触式测温模块

    新科技,智能温控 —— Bestow Mascot® BM43THA-M11 智能温控电吹风解决方案 在追求卓越品质与体验的今天,Bestow Mascot® 为电吹风提供核心的智能温控技术。我们
    的头像 发表于 09-05 11:36 339次阅读
    创<b class='flag-5'>新科技</b>,智能温控电吹风 —— Bestow Mascot® 非接触式测温模块

    蚂蚁集团创新科技总部落地北京,蚂蚁T空间启用

    近日,蚂蚁集团在北京的标志性自有园区——“蚂蚁T空间”盛大启用,这标志着蚂蚁集团的创新科技总部正式扎根北京,开启了科技与产业深度融合的新纪元。蚂蚁T空间坐落于中关村南翼这一科技创新的沃土之上,其命名
    的头像 发表于 08-15 09:53 492次阅读

    新科技,精准导航:大核桃单北斗手持终端的独特优势与多样化应用场景

    北斗手持终端”以其独特的创新科技与精准导航能力,正逐步成为市场关注的焦点。本文将深入探讨大核桃单北斗手持终端的独特优势及其多样化的应用场景,展现其在现代生活中的无
    的头像 发表于 08-07 15:57 237次阅读
    创<b class='flag-5'>新科技</b>,精准导航:大核桃单北斗手持终端的独特优势与多样化应用场景

    森思泰克与海康汽车亮相中国一汽红旗第六届供应链创新科技

    7月15日-7月24日,“技领时代 智创未来” 中国一汽红旗第六届供应链创新科技展在一汽NBD举办。森思泰克&海康汽车作为一汽集团的长期战略合作伙伴应邀参展,携多款新技术、新产品及解决方案亮相科技展。
    的头像 发表于 07-23 11:15 636次阅读

    MWC上海2024亮点 ST创新科技带来一场视觉震撼与智慧启迪的盛宴

    不仅展示最新的科技成果,更带来了一场视觉与智慧的盛宴!   创新科技,触手可及 在ST的展台上,我们带来了一系列令人瞩目的创新成果。从边缘人工智能解决方案到最新款的压力传感器,每一项展品都是ST技术实力和创新精神的完美体现。 我们为您
    的头像 发表于 06-27 11:53 603次阅读
    MWC上海2024亮点 ST创<b class='flag-5'>新科技</b>带来一场视觉震撼与智慧启迪的盛宴

    AIGC遇上ChatGPT,互联网公司的创意设计师,还能做什么?

    随着科技的日新月异,AIGC(人工智能生成内容)和ChatGPT等AI技术的涌现,为互联网公司的创意设计师们描绘了一幅充满挑战与机遇的新图景。在这个数字化、智能化的新时代,创意设计师们不仅要保持敏锐
    的头像 发表于 06-25 13:32 264次阅读

    蚂蚁集团创新科技总部大楼挂牌,预计7月底启用

    近日,蚂蚁集团位于北京海淀区的创新科技总部大楼正式挂牌,标志着这座集人工智能、安全科技、移动科技、SaaS服务于一体的科技巨擘新地标即将投入使用。据悉,该大楼预计于7月底正式启用,届时将成为蚂蚁集团在京的核心研发基地。
    的头像 发表于 06-18 17:04 831次阅读

    【珠海高新科技产业招商资讯】市立柱项目!喜报+1 !

    【珠海高新科技产业招商资讯】市立柱项目!喜报+1 ! 珠海金湾20亿 市级立柱项目—— 京东方华灿光电珠海MicroLED 圆制造和封装测试基地项目 设备搬入仪式圆满落幕! 5月28日,京东方华灿
    的头像 发表于 06-14 17:54 712次阅读
    【珠海高<b class='flag-5'>新科技</b>产业招商资讯】市立柱项目!喜报+1 !

    苹果资深设计师离职

    近日,苹果公司内部传出一则消息,拥有25年经验的资深设计师邓肯·科尔已决定离开这个他倾注了无数心血的公司。这一决定意味着艾维时期的关键设计人物已几乎全部离职,为苹果的设计团队带来了不小的震动。
    的头像 发表于 05-10 10:03 326次阅读

    真AI PC来了!YOGA AI PC系列新品亮相联想创新科技大会

    4月18日上午,以“AI for All,世界充满AI”为主题的2024联想创新科技大会Tech World在上海举行。会上,联想与全球顶尖的AI科技领袖、专家共同探讨混合式人工智能的落地
    的头像 发表于 04-18 18:45 1187次阅读
    真AI PC来了!YOGA AI PC系列新品亮相联想创<b class='flag-5'>新科技</b>大会

    微软停止推送Edge 123稳定版,原因含&quot;Microsoft Copilo&quot;

    然而,新版Edge由于包含“隐藏内容”,即在安装过程中会额外安装一款名为“Microsoft Copilot”的8KB应用程序。对此,微软已决定推迟发布并停止推送更新。
    的头像 发表于 03-27 15:28 498次阅读

    特斯拉内饰设计师彼得·布雷德斯转投初创公司Skyryse

    据报道,布雷德斯现已加入Skyryse初创公司。这家致力于开发下一代直升机的企业任命他为设计副总裁。对此,布雷德斯表示将有机会把独特视角融入新科技,深感兴奋且荣幸。
    的头像 发表于 02-29 10:20 686次阅读

    关于32/64位Altium Designer与Access数据库兼容的问题

    Database Libraries(Dblib)是一个功能强大的元器件管理方案,但对于32位和64位版本的Altium Designer在使用Microsoft Access作为后端数据库时是有区别的。
    的头像 发表于 01-24 14:40 1942次阅读

    那些隐藏在电阻器上的神秘数字

    电阻器,这个看似普通的电子元件,其实身上藏着一个巨大的秘密。那些看似随意的数字,其实都是电阻值的小提示。
    的头像 发表于 01-23 09:25 580次阅读