阿里巴巴发布AtomoVideo，兼容多款文生图模型的高保真图像视频框架-电子发烧友网

据披露，阿里巴巴研发部门近期推出了一款名为 AtomoVideo 的高保真 I2V（即 Image to Video）框架，可将静态图像转化成精美的视频内容。其主要特点有：

1. 高保真度：生成视频与输入图片在细节和风格上保持一致；

2. 运动连贯：视频流畅无跳跃，保证时间上的连续性；

3. 视频帧预测：通过精确的预测来支持长时延视频序列生成；

4. 兼容性强：适配现有各式各样的 T2I（Text-to-image）模型；

5. 高语义控制力：能够针对客户特殊需求，打造个性化的视频内容。

AtomoVideo运用预设的 T2I 模型，在每个空间卷积层和注意力层后新增一维时空卷积和注意力模块。现有的 T2I 模型参数固定不变，它们只会训练新增的时空层，而输入的串联图像信息由 VAE 编码解析，这代表的是低层次信息，有利于提高视频对输入图像的还原度。此外，团队还使用 Cross-Attention 的方法融入高级图像语义，以加强图像语义可控性。

目前，该项目仅发布了论文和演示视频，尚未开放线上试用途径。另外，阿里巴巴已开启 GitHub 账号，但现在只是作为官方网站的托管地，并不包含相关代码分享。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

图像

图像

+关注

关注
2

文章
1083

浏览量
40449
阿里巴巴

阿里巴巴

+关注

关注
7

文章
1614

浏览量
47171
模型

模型

+关注

关注
1

文章
3229

浏览量
48811

阿里巴巴完成双重主要上市

8月28日阿里巴巴在香港联交所主板主要上市，成为在港交所、纽交所双重主要上市的公司。如今，阿里巴巴完成双重主要上市。此外，有投资机构认为阿里巴巴最快有望于9月份就纳入港股通。截至8月28日收盘，

发表于 08-29 16:06 •370次阅读

阿里巴巴季报出炉阿里云二季度营收增长6%

阿里巴巴季报出炉我们一起来围观一下，根据阿里巴巴集团发布的截至2024年6月30日的第二季度经营业绩数据显示，阿里巴巴该季度营收达到2432.4亿元，而上年同期营收2341.56亿元，

发表于 08-16 16:45 •494次阅读

快手自研文生图大模型“可图”开放，支持AI图像创作及定制

5月30日最新动态，快手于近日向公众推出其自主研发的文生图大模型命名为“可图”。该模型具备文生

发表于 05-31 10:32 •625次阅读

阿里巴巴投资逐际动力，深化智能机器人布局

近日，阿里巴巴集团对深圳逐际动力科技有限公司（简称：逐际动力）进行战略投资，此举再次体现了阿里巴巴在智能机器人领域的坚定布局。

发表于 05-22 11:52 •794次阅读

阿里巴巴集团2024财年稳健增长

阿里巴巴集团近日公布了其2024财年第四季度及全年业绩报告，数据亮眼。在经历一年的主动变革后，阿里巴巴重回健康增长轨道。

发表于 05-16 11:23 •668次阅读

谷歌发布AI文生图大模型Imagen

近日，谷歌在人工智能领域取得新突破，正式推出了Imagen文生图模型。这款模型以其卓越的细节调整功能、逼真的光线效果以及从草图快速生成高分辨率图像

发表于 05-16 09:30 •521次阅读

阿里巴巴杭州全球总部正式启用

近日，阿里巴巴在杭州的未来科技城正式揭开了其全球总部新园区的面纱。这座园区不仅是阿里巴巴目前规模最大的综合性办公空间，更是其绿色、科技、可持续发展理念的生动体现。

发表于 05-13 11:15 •541次阅读

阿里达摩院提出“知识链”框架，降低大模型幻觉

近日，阿里巴巴达摩院（湖畔实验室）携手新加坡南洋理工大学等研究机构，共同推出了大模型知识链（CoK）框架。该框架不仅可实时检索异构知识源，还能逐步纠正推理错误，有效提高了大

发表于 05-10 11:46 •688次阅读

阿里巴巴推出全新AI图生视频模型EMO

近日，阿里巴巴集团智能计算研究院宣布推出了一款革命性的AI图片-音频-视频模型技术——EMO。据官方介绍，EMO是一种先进的音频驱动肖像视频生成框架

发表于 03-05 11:00 •1341次阅读

阿里巴巴重返中国顶级电商轨道

阿里巴巴集团董事会主席蔡崇信近日宣布，经过一系列架构重组和管理层变动后，阿里巴巴已成功重返中国顶级电商轨道。蔡崇信在讲话中强调，公司正在逐步调整战略，重新定位其在电商领域的领导地位。

发表于 02-27 14:29 •914次阅读

OpenAI文生视频模型Sora要点分析

近日，美国人工智能公司OpenAI发布了首个视频生成模型Sora。不同于此前许多AI大模型文生图

发表于 02-22 16:37 •1069次阅读

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相 2月16日凌晨OpenAI的首个

发表于 02-18 17:41 •982次阅读

阿里巴巴涨超3% 财报或超预期

阿里巴巴涨超3% 今日港股开盘后阿里巴巴涨超3%，恒生科技表现也很亮眼。快手、比亚迪电子、联想集团等多股上涨。 阿里巴巴将于2月7日发布2024财年第三季度财报，业界分析会超预期。

发表于 02-06 16:05 •1481次阅读

软银子公司确认减持阿里 阿里巴巴最大股东易主

软银子公司确认减持阿里软银集团旗下全资子公司Skybridge LLC在回应关于买卖阿里巴巴股票时表示，此前已经与金融机构签订了预付远期合约涉及5.21亿股；由于近几年已经分阶段实施并完成实物结算

发表于 01-26 20:45 •1783次阅读

镭神智能入选阿里巴巴诸神之战2023年度智能制造赛道之星

近日，阿里云发布《Create@阿里巴巴诸神之战2023年度新势力榜单》，镭神智能入选Create@阿里巴巴诸神之战2023年度智能制造赛道之星。据悉，2023年，Create@

发表于 01-20 08:23 •428次阅读

搜索历史

阿里巴巴发布AtomoVideo，兼容多款文生图模型的高保真图像视频框架

评论

阿里巴巴完成双重主要上市

阿里巴巴季报出炉阿里云二季度营收增长6%

快手自研文生图大模型“可图”开放，支持AI图像创作及定制

阿里巴巴投资逐际动力，深化智能机器人布局

阿里巴巴集团2024财年稳健增长

谷歌发布AI文生图大模型Imagen

阿里巴巴杭州全球总部正式启用

阿里达摩院提出“知识链”框架，降低大模型幻觉

阿里巴巴推出全新AI图生视频模型EMO

阿里巴巴重返中国顶级电商轨道

OpenAI文生视频模型Sora要点分析

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相

阿里巴巴涨超3% 财报或超预期

软银子公司确认减持阿里阿里巴巴最大股东易主

镭神智能入选阿里巴巴诸神之战2023年度智能制造赛道之星