谷歌推出多模态VLOGGER AI-电子发烧友网

谷歌最新推出的VLOGGER AI技术引起了广泛关注，这项创新的多模态模型能够让静态肖像图“活”起来并“说话”。用户只需提供一张人物肖像照片和一段音频内容，VLOGGER AI就能让图片中的人物仿佛真的在朗读这段音频，面部表情丰富，栩栩如生。

VLOGGER AI作为一种专为虚拟肖像设计的多模态Diffusion模型，其强大能力得益于MENTOR数据库的丰富资源。这个数据库收录了超过80万名人物肖像，以及累计超过2200小时的影片，使得VLOGGER能够生成各种种族、年龄、穿着和姿势的肖像影片，极大增加了其适用性和实用性。

谷歌对VLOGGER AI寄予厚望，将其视为迈向“通用聊天机器人”的重要一步。未来，这种AI技术有望通过语音、手势和眼神交流等方式，以更加自然和人性化的方式与人类进行互动。

这一技术的推出不仅展示了谷歌在人工智能领域的深厚实力，也为虚拟形象、影视制作等领域带来了全新的可能性。未来，我们可以期待看到更多由VLOGGER AI生成的生动、真实的虚拟人物形象，在娱乐、教育、广告等多个领域大放异彩。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6168

浏览量
105412
AI

AI

+关注

关注
87

文章
30932

浏览量
269178
模型

模型

+关注

关注
1

文章
3247

浏览量
48856

高通与智谱推动多模态生成式AI体验的终端侧部署

此前，骁龙峰会首日，智谱与高通技术公司宣布合作将GLM-4V端侧视觉大模型，面向骁龙8至尊版进行深度适配和推理优化，支持丰富的多模态交互方式，进一步推动多模态生成式

发表于 11-08 09:55 •182次阅读

苹果发布300亿参数多模态AI大模型MM1.5

苹果近日推出了全新的多模态AI大模型MM1.5，该模型拥有高达300亿的参数规模，是在前代MM1架构的基础上进一步发展而来的。

发表于 10-14 15:50 •275次阅读

Meta发布多模态LLAMA 3.2人工智能模型

Meta Platforms近日宣布了一项重要技术突破，成功推出了多模态LLAMA 3.2人工智能模型。这一创新模型不仅能够深度解析文本信息，还实现了对图像内容的精准理解，标志着Meta在AI

发表于 09-27 11:44 •411次阅读

云知声推出山海多模态大模型

在人工智能技术的浩瀚星海中，多模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后，云知声以创新之姿，推出了其匠心独运的山海多

发表于 08-27 15:20 •394次阅读

Meta不会在欧盟提供新的多模态AI模型

科技巨头Meta近日宣布了一项重要决策，其即将推出的创新多模态Llama模型将不会在欧盟地区发布。这一决定背后，是Meta对欧洲复杂且不可预测的监管环境的深刻考量，也为Meta与欧盟监管机构之间的紧张关系再添一笔。

发表于 07-19 16:04 •490次阅读

商汤科技推出SenseFoundry-VL方舟多模态新智平台

WAIC 2024期间，基于 “日日新5.5”大模型体系能力，商汤“方舟城市开放平台”进行全新产品架构升级，推出首个“大模型+城市服务”的解决方案及应用实践「SenseFoundry-VL 方舟多模态新智平台」，助力智慧城市

发表于 07-12 14:15 •587次阅读

智谱AI发布全新多模态开源模型GLM-4-9B

近日，智谱AI在人工智能领域取得重大突破，成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力，再次刷新了业界对于大型语言模型的认识。

发表于 06-07 09:17 •751次阅读

Build 2024发布多项Azure AI Speech全新多模态功能

客户们持续使用 Azure OpenAI 和 Azure AI Speech 进行创新，为企业引入新的效率，并构建新的多模态体验。

发表于 05-28 09:08 •575次阅读

谷歌发布多模态AI新品，加剧AI巨头竞争

在全球AI竞技场上，谷歌与OpenAI一直稳居领先地位。近日，谷歌在I/O开发者大会上掀起了一股新的技术浪潮，发布了多款全新升级的多模态

发表于 05-16 09:28 •455次阅读

李未可科技正式推出WAKE-AI多模态AI大模型

李未可科技多模态 AI 大模型正式发布，积极推进 AI 在终端的场景应用 4月18日，2024中国生成式AI大会上李未可科技正式发布为眼

发表于 04-18 17:01 •606次阅读

谷歌发布VLOGGER AI模型，实现肖像朗读音频内容

具体来说，VLOGGER AI 采用一种适应虚拟肖像的多模态 Diffusion 模型，通过 MENTOR 数据库进行训练，涵盖了超80万个人物肖像及超过2200小时的视频数据。得益于

发表于 03-19 14:27 •796次阅读

蚂蚁集团推出20亿参数多模态遥感基础模型SkySense

近日，蚂蚁集团联合武汉大学宣布成功研发出20亿参数多模态遥感基础模型SkySense。这一创新模型由蚂蚁集团的AI创新研发部门NextEvo与武汉大学共同完成，是迄今为止国际上参数规模最大、覆盖任务最全、识别精度最高的

发表于 03-04 11:22 •822次阅读

MWC2024：高通推出全新AI Hub及前沿多模态大模型

2024年世界移动通信大会（MWC）上，高通再次展现其技术领导力，通过发布全新的高通AI Hub和展示前沿的多模态大模型技术，推动了5G和AI技术的融合创新。

发表于 02-26 16:59 •1276次阅读

【有奖】百度智能云度目推出首款多模态 AI 模组，应用场景有奖征集！

他来了，他来了大模型时代悄然到来百度首款大模型落地的硬件产品度目多模态AI模组LUCA系列正式亮相度目LUCA深度集成百度语音芯片接入百度智能云千帆 APPxBuilder大模型应用平台

发表于 02-26 15:19 •546次阅读

阿里巴巴推出自主多模态AI代理MobileAgent

阿里巴巴最近推出了一款名为MobileAgent的自主多模态AI代理，这款产品模拟人类操作手机，并采用纯视觉解决方案，无需任何系统代码。

发表于 02-04 10:34 •1057次阅读

搜索历史

谷歌推出多模态VLOGGER AI

评论

高通与智谱推动多模态生成式AI体验的终端侧部署

苹果发布300亿参数多模态AI大模型MM1.5

Meta发布多模态LLAMA 3.2人工智能模型

云知声推出山海多模态大模型

Meta不会在欧盟提供新的多模态AI模型

商汤科技推出SenseFoundry-VL方舟多模态新智平台

智谱AI发布全新多模态开源模型GLM-4-9B

Build 2024发布多项Azure AI Speech全新多模态功能

谷歌发布多模态AI新品，加剧AI巨头竞争

李未可科技正式推出WAKE-AI多模态AI大模型

谷歌发布VLOGGER AI模型，实现肖像朗读音频内容

蚂蚁集团推出20亿参数多模态遥感基础模型SkySense

MWC2024：高通推出全新AI Hub及前沿多模态大模型

【有奖】百度智能云度目推出首款多模态 AI 模组，应用场景有奖征集！

阿里巴巴推出自主多模态AI代理MobileAgent