0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出多模态VLOGGER AI

CHANBAEK 来源:网络整理 2024-03-22 10:45 次阅读

谷歌最新推出的VLOGGER AI技术引起了广泛关注,这项创新的多模态模型能够让静态肖像图“活”起来并“说话”。用户只需提供一张人物肖像照片和一段音频内容,VLOGGER AI就能让图片中的人物仿佛真的在朗读这段音频,面部表情丰富,栩栩如生。

VLOGGER AI作为一种专为虚拟肖像设计的多模态Diffusion模型,其强大能力得益于MENTOR数据库的丰富资源。这个数据库收录了超过80万名人物肖像,以及累计超过2200小时的影片,使得VLOGGER能够生成各种种族、年龄、穿着和姿势的肖像影片,极大增加了其适用性和实用性。

谷歌对VLOGGER AI寄予厚望,将其视为迈向“通用聊天机器人”的重要一步。未来,这种AI技术有望通过语音、手势和眼神交流等方式,以更加自然和人性化的方式与人类进行互动。

这一技术的推出不仅展示了谷歌在人工智能领域的深厚实力,也为虚拟形象、影视制作等领域带来了全新的可能性。未来,我们可以期待看到更多由VLOGGER AI生成的生动、真实的虚拟人物形象,在娱乐、教育、广告等多个领域大放异彩。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6010

    浏览量

    103601
  • AI
    AI
    +关注

    关注

    87

    文章

    27461

    浏览量

    265134
  • 模型
    +关注

    关注

    1

    文章

    2823

    浏览量

    48055
收藏 人收藏

    评论

    相关推荐

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/模态交互/英语评测SDK合集)

    丰富外设配件 配套模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用 板载 DAPLINK 调试器,外接一条USB 线即可实现烧录、调试、串口日志查看 板载网络模组,支持开发联网类
    发表于 06-18 17:33

    智谱AI发布全新多模态开源模型GLM-4-9B

    近日,智谱AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力,再次刷新了业界对于大型语言模型的认识。
    的头像 发表于 06-07 09:17 329次阅读

    Build 2024发布多项Azure AI Speech全新多模态功能

    客户们持续使用 Azure OpenAI 和 Azure AI Speech 进行创新,为企业引入新的效率,并构建新的多模态体验。
    的头像 发表于 05-28 09:08 329次阅读
    Build 2024发布多项Azure <b class='flag-5'>AI</b> Speech全新多<b class='flag-5'>模态</b>功能

    谷歌I/O大会AI+AR眼镜原型揭幕,Meta/微美全息加速引领AR消费生态新篇章

    ”、生成式人工智能赋能谷歌搜索、以及一系列与图像、音乐、视频有关的生成式AI工具。   AI+AR眼镜原型机曝光   此外,本次发布会中,谷歌展示了一个结合了自家多
    的头像 发表于 05-27 17:19 199次阅读
    <b class='flag-5'>谷歌</b>I/O大会<b class='flag-5'>AI</b>+AR眼镜原型揭幕,Meta/微美全息加速引领AR消费生态新篇章

    两小时“吼出”121次AI谷歌背后埋伏着Open AI的幽灵

    谷歌AI依旧不痛不痒谷歌和OpenAI的又一次对阵,刚刚落幕了。北京时间5月14日凌晨,OpenAI发布端到端多模态AI大模型GPT-4o
    的头像 发表于 05-19 08:05 378次阅读
    两小时“吼出”121次<b class='flag-5'>AI</b>,<b class='flag-5'>谷歌</b>背后埋伏着Open <b class='flag-5'>AI</b>的幽灵

    谷歌发布多模态AI新品,加剧AI巨头竞争

    在全球AI竞技场上,谷歌与OpenAI一直稳居领先地位。近日,谷歌在I/O开发者大会上掀起了一股新的技术浪潮,发布了多款全新升级的多模态AI
    的头像 发表于 05-16 09:28 276次阅读

    李未可科技正式推出WAKE-AI模态AI大模型

    李未可科技多模态 AI 大模型正式发布,积极推进 AI 在终端的场景应用   4月18日,2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-
    发表于 04-18 17:01 394次阅读
    李未可科技正式<b class='flag-5'>推出</b>WAKE-<b class='flag-5'>AI</b>多<b class='flag-5'>模态</b><b class='flag-5'>AI</b>大模型

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日发布了一项令人瞩目的新功能,它是一款能够借助自然语言对话帮助用户生成旅行行程和出游建议的AI工具。这款工具的推出,标志着谷歌在人工智能领域的又一重要突破。
    的头像 发表于 03-29 11:08 364次阅读

    谷歌发布VLOGGER AI模型,实现肖像朗读音频内容

    具体来说,VLOGGER AI 采用一种适应虚拟肖像的多模态 Diffusion 模型,通过 MENTOR 数据库进行训练,涵盖了超80万个人物肖像及超过2200小时的视频数据。得益于此,VL
    的头像 发表于 03-19 14:27 465次阅读

    MWC2024:高通推出全新AI Hub及前沿多模态大模型

    2024年世界移动通信大会(MWC)上,高通再次展现其技术领导力,通过发布全新的高通AI Hub和展示前沿的多模态大模型技术,推动了5G和AI技术的融合创新。
    的头像 发表于 02-26 16:59 902次阅读

    谷歌推出AI扩散模型Lumiere

    近日,谷歌研究院重磅推出全新AI扩散模型Lumiere,这款模型基于谷歌自主研发的“Space-Time U-Net”基础架构,旨在实现视频生成的一次性完成,同时保证视频的真实性和动作
    的头像 发表于 02-04 13:49 699次阅读

    阿里巴巴推出自主多模态AI代理MobileAgent

    阿里巴巴最近推出了一款名为MobileAgent的自主多模态AI代理,这款产品模拟人类操作手机,并采用纯视觉解决方案,无需任何系统代码。
    的头像 发表于 02-04 10:34 639次阅读

    成都汇阳投资关于多模态驱动应用前景广阔,上游算力迎机会!

    【Gemini 大模型主打多模态,性能对标 GPT-4】 当地时间12月6日, 谷歌公司宣布推出其规模最大、功能最强的多模态大模型 Gemini, 其最强大的 TPU (张量处理单元)
    的头像 发表于 12-18 13:08 320次阅读
    成都汇阳投资关于多<b class='flag-5'>模态</b>驱动应用前景广阔,上游算力迎机会!

    成都汇阳投资关于谷歌携 Gemini 王者归来,AI 算力和应用值得期待

    【Gemini 大模型主打多模态,性能对标GPT-4】 当地时间12月6日, 谷歌公司宣布推出其规模最大、功能最强的多模态大模型 Gemini, 其最强大的 TPU (张量处理单元)系
    的头像 发表于 12-11 14:40 712次阅读
    成都汇阳投资关于<b class='flag-5'>谷歌</b>携 Gemini 王者归来,<b class='flag-5'>AI</b> 算力和应用值得期待

    谷歌揭秘Gemini,AMD对峙英伟达

    今天,我们看到谷歌揭开了多模态AI模型Gemini的神秘面纱,AMD挑战英伟达在AI芯片市场的霸主地位,微软在英国AI领域的巨额投资,以及3
    的头像 发表于 12-07 20:05 508次阅读