4 月 19 日报道,近期微软亚洲研究院推出了名为 VASA-1 的创新模型,针对静态肖像照片和录音音频片段,其能实现图片中角色的自动化配音。
该模型,尤其擅长展现逼真的面部表情及各类情绪,且嘴唇动作高度拟真。然而,尽管研究员坦承目前仍有不足之处,如无法精准处理头发等纤维质元素,但相较于其他类似模型,VASA-1 的表现已属优异。
此外,研究员还透露,VASA-1 在离线批量处理模式下,可生成分辨率高达 512*512 的动态短片,帧速率为 45fps;在线直播模式下,帧速率也可达到 40fps,延迟时间仅为 170ms。而完成这一切,只需一台搭载 NVIDIA RTX 4090 显卡的计算机即可。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6590浏览量
104021 -
模型
+关注
关注
1文章
3226浏览量
48803 -
Vasa
+关注
关注
0文章
2浏览量
6569
发布评论请先 登录
相关推荐
天马与武进南大未来技术创新研究院达成战略合作
近日,天马新型显示技术研究院(厦门)有限公司、上海天马微电子有限公司与武进南大未来技术创新研究院就Micro LED业务、非显传感业务达成战略合作。
蓝思科技将新增昆山创新研究院,重点服务苹果
蓝思科技近日宣布,将新增一个重点研发机构,即蓝思昆山创新研究院,目前正在紧锣密鼓地建设中。该研究院的成立,标志着蓝思科技在研发领域的进一步拓展和深化。
中国电信人工智能研究院完成首个全国产化万卡万参大模型训练
近日,中国电信人工智能研究院宣布了一项重大技术突破:成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型。
摩尔线程携手智源研究院完成基于Triton的大模型算子库适配
近日,摩尔线程与北京智源人工智能研究院(简称:智源研究院)已顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。得益于摩尔线程自研统一系统计算架构MUSA,双方在短短一周多的时间
中国电信发布全球首个单体稠密万亿参数语义模型
近日,中国电信人工智能研究院(TeleAI)携手北京智源人工智能研究院,共同推出了全球首个单体稠密万亿参数语义模型——Tele-FLM-1T,这一里程碑式的成就标志着中国电信在人工智能
中国电信发布首个支持30种方言混说语音大模型
中国电信人工智能研究院(TeleAI)近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自
长沙北斗研究院总部基地正式奠基
长沙北斗研究院总部基地正式奠基 日前长沙北斗研究院总部基地正式奠基,项目由长沙北斗研究院牵头建设;项目又名“北斗足迹”。项目一期预计2025年年底前建成投用。 据悉,长沙北斗研究院总部
上海浦东软件园荣获SAP中国研究院“Bamboo Award”2023奖项
2024年4月,SAP d-com China开发者大会成功举办。会上,SAP中国研究院创新生态2.0专家委员会(以下简称“专委会”)成员单位上海浦东软件园获得SAP中国研究院 “Bamboo Award” 2023奖项,
本源入榜胡润研究院2024全球独角兽榜单!
胡润研究院从2017年开始追踪记录独角兽企业,这是第六次发布全球独角兽榜。榜单显示,截至2024年1月1日,全球共有1453家独角兽企业,总价值4.6万亿美元,分
浙江图灵算力研究院向知存科技颁发“年度最具影响力企业奖”
近日,浙江图灵算力研究院生态伙伴联谊会在杭州举行,知存科技作为研究院生态企业之一,与赛迪研究院、中科院计算所、自动化所和中国RISC-V联盟
微软内部对亚洲研究院的未来持有不同看法
四位消息人士披露,微软内部曾考虑过关闭或搬迁MSRA,但高层领导普遍倾向于维持实验室在中国的运作。目前,微软已在加拿大温哥华设立MSR分中心,部分研究员已被调配至此。此举旨在作为备用安置点,以应对可能面临的
院士专家齐聚!京彩未来联合重点研究院创建数字空间联合实验室
1月6日,京彩未来与北京大学数字中国研究院华南分院暨广东省数字广东研究院共同创建的“数字空间共同体联合室验室”正式挂牌运营。著名经济学家管清友博士、北京大学数字中国研究院华南分院暨广东
评论