0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成

甲子光年 来源:甲子发现 2024-02-22 13:36 次阅读

独家获悉,谷歌高级科学家、卡内基梅隆大学(CMU)计算机学院兼职教授蒋路,已经加入TikTok。

蒋路是谷歌 VideoPoet 项目负责人,VideoPoet 是谷歌在 2023 年 12 月推出的视频生成大模型,类似 OpenAI 刚刚发布的 Sora。

近期,昆仑万维创始人周亚辉在朋友圈表示,有个论文的作者加入字节北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》论文的作者蒋路。

资料显示,蒋路先后在西安交通大学、布鲁塞尔自由大学、卡内基梅隆大学学习计算机,并先后进入微软亚洲研究院、谷歌研究院、雅虎研究院实习。

2017 年,蒋路毕业后加入谷歌。他是谷歌云 AI 的创始成员,也是李佳博士和李飞飞博士首次聘请的研究员。此后,蒋路进入谷歌研究院工作。

蒋路的研究曾被应用到谷歌多个产品,如 YouTube、云服务、云 AutoML、广告、Waymo 和翻译服务,影响了全球数十亿用户的日常生活。

蒋路的工作在自然语言处理(ACL)和计算机视觉(CVPR)的顶级会议上被提名为最佳论文。他是研究社区的活跃成员,担任美国国家种子基金(NSF SBIR)的 AI 评审专家,并定期担任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名会议的领域主席。

蒋路的研究兴趣主要在多媒体交叉领域,他专注于生成式 AI 和视频创作。2019 年起,他就开始尝试将 Transformer 用在图像、视频生成研究上。

与 Sora 采用的 Diffusion + Transformer 架构不同,蒋路负责的 VideoPoet 视频生成模型采用了单 Transformer 架构,可以将任何自回归语言模型或大型语言模型转换为高质量的视频生成器,支持生成方形或纵向视频,以针对短格式内容定制生成视频,并支持视频输入生成音频

VideoPoet 采用了名为 Tokenizer 的数据处理技术,可以将视频和音频片段编码为离散标记序列(discrete tokens),这些标记也可以被转换回原始表示。其中,视频和图像数据使用名为 MAGVIT V2 的技术,音频数据使用 SoundStream 的技术。

VideoPoet 通过使用多个 Tokenizer 训练一个自回归语言模型,以学习跨视频、图像、音频和文本模态。一旦模型根据某些上下文生成了标记,这些标记就可以通过分词器解码器转换回可查看的表示。

fe1ad37c-d143-11ee-a297-92fbcf53809c.png

3 周前,蒋路本人在职场社交平台宣布了自己在谷歌的 Last Day,并特别表示对在谷歌所做的视频生成项目(VideoPoet,MAGVIT,WALT等)感到自豪。

蒋路表示自己将继续留在湾区,开始视频生成领域的新旅程。现在来看,新的旅程就是 TikTok。

值得一提的是,字节跳动已经在大模型领域全面布局,模型层推出了自研的「云雀大模型」以及类 ChatGPT 对话机器人产品豆包。2023 年底,字节跳动成立新的 AI 应用部门 Flow,并在海外推出了 Coze 等多款产品。抖音集团 CEO 张楠也于近期卸任,专注于 AI 工具剪映的发展。

字节跳动近期辟谣了推出中文版 Sora,并表示:“还无法完善产品落地,距离国外模型有很大差距。”但另一方面,字节跳动正在大力招揽人才。

大模型战场,字节跳动将会如何搅局?




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28191

    浏览量

    206487
  • 计算机视觉
    +关注

    关注

    8

    文章

    1696

    浏览量

    45927
  • OpenAI
    +关注

    关注

    9

    文章

    1042

    浏览量

    6404
  • TikTok
    +关注

    关注

    2

    文章

    213

    浏览量

    7215

原文标题:独家:TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成|甲子光年

文章出处:【微信号:jazzyear,微信公众号:甲子光年】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    字节跳动自研视频生成模型Seaweed开放

    近日,字节跳动旗下的AI内容平台即梦AI传来新消息,宣布自研的视频生成模型Seaweed即日起正式面向平台用户开放使用。这一举措标志着字节跳动在AI
    的头像 发表于 11-11 14:31 194次阅读

    火山引擎推出豆包·视频生成模型

    在近期举办的2024火山引擎AI创新巡展上,火山引擎总裁谭待隆重推出了豆包·视频生成模型,这一举措标志着火山引擎在视频内容生成领域迈出了重要一步。豆包模型凭借其独特的技术优势,吸引了业
    的头像 发表于 09-25 14:11 255次阅读

    OpenAI硬件负责人热议AI基础设施扩展与节能方案

    在近日于斯坦福大学举办的Hot Chips 2024大会上,OpenAI的硬件设施负责人Trevor Cai发表了一场深入人心的演讲,其核心聚焦于“构建可扩展的AI基础设施”。Trevor Cai
    的头像 发表于 09-02 16:20 501次阅读

    谷歌任命原Character.AI首席执行官为Gemini联合技术负责人

    近日,谷歌宣布了一项重要人事任命,原Character.AI的联合创始人兼首席执行官诺姆·沙泽尔(Noam Shazeer)已重返谷歌,并将担任其人工智能新项目“Gemini”的联合技术负责人
    的头像 发表于 08-26 11:06 470次阅读

    MediaTek与快手携手创新,端侧视频生成技术引领AI新纪元

    在科技日新月异的今天,MediaTek与快手再次携手,于近日宣布了一项重大技术突破——高效端侧视频生成技术的诞生。这项技术不仅是对即将于2024年世界移动通信大会(MWC 2024)上亮相的先进视频生成技术的有力延续,更是双方在生成
    的头像 发表于 07-05 11:52 963次阅读

    MediaTek联合快手推出高效端侧视频生成技术

    MediaTek 与快手共同宣布,推出高效端侧视频生成技术,共同探索并推进生成AI 技术的革新。作为对 2024 世界移动通信大会(MWC 2024)上亮相的视频生成技术的延续,该
    的头像 发表于 07-05 11:23 4755次阅读

    三星电子任命半导体业务新负责人,加码AI芯片市场

    三星电子近日宣布,任命Young Hyun Jun为半导体部门的新负责人,此举旨在进一步加码AI芯片市场,以追赶包括SK海力士在内的竞争对手。
    的头像 发表于 05-27 14:06 475次阅读

    谷歌发布全新视频生成模型Veo与Imagen文生图模型

    谷歌近日宣布了两项重大技术进展,首先是视频生成模型Veo的正式推出。这款先进的模型能够支持生成质量更高的视频内容,让用户能够根据自己的需求设定光照、镜头语言、
    的头像 发表于 05-16 10:46 363次阅读

    阿里云视频生成技术创新!视频生成使用了哪些AI技术和算法

    照片就能让 EMO 合成演戏唱歌视频。   阿里云在视频生成领域的创新   EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院开发的框架,一个音频驱动的 AI 肖像
    的头像 发表于 05-08 00:07 3320次阅读

    小鹏汽车迎来新AI负责人,研发XNGP技术

    小鹏汽车近日迎来新的AI团队负责人——Cruise公司前高级资深机器学习工程师LiuXianming。他将带领小鹏AI团队研发XNGP技术,为公司的自动驾驶领域注入新的活力。
    的头像 发表于 03-26 10:43 650次阅读

    新火种AI|围攻光明顶:Sora效应下的AI视频生成竞赛

    Sora的出现,让AI视频生成领域真正“活”了起来
    的头像 发表于 03-16 11:12 601次阅读

    除了刷屏的Sora,国内外还有哪些AI视频生成工具

    。Sora的发布也让AI生成视频有了突破性进展。   过去一年多,全球科技公司都在发布各种大模型,然而AI生成内容更多集中在文本和图片方面,
    的头像 发表于 02-26 08:42 4242次阅读
    除了刷屏的Sora,国内外还有哪些<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>工具

    openai发布首个视频生成模型sora

    美国当地时间2024年2月15日 ,OpenAI正式发布文生视频模型Sora ,并发布了48个文生视频案例和技术报告 ,正式入局视频生成领域 。Sora能够根据提示词生成60s的连贯
    的头像 发表于 02-21 16:45 1175次阅读

    AI视频年大爆发!2023年AI视频生成领域的现状全盘点

    2023年,也是AI视频元年。过去一年究竟有哪些爆款应用诞生,未来视频生成领域面临的难题还有哪些?
    的头像 发表于 02-20 10:40 1130次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视频</b>年大爆发!2023年<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>领域的现状全盘点

    OpenAI发布文生视频模型Sora,引领AI视频生成新纪元

    在人工智能(AI)领域掀起新一轮革命浪潮的,正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型,以其“逼真”和“富有想象”的视频生成能力,彻底颠覆了传统
    的头像 发表于 02-19 11:03 882次阅读