当谈到快手,你会想到什么?
全年超 500 亿次播放量的快手短剧?还是 24H 突破 6.7 亿观看的周杰伦独家“哥友会”?
今天我们想聊聊,隐藏在繁荣数字社区背后的另一面——走在技术浪潮尖端的快手。
2022 年 10 月,在多媒体领域顶级会议 ACM Multimedia 举办的短视频多码率算法挑战赛中,快手超越全球百余支参赛队伍获得第一名,相关论文《PDAS: Probability-Driven Adaptive Streaming for Short Video》被会议收录。
同年 5 月,在由全球语音技术顶尖会议 INTERSPEECH 2022 与微软联合举办的音频丢包隐藏挑战赛中,快手在主办方评估的丢包隐藏平均主观意见分(PLCMOS),深度降噪平均主观意见分(DNSMOS),众包平均主观意见分(CMOS)和语音识别字准确率(WAcc)四项指标中均排名第一,综合得分获得世界冠军。
自成立至今,快手已陆续在学研合作方面取得重量级的科技奖项肯定,积累了 7000 多件国内外专利,覆盖从视频推荐系统、基础设施、音视频处理、多媒体理解、计算机视觉和图形学等方面。同时,快手也是 H.266/VVC 标准的主要技术贡献公司。快手视频标准技术团队自 2018 年起积极而高效地参与 H.266/VVC 国际视频编解码标准的制定,累计被采纳的核心技术提案有 45 件之多,在 80 多家参与公司中位居前列。
目前,快手在支持 HDR 画质和全景 4K 视频和直播、多码率自适应、编解码等技术领域处于行业领先地位,为用户提供清晰、流畅的音视频体验;同时利用 AI 技术,推出了影音特效、数字人等多种创作工具,赋能创意创作,增强人机交互体验。
近期,以 ChatGPT 为代表的大模型面世,带来了 AI 大模型技术热潮。研究表明,知识密集任务中越大的模型学习效率越高(相同训练数据量下,模型越大任务效果越好),主流大模型的参数大都超过了千亿 (100B) 规模,同时也给模型的高效训练和推理部署带来严峻挑战。而快手围绕提高模型计算效率和可部署开展技术攻关,沉淀了一套通用的混合并行训练、压缩、推理整体解决方案,先后落地由百亿参数 Dense 模型到千亿参数 MOE 模型,助力业务取得显著收益。
此外,快手 to B 品牌 StreamLake 将沉淀多年的音视频和 AI 等关键技术能力以产品化的形式对外开放,为企业客户提供一站式的音视频+AI 解决方案。
本次 GTC 大会上,来自快手的技术专家将带来精彩的内容分享,涵盖画质提升、数字人、性能优化等话题,还将分享多模态超大模型在短视频场景的落地应用,干货满满,不容错过!
扫码二维码,免费注册参会
即刻预约观看快手 GTC 精彩演讲内容
以下为议题简介。
GTC23 快手演讲推荐
快手视频质量评价和画质增强解决方案
会议代码:[S52305]
演讲时间:3 月 22 日 即可在线观看
演讲嘉宾:
孙明,快手音视频图像算法负责人
演讲概要:
快手拥有大量 UGC 视频,视频不仅内容多样,且从生产到消费链路较长,不可避免会影响视频清晰度。
为了提升用户体验,快手针对 UGC 视频特性,提出视频画质评估算法体系(KVQ)和画质修复增强方案(KRP/KEP)。其中 KVQ 算法体系包括 noise/blocky/blur等子维度,KRP/KEP 画质解决方案包括 SR/deblur/deart 等算子,两者相辅相成,大幅提升消费侧画质清晰度。本次演讲将分享快手在视频质量评价和画质增强方面的经验与解决方案。
快手 3D 数字人直播及互动解决方案
会议代码:[S52307]
演讲时间:3 月 22 日3:00 PM
演讲嘉宾:
简伟华,快手视觉互动技术负责人
演讲概要:
快手围绕 3D 数字人开播及互动落地,在直播、社交等领域进行了系列实践,背后来自数字人开播互动技术方案的强大支撑——分别是快手虚拟世界互动平台(Kuaishou Metaverse Interactive Platform,简称 KMIP),基于 PAAS 技术基础支撑各种上层应用;以及快手虚拟演播助手(Kuaishou Virtual Studio,简称 KVS),面向多应用场景。
本场演讲将介绍快手 KMIP 和 KVS 的架构,并分享如何通过 KVS 应用商店,接入快手虚拟世界应用生态,与数亿用户一起共拓元宇宙应用市场。
会议代码:[S51416]
演讲时间:3 月 23 日 9:00 AM
演讲嘉宾:
门春雷,快手算法引擎专家
演讲概要:
快手 AI 预估系统广泛采用 TensorRT 加速计算。实践发现,TensorRT 在通用模型上性能 SOTA,但是在业务模型中存在一些性能瓶颈子图,需要进一步优化。
为了优化性能瓶颈子图,快手设计了一种利用 AI 编译器优化子图的端到端框架,该框架分析 ONNX Graph 中性能瓶颈子图并自动切分,利用 AI 编译器进行图优化并生成实现程序,然后填充到 TensorRT Plugin,同时生成优化后 ONNX Graph,用于生成 TensorRT Engine。本演讲将分享快手基于 TensorRT 的端到端子图优化框架及其应用。
针对大型推荐模型的性能优化
会议代码:[S51566]
演讲时间:3 月 23 日 11:00 AM
演讲嘉宾:
梁潇,快手软件架构师
演讲概要:
快手的推荐系统面临模型规模大、海量候选集等挑战。
本场演讲将主要探讨如何对访存密集型的推荐系统进行深度优化,使得在一台机器上的 GPU 和 CPU 资源均被充分利用,从而提高服务的吞吐。
多模态超大模型在短视频场景落地应用
会议代码:[SE52361]
演讲时间:3 月 22 日 3:00 PM
演讲嘉宾:
张胜卓,快手算法引擎专家
韩青长,快手算法引擎工程师
李杰,快手算法引擎工程师
门春雷,快手算法引擎专家
演讲概要:
快手拥有海量的短视频和直播数据,利用这些数据研发预训练大模型,可以提高多模态特征等通用内容理解能力,助力推荐、广告、搜索等核心业务发展。针对千亿参数超大模型,快手沉淀了训练、AutoML、推理优化和预估框架整套解决方案,助力多模态超大模型在短视频场景落地应用。本场演讲将分享快手在相关方面的探索与进展。
预约感兴趣的演讲内容
想要预约以上精彩内容?扫描下方图片二维码 或 点击 “阅读原文”,即可搜索相关会议代码找到对应演讲内容,通过点击 “Add to Schedule” 或 点击 “星星” ,将该演讲内容添加至您的日程,大会开始后登录即可在线观看。
例如:搜索演讲代码 [SE52361],点击 “Add to Schedule”,即可将该演讲添加至您的日程。
例如:搜索演讲代码 [S52305],发现没有 “Add to Schedule” 按钮,说明该演讲为点播形式,从 3 月 22 日开始即可在线观看。点击右上方的星星,将该演讲添加至您的日程。
如果尚未注册,请点击链接查看 GTC23 注册教程。
关于 GTC23
NVIDIA GTC是一个面向全球 AI 开发者的大会,将于2023 年 3 月 20 日-23 日在线上举行,包括超过 650 场演讲、专家座谈会以及特别活动,涵盖加速计算和开发工具、计算机视觉、对话式 AI/NLP、数据科学、深度学习、推荐系统/个性化、元宇宙等多个主题。目前已确认参与本届 GTC 的重磅嘉宾包括:Open AI 的联合创始人兼首席科学家 Ilya Stutskever、DeepMind 的创始人兼 CEO Demis Hassabis 等。NVIDIA 创始人兼首席执行官黄仁勋将在本次 GTC 主题演讲中分享 NVIDIA 加速计算平台如何推动 AI、元宇宙、云技术和可持续计算的下一波浪潮。
欢迎加入 GTC 23,与全球 AI 者同行!
扫描下方海报二维码,即可免费注册 GTC23,在 3 月 24 日 听 OpenAI 联合创始人与 NVIDIA 创始人的炉边谈话,将由 NVIDIA 专家主持,配中文讲解和实时答疑,一起看 AI 的现状和未来!
原文标题:GTC23 | 由 “深” 至 “广”,与快手一起探索前沿技术的无限可能
文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
-
英伟达
+关注
关注
22文章
3746浏览量
90833
原文标题:GTC23 | 由 “深” 至 “广”,与快手一起探索前沿技术的无限可能
文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论