人工智能在视频增强领域中的应用与挑战-电子发烧友网

全国范围内，一场关于5G建设的产业大潮被按下加速键。作为5G率先落地的重要应用领域，以4K为代表的超高清视频成为产业链集中布局的新方向。与此同时，5G+4K为大屏电视的未来形态插上想象的翅膀，为IPTV、OTT提供更多的智能赋能新动能。

5月8-9日，以“启智 • 视听”为主题的流媒体网第十七届论道暨中国IPTV/OTT视听产业高峰论坛在山东济南举行。8日下午，在主题为“探索*求新5G+4K” 的分论坛上，福建帝视信息科技有限公司首席科学家李根进行了主题为《人工智能在视频增强领域中的应用与挑战》的演讲。

关于帝视科技

帝视科技成立于2016年，是一家致力于引领机器学习和计算机视觉前沿技术研究与开发的人工智能公司, 利用人工智能技术来实现图片和视频的深度压缩和视觉增强，提供更加高效、低成本的图片和视频传输解决方案。

近两年半的时间内，帝视科技已有一名国家级人才，以及三名省级人才，已经申报了近30多项国家发明专利和软著。2018年，我们公司获得了日本软银领投的A轮融资。

近两年，我们公司获得很多荣誉，包括英伟达中国最佳初创人工智能公司五强，网易创业家大赛厦门赛区的冠军，全国总决赛的亚军，创响福建中小企业创新创业大赛亚军。我们团队入选了福建省百人计划。

经过几年的发展，视频内容已经从标清到高清，再到超高清时代。在国内，1992年推出标清视频标准，也就是DVD/VCD的时代，视频的物理分辨率在720P以下。在高清视频时代，视频的物理分辨率已经超过720或者1080P 。

国家广电总局发布了高清视频标准。2008年，北京奥运会全程都是以高清分辨率进行比赛直播。今年开始，机顶盒不支持高清以下的分辨率。也就是说，今后大家无法通过机顶盒收视720P 以下的视频内容。

接下来进入超高清的时代。最大的变化是它的分辨率超过了1080P，国家广电总局先后发布了4K超高清电视选购标准和超高清视频产业发展行动计划。大家看一下，国内发表的《超高清视频产业发展行动计划(2019-2022年)》的大致内容，国内是4K先行，兼顾8K的总体技术路线。到2020年，超高清视频产业总体规模会超过4万亿元。4K电视终端全面普及，符合高动态范围(HDR)、宽色域、三维声、高帧率、高色深要求的4K电视终端销量占电视总销量的比例超过40%;8K关键技术产品研发和产业化取得突破，8K电视占比要达到5%。现在全国有很多电子厂商在推出8K电视，包括夏普、三星、索尼、海信、创维、TCL等。

在政府大力扶持下，超高清市场还是面临着视频内容匮乏，网络承载有限，标准规范尚未完善的问题。

前面几位嘉宾也提到，即将会普及5G网络。另外，很多国家都在大力支持4K/8K的视频标准。所以，网络和标准化问题会有非常大的改善。

超高清视频内容匮乏的问题可能很难在短时间内通过视频采集，编辑等方式解决。因为高质量的视频内容制作有周期长、成本高、成片率低的缺点。

因此，我们公司产品研发路线非常明确，通过基于人工智能的视频增强技术解决现阶段超高清视频内容匮乏的问题。

什么是超高清视频?

那我们经常被问到什么叫超高清视频?超高清视频是视频的面积，体积上具有更高级别的要求。视频面积上，提升到4K/8K高分辨率，目的在于，可以提高视频清晰度。

在色深声方面，提高到10位/12位。色深体现在颜色渐变会更平滑。色域采用 BT2020的宽色域，其效果更接近真实的场景的颜色。

除此之外，超高清视频采用高动态范围HDR，HDR的好处在于可以提升阴暗对比度会。视频体积上也有改进。视频的帧率提高到60帧或者120帧。高帧率好处在于视频播放更流畅。

我们帝视科技，超高清视频转码时，同时考虑超高清五项标准。因为时间关系，这里主要简单介绍视频超分辨率和高帧率重制算法。

视频超分辨率，基于人工智能技术实现超分辨率的算法可以分为六大类。

第一种，采用传统差值放大后提取图像细节特征，第二种，低分辨率图像中直接提取细节特征，然后采用特征层进行放大。这样的好处是可以得到加速的效果。第三种，采用渐进式的放大，得到超大倍率的超分效果。

第四种，采用多次特征层上采样和下采样。第五种，引用了语义信息，较为相似特征的不同类别的目标，采用不同的模型，从而得到更好的超分效果。

另外一种，引用了强化学习，但是，这些方法都存在计算代价太大，很难应用于工业界。

因此，我们公司针对不同客户，提出两种策略。针对实时性要求不高的客户，提供效果优先的离线转码策略，另外针对实时性要求较高的互联网产业的客户提供效率优先的轻量级移动端模型。

离线转码模型是采用密集连接的方式实现视频超分，移动端模型采用深度可分离卷积和循环密集连接的策略。

以上两种算法都已得到国际顶级学术会议的认可，业界性能指标评估中，都获得不错的效果。

给大家演示高清转超高清的效果。左边是1080P的视频，右边是局部区域的视频内容。很容易看出超分处理后的效果明显好于传统插值放大的效果，很多细节表现的更清楚。

高帧率，可分为四种类型。第一种，采用了光流信息，第二种采用光流和深度信息。第三种是采用双向光流信息，第四种是端到端实现高帧率重制效果。

一般情况下，很难获取光流和深度信息，因此，我们端到端的训练策略，改进了高帧率重制算法，从而得到非常好的高帧率重制效果。

怎样提高超高清视频质量?

视频内容可能会受到某些因素，直接影响视频画质。比如为了降低带宽成本，互联网行业传输视频的时候，降低码率，这直接影响视频质量。

视频内容会受到采集设备的影响，不同品牌的拍摄设备的像素密度都存在一些差异性，像素密度低，采集的视频内容可能会存在失真现象。拍摄经验不足，也会导致拍摄内容中存在一些缺陷。

那先给大家分享，帝视科技如何去解决存在压缩伪影的视频呢?首先存在这些视频压缩伪影的视频进行去压缩伪影，采用视频的空间信息和时序信息去除压缩伪影，其后，在进行视频超分，从而得到去除伪影区域的污点肯和毛刺。

另外，跟华为mate10去压缩伪影效果对比，在计算复杂度是华为的16%的情况下，我们只利用普通的GPU上去伪影的效果超过华为的效果。

接下来，大家可能碰到用手机夜间拍摄时，光通量不足的情况，这会采集的视频中引入很多噪声，直接用传统方式视频降噪，会导致很多细节会变成模糊。

我们帝视科技采取基于人工智能的视频降噪的方式，自适应的判断噪声区域和噪声强度。

这两个例子中，我们可以看出降噪算法的鲁棒性，与左边视频相比，右边视频的噪声强度更大。但是我们只利用一种降噪算法就能处理噪声区域的污点。

接下来看一下老旧影片的降噪效果，很容易发现老旧影片实例中也能得到非常好的降噪效果。

色彩增强，视频例子中可以看出，我们帝视科技的色彩增强后的色彩，亮度、对比度、饱和度更讨人喜欢。

视频上色，我们的视频上色算法采用了注意力机制，语义信息和调色板。以下是黑白图片上色的效果。不仅能处理风景，而且也能处理人物的场景。接下来看一下，罗马假日视频中的上色效果，目前视频上色还存在一些时序不一致的问题，我们还在优化算法，有待提升视频上色效果。

简单介绍几种基于人工智能的视频增强及修复的技术，那我们公司怎么利用这些视频增强及修复功能呢?

怎样实现傻瓜式的超高清视频转码?

考虑到客户的需求，帝视科技尽量把超高清视频转码服务，做成非常傻瓜式的转码操作平台。

我们公司提出AI 4K重制工具包，工具包中含有非常多视频增强及修复功能，包括超高清标准化功能，视频内容分析，视频增强及修复功能，客户可以根据需求手动或者自动选择几个参数，帝视科技转码服务器自动配置转码任务，并进行视频转码。

我们的产品是主要通过两种方式面向客户：

第一种是视频增强转码服务器的形式，给客户提供标清转高清、高清转4K的服务，视频增强转码服务器中就有 AI4K工具。

另外一种是公有云的形式，通过视频云转码平台进行视频转码。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47259

浏览量
238418

原文标题：齐鲁论道 | 帝视李根：人工智能在视频增强领域中的应用与挑战

文章出处：【微信号：iptvott，微信公众号：流媒体网】欢迎添加关注！文章转载请注明出处。

嵌入式和人工智能究竟是什么关系?

、连接主义和深度学习等不同的阶段。目前，人工智能已经广泛应用于各种领域，如自然语言处理、计算机视觉、智能推荐等。嵌入式系统和人工智能在许多方面都存在密切的关联性。首先，嵌入式系统可

发表于 11-14 16:39

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

驱动科学创新》的第6章为我提供了宝贵的知识和见解，让我对人工智能在能源科学中的应用有了更深入的认识。通过阅读这一章，我更加坚信人工智能在未来能源科学领域中的重要地位和作用。同时，我也意识到在推动

发表于 10-14 09:27

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

很幸运社区给我一个阅读此书的机会，感谢平台。《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们揭示了人工智能技术在生命科学领域中的广泛应用和深远影响。在

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

，无疑为读者铺设了一条探索人工智能（AI）如何深刻影响并推动科学创新的道路。在阅读这一章后，我深刻感受到了人工智能技术在科学领域的广泛应用潜力以及其带来的革命性变化，以下是我个人的学习心得： 1.

发表于 10-14 09:12

risc-v在人工智能图像处理应用前景分析

RISC-V在人工智能图像处理领域的应用前景十分广阔，这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析：一、RISC-V的基本特点 RISC-V

发表于 09-28 11:00

生成式人工智能在教育中的应用

生成式人工智能在教育中的应用日益广泛，为教育领域带来了诸多变革和创新。以下是对生成式人工智能在教育中的几个主要应用方面的详细阐述：

发表于 09-16 16:07 •1046次阅读

人工智能ai4s试读申请

目前人工智能在绘画对话等大模型领域应用广阔，ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题，本书对ai4s基本原理和原则，方法进行描诉，有利于总结经验，拟按照要求准备相关体会材料。看能否有助于入门和提高ss

发表于 09-09 15:36

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

活的世界？编辑推荐《AI for Science：人工智能驱动科学创新》聚焦于人工智能与材料科学、生命科学、电子科学、能源科学、环境科学五大领域的交叉融合，通过深入浅出的语言和诸多实际应用案例，介绍了

发表于 09-09 13:54

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

8月28日至30日，2024深圳（国际）通用人工智能大会暨深圳（国际）通用人工智能产业博览会将在深圳国际会展中心（宝安）举办。大会以“魅力AI·无限未来”为主题，致力于打造全球通用人工智能领域

发表于 08-22 15:00

FPGA在人工智能中的应用有哪些？

FPGA（现场可编程门阵列）在人工智能领域的应用非常广泛，主要体现在以下几个方面：一、深度学习加速训练和推理过程加速：FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性

发表于 07-29 17:05

AI人工智能在新能源领域的创新应用

AI人工智能在新能源领域的应用不仅推动了技术的创新和发展，还促进了整个汽车产业的绿色转型和可持续发展。未来，随着技术的不断进步和应用的深化，AI将在新能源领域发挥更加重要的作用，为人类社会创造更加美好的明天。

发表于 07-21 09:50 •840次阅读

人工智能在军事方面的应用

智慧华盛恒辉人工智能在军事方面的应用广泛且深入，主要包括以下几个方面：智慧华盛恒辉一、作战效能提升自动目标识别与跟踪： 人工智能系统能够在复杂环境中准确识别和跟踪目标，提高作战效率。利用图像识别

发表于 07-16 09:52 •586次阅读

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

课程类别课程名称视频课程时长视频课程链接课件链接 人工智能 参赛基础知识指引 14分50秒 https://t.elecfans.com/v/25508.html *附件：参赛基础知识指引

发表于 04-01 10:40

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在嵌入式人工智能领域

发表于 02-26 10:17

OpenAI发布人工智能文生视频大模型Sora

近日，人工智能领域的领军企业OpenAI宣布推出其最新的人工智能文生视频大模型——Sora。这款模型在继承DALL-E 3卓越画质和遵循指令能力的基础上，实现了对真实物理世界的深度模拟

发表于 02-20 13:54 •864次阅读

搜索历史

人工智能在视频增强领域中的应用与挑战

评论

嵌入式和人工智能究竟是什么关系?

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

risc-v在人工智能图像处理应用前景分析

生成式人工智能在教育中的应用

人工智能ai4s试读申请

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

FPGA在人工智能中的应用有哪些？

AI人工智能在新能源领域的创新应用

人工智能在军事方面的应用

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

嵌入式人工智能的就业方向有哪些?

OpenAI发布人工智能文生视频大模型Sora