0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI助力,老片修复一直在路上

KSiH_idg_capita 来源:大数据文摘 2020-06-03 10:53 次阅读

这个视频来自一位名叫“大谷Spitzer”的博主,据他所说,接触老片修复是一个偶然,整个项目也只花了7天时间就顺利完成了。

先来一起看看这惊人的修复效果。

老视频

修复后效果

这样的画面大大地满足了网友们的好奇心。视频一经发布,在24小时内就有了将近50万的点赞量,10万+次的转发和接近3万的留言。修复后的视频把当时的北京城演绎得活灵活现,下边的片段中,左下角小哥呆呆地看着镜头,连细微的表情都清晰可见,青涩中带有一点可爱。想象一下这位表情憨厚的小哥来自一百年前,不禁让人感慨万千。

怪不得网友们纷纷赞叹。有网友表示,不仅整体氛围没话说,连细节部分也分毫毕显,“每个人脸上都是新奇又不敢接近的表情”。

甚至有网友留言表示,“博物馆应该收藏你的作品”!

博主在视频最开始就说道,想用技术为社会做一些有意义的事情,怀着仰慕的心情,笔者联系到了这位“大谷Spizer”,来看看他是怎么说的吧~

7天完工,难在显卡

整体满意,颜色上还有不足

自称将AI视为业余爱好的大谷如今身在纽约,他透露说,其实这次接触老片修复纯属偶然,在搜索其他资料时候,偶然间在YouTube看到了人民日报上传的一段老北京视频,在视频里,100年前的人们恰好也在看镜头、和看视频的人形成了“对视”时,大谷十分有感触:“有一种穿越时空的感觉”。在这基础上,他自己又恰好了解相关技术,为何不将老片上色补帧,做成活灵活现的60帧,和大家分享呢?

100年前熟人见面打招呼的方式

具体到操作上,根据大谷介绍,可以大致分为补帧、扩分辨率、上色三个环节,每个环节也都用了不同的工具,整体框架的流程则主要参考了Denis Shiryaev在社交媒体上分享的经验贴。

大谷说道,整个项目只用了7天时间,大部分都是硬性的时间消耗,比如补帧需要一到两天,扩分辨率至少一天,上色也需要花费一天时间,再加上要做到4K60fps,渲染速度很慢。多方考量之下,他把人民日报14分钟的原片剪到了10分钟。

相比而言,去年国庆164分钟修复版《开国大典》为人们还原了三次战役胜利到开国大典的历史过程。除了借助AI,胶片的撕裂、划痕等都是专业的修复师一帧一帧地修补。“修复过程中,我们70%的时间都在完成资料片镜头的修复工作,”负责该片修复工作的三维六度公司的首席技术官周苏岳曾说道。虽然修复时间只用了40天,但这却是600人每天工作20小时的奋战结果!

除了硬性的时间消耗,大谷还笑称,最大的问题就是自己笔记本电脑的显卡不够好,“要1070的显卡才带得动,否则会out of memory”,迫不得已之下向女朋友求了助。

对于最后的结果,大谷表示:“还是比较满意的”,不过在颜色上还存在可以改进的地方。

在视频中,相信大家也会看到时不时会出现颜色跳来跳去的情况,大谷表示,在补帧之前用工具把老电影中经常出现的画面闪烁去掉了,否则会更严重,整体的色彩上,AI的渲染效果也明显偏淡。

除此之外,大谷这次利用的是国外的一套模型,显然无法直接将其套用到100年前的中国影片修复上,在颜色上就无法做到历史性的准确,视频中的上色都是AI学习的成果,虽然肤色大致还原了,但是在红绿服装等方面的真实性还有待商榷。

也正是考虑到这些不足,大谷对去年参与《开国大典》修复的工作人员表达了敬意,“AI没办法做到艺术家那么准确,尤其是在历史方面,而《开国大典》对历史准确性的要求更高”,随后他也打趣地说道,或许可以“让AI看看清宫剧,提升一下准确率”。

就像大谷在视频开头所说,他想用技术做一些对社会有意义的事,在这次视频爆红之后,他表现得相当豁达,“太深刻的大意义倒也说不上,主要是想借此让人们对历史有所反思。”不少网友指出,视频中几乎看不到女性,这正是历史生动性的体现,既有光鲜也有不足,让大家意识到现在的生活是多么来之不易。

同时,作为老北京人,大谷也想通过视频分享他的切身感受,让更多人看到一百年前的民俗,“尤其是上了色帧数提高之后,感觉确实不一样,也感慨这一百年的变化”。

对于目前收到得反馈,大谷表示“完全没想到”,他看了很多评论,也受感触于一些留言,还有人私信向他表示,给太姥姥看后,也很怀念那个年代。

大谷透露道,这其实是他第一次尝试做视频修复,后续或许会出一期视频介绍一下具体的操作。对于后续的视频更新计划,他想要介绍一下国内已经成熟的语音修复技术。

AI助力,老片修复一直在路上

对于这次用到的技术,大谷表示,上色主要还是应用在黑白照片和电影上,补帧技术就可以遍地开花了,比如修复像素动画的跳帧问题,或者在动画领域加以应用,因为动画很多是12帧/秒,甚至6帧/秒,补帧之后效果很好,也终于可以看更流畅的EVA了。

作为一名独立游戏开发者,大谷透露他因为做游戏开发接触到AI,起初想要了解AI能否为他节省时间,后来发现AI能做的不止这些,在社会公益上也有不少应用,比如这次的老片修复。

正如大谷所说,这次的视频修复技术管线参考自Denis Shiryae的影像修复教程,针对Denis的欧美老片修复,大谷也做过汉化视频进行了专门的介绍。

【AI高清修复】1906大地震前的旧金山

视频链接:

https://www.bilibili.com/video/BV1Uf4y1m72n

Denis Shiryaev通过神经网络修复老视频的内容今年在油管爆红了一阵子,他使用Topaz Labs的Gigapixel AI和DAIN图像编辑应用程序将19世纪的胶片缩放到4K分辨率,不仅将素材增加到4K,还将帧率提高到每秒60帧。

Shiryaev最火的作品是用Gigapixel AI将1896年拍摄的50秒无声短片《火车进站》(the Arrival of a Train at La Ciotat Station)做成了4K格式,把模糊的原片做成了高清画质,完全符合当下的高清视频标准。

尽管存在一些缺陷,如图像会出现跳跃或某些细节依旧模糊,但已经很棒了!

Gigapixel AI软件使用一种专有的插值算法来分析图像,它可以使图像更清晰——甚至在放大了600%之后。

再来说说DAIN(深度感知视频帧插值),它可以将帧想象并插入现有视频剪辑的关键帧之间。换句话说,DAIN首先分析并映射视频片段,然后插入在现有图像之间生成填充图像。

为了在这段1896年的视频中达到同样的效果,Shiryaev添加了足够多的图像来将速度提高到60帧每秒。因此,DAIN自动生成,然后在最初记录的24张图像之外,每秒添加36张额外的图像。

Shiryaev的“火车”的视频修复版本看起来像是一部使用智能手机或GoPro拍摄的最新电影。与原始视频相比,效果非常惊人,尤其是在新版本中获得了流畅性。列车上的阳光反射和月台上的女士珠宝都被记录的很完整,也许是最显着的改进之一。

Shiryaev也用神经网络对这一修复视频进行了着色:从一堆彩色照片开始,将它们转换为黑白,然后训练神经网络以重建彩色原稿。

修复后的视频传送门:

https://youtu.be/EqbOhqXHL7E

Shiryaev的新技术随之在技术圈火了起来,激发了包括大谷在内的更多技术人,修复珍贵的影像文献。

除了上文提到的《开国大典》,在老片修复上,AI应用于影视制作的新技术——“中影·神思”系统的开发,能缩短修复电影所需时间的四分之三,成本可以减少一半,目前已成功应用于《厉害了,我的国》《血色浪漫》《亮剑》等多部影视剧的图像修复与增强当中。

IDG资本被投企业爱奇艺也推出了其自主研发的视频增强技术Zoom AI,来为电影修复提出解决方案。这是业内第一个利用较低成本、将深度学习技术应用在视频画质增强场景中的方案。

但不可否认的是,这种技术如果被有恶意的人使用,例如,可以用于制作“伪造品”并允许视频中的身份盗用,也会导致巨大的社会问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 视频
    +关注

    关注

    6

    文章

    1942

    浏览量

    72879
  • AI
    AI
    +关注

    关注

    87

    文章

    30643

    浏览量

    268822

原文标题:AI修复的真实影像,带你瞬间穿越回100年前

文章出处:【微信号:idg_capital,微信公众号:IDG资本】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ADS8331 spi2.125Mhz通信速率下,第次读取的数据一直在32865附近上下,为什么?

    1、就是spi2.125Mhz通信速率下,第次读取的数据一直在32865附近上下,需要访问同个通道两次,第二次才获得正确数值,这是为什么?发送给芯片的工作模式为E7FD,与ST
    发表于 11-13 06:07

    LMX2594锯齿扫频8-12G,频谱仪却一直在7.3-8G之间也有信号,为什么?

    LMX2594: 锯齿扫频8-12G,频谱仪却一直在7.3-8G之间也有信号,这是为什么,怎么解决?
    发表于 11-08 08:22

    mic口不接任何麦克风,但是aic23data的值一直在改变,请问是为什么?

    =aic23data; 以上程序调试的时候,mic口不接任何麦克风,但是aic23data的值一直在改变,请问是为什么?理论上来说是不变的。
    发表于 10-14 06:16

    照TPA3112D1的datasheet的典型应用电路焊接了个音频功放,出来的波形一直在失真或出不来,为什么?

    我照TPA3112D1的datasheet的典型应用电路焊接了个音频功放,但出来的波形一直在失真或出不来,这是什么原因?输入和输出及电源的这些GND都可以接在起吗?
    发表于 09-09 07:25

    单片机烧录程序时为什么一直在检测

    单片机烧录程序时,如果软件一直在显示“正在检测单片机”,可能是由多种原因导致的。以下是些常见的原因及其解决方法: 1. 连接问题 USB转串口接触不良 :检查单片机与电脑的连接是否稳定,可以尝试
    的头像 发表于 09-02 09:57 4398次阅读

    用OPA695做了10倍放大,从1Mhz到100Mhz放大倍数一直在缩小,还失真,为什么?

    我用OPA695做了10倍放大 但是从1Mhz到100Mhz放大倍数一直在缩小,而且还失真,OPA694压摆率4500应该不会失真啊!PCB和原理图附件里Rf/Rg是750欧和39欧。
    发表于 08-27 06:31

    AI 更迅捷,TE LGA4710 处理器插槽来助力

    AI 赛道的极速狂飙来自强大算力的支持,在这背后的基础设施是个庞大的高速链路网络,并且不断规模、效率、连接性能等方面迭代升级,TE Connectivity(以下简称“TE”)也一直
    的头像 发表于 08-25 23:30 231次阅读

    STM32F105RC USB配置成Mass Storage Class,插上U盘,一直在SOF这里中断,是什么原因?

    STM32F105RC USB配置成Mass Storage Class,插上U盘,一直在SOF这里中断,请问是什么原因,谢谢!
    发表于 07-26 06:40

    编译ESP8266_RTOS_SDK-master中的project_template项目后,串口打印看一直在boot中循环,为什么?

    编译ESP8266_RTOS_SDK-master中的project_template项目后,把文件烧到板子中,串口打印看一直在boot中循环
    发表于 07-12 07:46

    modustoolbox3.0打开不了设备配置器 ,一直在转圈圈怎么解决?

    我的modustoolbox 打开不了设备配置器 ,一直在转圈圈。我尝试卸载重装,但是并不能解决我的问题
    发表于 07-04 06:46

    XC2365应用区跳转启动区程序中的特定地址一直在循环,为什么?

    你好,我需要你的帮助。 非常感谢 程序从启动区跳转到应用程序区是正常的,但从应用程序区跳转到启动区后,应用程序区的程序不能正常运行,而是个地方循环。 程序一直在 0x00C00090 处循环
    发表于 05-22 06:18

    英伟达为什么越涨越便宜?英伟达的市盈率一直在下降?

    英伟达为什么越涨越便宜?英伟达的市盈率一直在下降? 2023年英伟达的股价涨了两倍多;龙年开年之后,英伟达股票继续猛涨,2024年以来英伟达的股价上涨超过87%。 但是为什么分析师说英伟达越涨越
    的头像 发表于 03-12 18:02 1768次阅读

    一直在调pmsm无速度的仿真,但是波形总是不对是为什么?

    一直在调pmsm无速度的仿真,但是波形总是不对,转速甚至是负的。。。用的反电势积分法。就是目前能正转了。但是仅限于空载情况下某个特性参数下才会出现正转,速度一直是且封顶900(可能是电机参数关系
    发表于 02-06 06:49

    LTC3265正输出端只有10V,负输出端一直在跳变是为什么?

    按照这个原理图搭建的电路,正输出端只有10V,负输出端一直在跳变
    发表于 01-08 07:55

    AD7745使用single-ended从capacitive data register里面读取的数据中发现,其值后16位一直在变化是为什么?

    AD7745使用single-ended方式,从capacitive data register里面读取的数据中发现,其值后16位一直在变化。似乎是精确度出现了问题?如何配置寄存器使状态性能达到最佳?
    发表于 12-20 08:23