从神话到落地——AI工程化浅谈-电子发烧友网

神话的诞生

记得几年前流行一本书，《人类简史》。此书风行之后还有一些类似的《智能简史》之类。在AlphaGo出现之前，《人类简史》的作者尤瓦尔·赫拉利对人工智能的态度还是比较客观和保守的，对奇点的探讨也不是很绝对。但在李世石惨败后，作者的观点则出现了较大的转变。《人类简史》的末尾，在人类社会的发展进程中，从最开始的动物到神的出现，最后催生出有关神话的想象和信仰，而这个神话的中心点就是AI。李世石和DeepMind研发的AlphaGo进行的人机大战，每一盘直播我都几乎是屏住呼吸在看。围棋上手的每一步，都会给对手带来巨大的心理压力，而AlphaGo的棋一直让人喘不过气来。直到第四盘李世石的78神之一手——看到这步棋之后，我几乎哽咽，两眼从湿润到流泪。

李世石VSAlphaGo第四盘白78手

DeepMind创始人握着李世石的手说，AlphaGo的胜利是人类自身的进步，而不是机器对人类的胜利。在当时的爱好者群里，我提出一个建议：马上更换25路棋盘再战。这个策略是出于对AI仍旧是一种统计程序的考虑，我估计它还不能从19x19中发现通用规律并移植到更大的盘面上去。

李世石对战AlphaGo 也有人认为盘面越大人类越不行。但在LeelaZero出现后，我曾跟Leela多次对弈，结果是19路完败，25路完胜。在更大盘上面，AI完全没有基本的围棋常识，这一定出乎很多人的意料。虽然口头上还在探讨围棋AI的弱点，但作为一个从90年代就开始编程的程序员，在那一刻，我真实感受到的是时代的巨变。我觉得自己必须马上行动，马上跟上时代的脚步，才能避免被无形的巨轮碾压在尘埃中。在此之前，我一直在做编码解码器优化、内容分享这一类工作。看完这几盘棋后，我暂停了所有的手头开发方向，安装了Python，下载了DeepMind论文的相关开源代码，开始学习AI。后来又选择了超分辨率这个方向来作为突破口，到今天纵向发展到推理引擎深度优化，横向关联到NPU加速的编码解码器等等。尤瓦尔·赫拉利有一个很有名的观点，那就是神话在人类社会发展过程中起到的最重要作用。在有语言通信工具的情况下，十几个人的小团队能够运作得很好，智人和尼安德特人的团队合作都达到了这个程度。但是当智人和尼安德特人在欧亚大陆相遇的时候，智人还有更强的工具，那就是gossip，我们理解为八卦，意思是通过篝火和睡眠前的八卦，智人的沟通更有效率，能够保证比较稳定的更大规模上的团队合作。因此智人最终取代了尼安德特人。

《人类简史》作者尤瓦尔·赫拉利后来人类团体变得更大了，达到了几百数千人，这个时候八卦也出现了问题，因为更大的团队也更容易产生分裂。于是，神话就适时地出现了。神话也就是宗教，氏族首领代表神来进行治理。国家形态出现了，而且这种统治形态可以长时间保持。人类的科学技术、文化文明等等，都得益于超大规模的团队合作，也就是国家和政治。神话并不属于科学技术，而是一种社会意识形态，但是神话对于人类社会的发展、科学技术的飞跃都是不可或缺的。超级AI，奇点理论，其实就是一种神话。无论是DeepMind的哈撒斯比，还是BAT的普通程序员，都知道自己正在开发的AI，和超级AI扯不上一点关系。奇点究竟是怎么回事，在OKR的压力下也没有几个人去关心。但是开发AI的人，总是有一种使命感，总觉得自己不仅仅是写一些模块算法或者拿一点工资，自己每天在干的事情属于一个无比宏伟的蓝图的一部分，自己和成千上万的开发者一同在书写一部史诗。这就是我们心中的神话。在神话的鼓舞下，我这样的老程序员，每天都在学习新的算法新的技能，不断转换赛道开疆拓土。更有无数的年轻程序员，抱着一种创造神话的激情和理念，突破了一个又一个的技术难点，把AI算法推向千千万万的用户。我们看到了新的亿级别VV应用的快速崛起，也见证了一批不思进取老牌APP的迅速消失。

为什么说我们现在的AI不是超级AI

从事AI开发的人都知道，现在的AI还没有自主学习的能力。算法都是工程师设定好的，AI只是在执行一种程序。与其说是AI在学习，不如说是算法工程师在学习更合适。和基本的傅里叶变换、拉普拉斯草帽算子、线性方程组一样，现在的深度学习也只是一种统计算法，是一种从数据中寻找规律的计算机程序。那么将来是不是有这种可能：AI会发展到自主学习、自行修改算法、自行进化的程度？这是对未来的一种预测。因为是预测，所以很难是准确的。对过去历史上发生过的事件进行总结，总有人可以做的很到位。但是有没有人能够预测新冠肺炎的爆发？有没有人能预测到双色球开奖号码？有些理论说世界本质上是模拟和随机的，没有能够长期成立的预测。首先，AI的发展是不是可以按照指数形式无限制暴涨？要知道，硅芯片从20年前到达4G主频之后，CPU的计算能力增长开始减缓，改进形式变成了多核心，GPGPU，NPU，FPGA，这是因为物理规律的限制。爱因斯坦的广义相对论已有百年历史，至今再无突破性的理论出现，科学家们还在茫茫宇宙中寻找相对论的一些证据，这是人类智能的限制。人们都说外星文明几乎是必然的，但是人类如何走出太阳系都是一个问题，这是空间和时间的限制。其次，从目前的状态来说，超级AI还很远。超级AI的神话总是和永生，和人造生命一同绑定。某种意义上来说这是同一个问题。我们目前面临的冠状病毒、艾滋病、癌症、衰老，仍旧是没有解决的问题，长生不老还只是一个神话。无论你多么成功，或者富可敌国，该死还得死。更别提还有全球性变暖、生态灾难、小行星撞击等种种不可预测的事件。第三，对AI未来的预测，实际上是对人类自身甚至地球共同体未来命运的预测。每个人，每个生命都参与其中。那么这个事件的发展就不是一个可以被独立观察的孤立系统。由于每个人都可能有意无意地影响事件的走向，那么这个系统的演化很大程度上就带有主观色彩，至少不是完全客观的。两种极端情况：第一种，我手中握着一只小强，让你来预测生死。你说“活”，我捏死它，你说“死”，我放开它；第二种，我预测自己明天早上吃个汉堡。那我完全可以强行让这个预测成立。实际上在具体项目开发中，往往存在这种情况，决定工程最终走向的，往往是最有实力的程序员，而这个走向跟大家最初的判断往往差别很大。并不是说这个“最强程序员”的走向一定是最合理的，而是因为只有他能填平大坑让算法走向实用。大家预测AI的未来和规律也是类似的，这种预测往往会改变被预测过程的走向。如果人类意识到不加限制的超级AI会带来威胁，那么超级AI从开发到使用就必然受到一系列限制，超级AI仍旧只会是一种工具，不会发展出无限智力。因此，实际上目前的AI并不是影视文学作品中的那种超级AI，也不是很多人心中神话了的AI。目前不是，甚至20年、30年之后也差得很远。

那么目前的AI究竟是个什么状态，短期的发展会如何?

AI落地三要素：算法、芯片、工程

算法层面上，主要是要证明该算法的有效性。在算力能够保证的前提下，深度算法一般能提供传统算法不具备的一些特征。但这并不是说你只要说明自己是深度算法，市场和客户就会买账。比如用户往往希望超分辨率、HDR、降噪等技术，能够把一些质量较差的视频做出很明显的改善。但算法并不是仙丹妙药，只能在满足工作区间的条件下，起一部分作用。所以我们要有比较清醒的认识，主观意愿和客观算法能力上肯定是不匹配的。在芯片层面，主要是因为深度学习需要很大的计算能力，这个能力是传统CPU不具备的。通用计算的GPU在模型训练上是比较有优势的，但和专有的加速芯片（TPU,NPU）比起来，单位芯片面积算力产出和功耗上，效率是比较低的。如果前两个问题解决的话，算法最终落地到APP用户层面，是依靠工程开发来实现的。并不是说算法的算力需求和芯片的理论能力能够匹配了，实际运行效果就一定满意。这个问题在移动平台上非常突出。手机是依靠电池供电的，电力非常有限，同时散热空间也很小。这两个特点使得在手机上应用深度算法难度陡然加大。比较大的网络即使在NPU上运行也是很慢的，常规的暴力裁剪缩小网络，往往使得算法失效，或者出现大量badcase.

AI 能落地的几个条件：

1）工作区间内没有明显的badcase。这个原因显而易见，自然界生物里面，老弱病残是第一个被淘汰的。先天残疾的幼儿很难存活，产生癌症的变异不能通过自然选择。一个算法有badcase的话，就得有很多弥补措施，这些措施的代价可能超过了算法本身的收益。这就如同用钱买了房子，坐等房子升值就可以发财，至少是不亏；而如果投资做买卖的话，费了很大力气折腾半天反而赔了。 2）相对于其他算法选择，要有明显的收益。如果相对于别的算法，投入过大而收益更小，那么很明显的应该放弃当前的思路。3）对于现阶段的硬件芯片和软件驱动来说，算法可以高效运行。比如一些深度算法，4k超分辨率叠加HDR、超帧率等，在服务器硬件加速下，性能满足需要。即使不能实时运行，也不至于等待太长时间，这是可行的。但是这样的算法放到移动平台上，有耗电限制，芯片都是低功耗低性能类型，显然落地的困难就非常大。

目前比较成功的落地算法

我们所了解的深度算法发展里程中，有两个影响比较大的事件。第一个是人像识别，深度算法超越了传统的统计特征分析。第二个就是本文提及的围棋AI程序AlphaGo, 后续当然还有Master、zero等等。另外，在语音识别上也是类似。接近十年的时间过去了，目前图像识别和语音识别还是最成熟的应用。从识别到内容生成，这一步还在继续进化之中。视频画质类算法，典型的包括HDR、超分辨率和超帧率。这类算法在非实时性约束的场景下已经有很多应用例子。其中一个难题是，非实时约束就必须使用视频编码器，编码后的视频质量损失是比较大的。极端的例子是，一个720P的视频，如果先解码为单帧图像序列，然后做超分辨率到4k，然后再编码为4k高清视频来播放。这时候我们会发现，虽然超分辨率带来了一定的画质改善，但是编码过程带来的画质损失更大。结果是，直接播放720P视频反而比播放超分4k编码的视频效果更好。超分等算法放到端上实时运行，能避免这个问题，还能节省传输码率。但是对于算法的实时性要求，使得芯片的计算压力和算法工程的优化压力，又变得极大。

我们看到短时间内会解决的应用：

在4k分辨率下，几个典型视频画质类算法目前三元素的状态：

我们看到，芯片的计算能力实际上是达到了。考虑到功耗的因素，算法和工程的优化还需要做一个2-3倍的改善。但实际上无论从算法上还是工程实现上，优化的空间还是非常巨大的。我相信再过一段时间，出现20-30倍的效率提升是很正常的事情。以AI辅助编码为例，有人做过一个试验，用AVX512指令集，用下山法暴力计算，实现了视频编码的运动估计模块。在小运动向量场景下，1080分辨率的运动搜索，每个像素代价大概是2个指令周期。这意味着3G主频的CPU，单线程ME性能达到了1000FPS左右。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31155

浏览量
269500
程序员

程序员

+关注

关注
4

文章
953

浏览量
29822

原文标题：从神话到落地——AI工程化浅谈

文章出处：【微信号：livevideostack，微信公众号：LiveVideoStack】欢迎添加关注！文章转载请注明出处。

科技云报到：从大模型到云端，“AI+云计算”还能讲出什么新故事

发表于 01-07 13:27 •85次阅读

从最新款AI PC到高性能服务器，联想企业购一站式满足企业智能化升级需求

随着AI技术的迅猛发展与快速落地，智能化转型已成为各行业不可忽视的趋势。AI正在重塑从制造业到金

发表于 12-30 16:37 •168次阅读

<b class='flag-5'>从</b>最新款<b class='flag-5'>AI</b> PC<b class='flag-5'>到</b>高性能服务器，联想企业购一站式满足企业智能<b class='flag-5'>化</b>升级需求

落地香港，威盛AI助力工程机械安全升级！

Mobile360AI工程机械解决方案受邀参加由德利机械有限公司及德利机械控股有限公司（德利机械）举办的“新型智能机械安全简介会”，会场演示多元化的安全智慧工地系统（4S）产品

发表于 12-12 15:11 •168次阅读

<b class='flag-5'>落地</b>香港，威盛<b class='flag-5'>AI</b>助力<b class='flag-5'>工程</b>机械安全升级！

优刻得获评信通院“AI云典型案例”,助力大模型场景化和工程化落地

2024年12月3日，由全球数字经济大会组委会主办、中国信通院、中国通信企业协会承办的2024全球数字经济大会云·AI·计算创新发展大会在京召开。会上，重磅发布了人工智能典型案例及AICloud系列

发表于 12-04 14:50 •360次阅读

优刻得获评信通院“<b class='flag-5'>AI</b>云典型案例”,助力大模型场景<b class='flag-5'>化</b>和<b class='flag-5'>工程化</b><b class='flag-5'>落地</b>

直播报名丨第4讲：AI检测系统落地工具详解

阿丘工业AI学堂上线“AI检测系统开发实战”系列课程，全面涵盖AI检测系统开发从理论到实践、从算法选择到

发表于 11-23 01:05 •147次阅读

从工业机器视觉到协作机器人，瑞萨电子有哪些AI芯片的布局？

的应用落地。传统的人工智能依靠云端，数据分析和决策都在云端，终端重在执行。而人工智能要广泛的落地，就必须去中心化，将很多的决策放到边缘侧，通过边缘设备实现。边缘智能市场爆发，五大特性加速AIoT终端

发表于 11-14 00:14 •3086次阅读

中科慧眼再获新能源头部车企平台化项目定点

近日，中科慧眼再获国内某新能源头部车企平台化项目定点。本次定点规模达到立体视觉路线在汽车产业内的历史新高，不仅从市场规模的角度验证了该路线具备更广阔的发展潜力，更从核心算法研发、产品工程化落地

发表于 11-12 15:49 •343次阅读

名单公布！【书籍评测活动NO.49】大模型启示录：一本AI应用百科全书

一次大模型变革中，完全不缺态度，只缺认知与落地的经验。在过去的两年中，我们看到了全球太多的巨头和普通中小企业，进入All in AI的投资周期。有的已经开始落地到具体的生产流程，例如

发表于 10-28 15:34

研发都应该了解的如何在vite中接入现代化css工程化方案

好的css工程化方案可以增强我们项目的可维护性、提高样式的复用性、进行自动化处理等，在提高页面加载速度和性能的同时，我们可以有更多的精力进行js逻辑的处理。

发表于 10-25 17:25 •403次阅读

迅为RK3588开发板！黑神话悟空，启动？

和讨论，提高会议效率。（3）教育培训：教师可以使用投屏将教学内容从平板或电脑传输到教室的电子白板或投影设备上，增强课堂互动性和教学效果，方便学生理解和参与。虽然视频中的《黑神话：悟空》是通过投屏技术在

发表于 09-23 10:48

云天励飞边缘AI推动大模型规模化应用落地

2024年毫无疑问是大模型应用落地元年，面对灵活多变的任务和复杂的场景环境，用边缘AI打造低成本、高效能、强落地的大模型应用是关键。

发表于 09-18 14:59 •434次阅读

踏平坎坷成大道：从《黑神话：悟空》说起，看国产科技如何“直面天命”

击碎“中国做不出3A游戏”的质疑。《黑神话：悟空》爆火的背后，是“国产3A游戏”长达三十余年的缺位。三十余年来，游戏产业的起步晚、工业化程度薄弱、关键人才稀缺...

发表于 08-30 12:26 •339次阅读

联想拯救者携手《黑神话：悟空》玩转东方神话世界

体验，为全球玩家打造一场富有神秘东方色彩的3A游戏盛宴，助力国产3A从0到1的突破，推动产业的蓬勃发展。和《黑神话：悟空》一起探索神秘东方世界作为当前最受关注的国产3A游戏，《黑神话

发表于 08-20 09:14 •504次阅读

AI时代创新潮涌，从探路到引路，萤石云引领千行百业创新

产业化、产业数字化，促进数字技术和实体经济深度融合。数字经济已然成为最具确定性的未来趋势之一。在AI数智化的强风吹拂下，大模型应用场景落地，

发表于 07-01 15:17 •438次阅读

实测NPU“空转”，AI PC首个落地应用只调用GPU？

电子发烧友网报道（文/梁浩斌）去年开始，整个PC产业链，自上而下地都在为AI PC造势。从处理器端的英特尔、AMD、高通等开始，到下游终端厂商，宣传上清一色的AI PC概念。

发表于 05-22 00:16 •3211次阅读