大模型正在被加速，AI不是只有大模型

作者：金磊

什么样的技术能经历时间洗礼还历久弥新？

答案或许可以归总为一个“三部曲”般的规律——兴起、发展和大规模应用，外加这个过程再一次演进式的迭代。

以史为鉴，引领第一次工业革命的是蒸汽机，当它演进成为内燃机并开始普及时，第二次工业革命的颠覆者——电能本身以及与它相关的各种设备正处于初创期，而在电力设备走向微电子的迭代革新时，各种燃油引擎还在持续改良和普及中。

从这个规律来看，大语言模型（简称LLM）出现后虽然霸占了所有与AI相关的关键词，吸引了所有人的注意力，但这并不代表“LLM之前无AI”。

在大模型出尽风头的同时，此前以决策为特长的老一代机器学习应用，以及侧重感知能力的“传统”深度学习应用也没闲着，它们正走过喧嚣的青春期，步入稳扎稳打的实战阶段。

何以为证？

某芯片大厂就推出了一连串的AI实战手册，分别锁定制造与能源、医药、金融、交通与物流，以及教育行业的AI实践。

在今年更新的物流交通和医疗健康AI实战手册中，就记录了很多已经或正在落地的AI应用，及如何将它们顺利部署和充分释放其性能加速潜力，当然还有它们在一些耳熟能详的头部企业深入一线的应用实例。

所以，AI不是只有大模型。AI的大模型时代也 ≠ 只有大模型的AI时代。

成熟的AI，早就已经上岗了

或许你还不敢相信，现在哪怕小小的快递背后，都已经有AI技术在加持了。

没错，而且近乎涉足了物流全流程：下单、发货、分拣、转运、配送……AI现在统统都要“管一管”。

以经典的OCR（光学字符识别）技术为例，它在物流“技术界”的地位可谓是举足轻重，大幅提高了工作效率。

比如发货时的寄件人填报地址、身份信息，电商仓库核对出货的货品信息，都可以借助OCR，“啪地一下”，实现一键录入。

随着AI技术的愈发完善和应用的加深，这种速度做到了“没有最快只有更快”。

我们熟知的韵达快递就是如此，在三段码OCR识别过程中，它原本希望AI能将OCR识别的准确率达到95%。

结果现在的AI却给韵达“上了一课”，不仅准确率直接飙到接近98%，甚至时间也给“打了下去”：从130ms降至114ms。

性能测试结果基于韵达于2022年10月进行的测试

而且OCR识别还仅仅是AI涉足物流行业的小小一隅，一张图来看感受下它现在所起到的power：

嗯，AI如此all in，怪不得国内物流的速度都要起飞了呢。

不过朋友，这还仅仅是AI加速千行百业的一个案例，其实我们现在每天的出行，同样也是充斥着AI的“味道”。

例如AI视频分析技术，可以针对高速公路上的路况做到实时地分析。

不论是车流流量监控、车辆车牌识别，亦或是事故预警等等，AI可谓是将一切尽收眼底。

如此一来，便可以有效且精准地对路面状况做到把控。

再如机场，在AI技术加持下的摄像头，也可以细粒度识别航空器、车辆、人员，以及违边等情况，这样便对飞行区域的安全提供了一定的保障。

从以上几个小小用例中不难看出，“成熟”的AI，或者说几年前那些当红明星类的AI应用看似风光不在，但它们实则已深入到我们生活中的方方面面，并且主打的就是一个“节支增效”。

那么如此“节支增效”背后，到底是怎么做到的？

不卖关子，直接上答案——

提供帮助的正是英特尔的平台，特别是至强可扩展处理器。同样，我们前文所指的某芯片大厂也是英特尔，给出多个行业AI实战手册的还是它。

但解锁如此能力的，可不仅仅是一颗CPU这么简单，而是有英特尔软件层面上的优化加成；换言之，就是“软硬一体”后的结果。

简单归结：至强可扩展处理器及其内置的AI加速器，以及OpenVINO ，oneAPI等一系列AI框架和优化软件打辅助。

当前影响AI应用性能的要素无非两个：算力和数据访问速度。

目前最新的第四代至强可扩展处理器的单颗CPU核数已经增长到最高60核。而在数据访问速度上，各级缓存大小、内存通道数、内存访问速度等都有一定程度的优化，另外在CPU Max系列中还集成了HBM高带宽内存技术。

此外，在CPU指令集上也做了优化，内置了英特尔高级矩阵扩展（英特尔 AMX）等硬件加速器，负责矩阵计算，加速深度学习工作负载，堪称CPU加速AI应用的C位。

它有点类似于GPU里的张量核心（Tensor Core）。

AMX由两部分组成，一部分是1kb大小的2D寄存器文件，另一部分是TMUL模块，用来执行矩阵乘法指令。它可同时支持INT8和BF16数据类型，且BF16相较于FP32计算性能更优。

有了AMX指令集加持，性能比前一代至强可扩展处理器内置的矢量神经网络指令集VNNI提升达8倍，甚至更高。

除了核心硬件平台外，实际情况中帮助这些行业实战AI应用落地的，还有一系列英特尔“亲生”但不“私享”的AI软件工具。

例如前面提到的OCR加速就离不开OpenVINO 的优化，它删减了很多训练部分所需的冗余计算，主要支持推理部分。

而且也是专门针对英特尔硬件打造的优化框架，只需5行代码就可以完成原有框架的替换。

用户可以针对不同业务场景，来优化OpenVINO 运行参数。

这样一套软硬件组合拳打下来，英特尔不仅充分释放了CPU计算潜力，而且在实际的推理场景中也实现了近乎GPU的性能，同时还有成本低、门槛低、易上手等附加优势。

然而，这些仅仅是已经成熟上岗的AI技术在英特尔平台得到的优化，英特尔的能力还远不止如此。

这就要说回大模型了。

当红大模型，也在被加速

目前大语言模型正被全球各大科技公司竞相追逐，毕竟现在科技圈都将它视为未来发展的趋势所在。

虽然相比那些成熟的AI技术和应用，它距大规模落地还有段距离，但其技术领先性不容置疑，乃至“老一辈”的AI应用也有望在与它结合，或被它改造后重焕新生。

英特尔作为基础算力输出者和应用性能加速器，同样在这场你追我赶的竞技场中未雨绸缪，早有布局。

首先，大模型再先进，也需要有更多人用上它，才可充分变现其价值。要想“玩转”它，在其庞大的体量面前，成本便是一个老大难的问题。

因此，英特尔就祭出了一款增强型的“减（量）重（化）神（工）器（具）”，可以让一个十亿参数的大语言模型瘦身3/4，增强其准确性，还能有效地提升大模型在英特尔平台上的推理性能。

具体而言，所用到的是SmoothQuant技术，英特尔将其适配到自己的平台，并实现其增强。此方法已经整合至英特尔 Neural Compressor。这是一个包含量化、剪枝（稀疏性）、蒸馏（知识提炼）和神经架构搜索等多种常用模型压缩技术的开源Python库，它已经支持多款英特尔架构的硬件，并且已经兼容TensorFlow、PyTorch、ONNX Runtime 和MXNet等主流框架。

其次，在硬件层面上，英特尔也有所发力。

例如最近大火的ChatGLM-6B，其借助第四代至强可扩展处理器内置的英特尔 AMX，让模型微调计算速度得以大幅提升；利用至强 CPU Max系列处理器集成的HBM，满足大模型微调所需的大内存带宽。

英特尔 AMX 技术架构

除了CPU，英特尔还有专用的深度学习加速芯片Habana Gaudi2 ，其能在单个服务器内部署8张加速卡（称为Habana处理单元，即Habana Processing Unit，简称为HPU），每张卡内存高达96 GB，可提供足够的空间来容纳大模型。

因此即使是BLOOMZ这样拥有1760亿参数的千亿级大语言模型，经英特尔优化后也能将性能时延控制在3.7秒。对于参数量为70亿的较小模型BLOOMZ-7B，在Gaudi2的单设备时延约为第一代Gaudi 的37.21%；而当设备数量都增加为8后，这一百分比进一步下降至约24.33%。

BLOOMZ 在 Gaudi2 和第一代 Gaudi 上的推理时延测试结果

而后在软件层面上，针对像ChatGLM这样大受欢迎的大语言模型，英特尔还可以通过为其创建 OpenVINO stateful模型来实现优化：压缩权重以降低内存带宽使用率，提升推理速度。

这便是英特尔“软硬一体”打法在大模型应用上的直接体现了。而且硬件还不再仅限于CPU，更是有可在训练和推理性能上都可与GPU比肩，在性价比上馋哭大家的Gaudi 。

最后在安全方面，英特尔也是做到了“鱼与熊掌兼得”：基于英特尔 SGX/TDX的可信执行环境（TEE）可为大模型提供更安全的运行环境，还不需要拿性能做交换。

这便是英特尔在AI大模型时代中的“加速之道”了。

还会带来怎样的变革？

纵观AI技术的发展之路，不难发现英特尔在其中履行着一条非常清晰的准则——用起来才是硬道理。甚至只在数据中心和边缘中用都不够，最好每个人的每台电脑，每个信息终端设备都有独立加速AI应用的能力才能“芯”满意足。

因此英特尔已将创新使命调整为：在各种硬件产品中加入AI能力，并通过开放、多架构的软件解决方案，推动AI应用的普及，促进“芯经济”的崛起。

英特尔的“加速之道”不仅是让技术更快落地和普及，更是要以用促用，以用促新，以用促变，为下一世代的技术变革埋下伏笔。

那么英特尔这条路上是否有一个终极目标？

或许正如Intel Innovation 2023上不断重复和强调的：让AI无处不在(AI Everywhere)。

编辑：黄飞

阅读全文

处理器(221456) 处理器(221456)
英特尔(168289) 英特尔(168289)
AI(263628) AI(263628)
航空器(10047) 航空器(10047)
大模型(810) 大模型(810)

AI模型的演变与可解释性

人工智能正在改变几乎所有行业和应用领域的工程。随之而来的是对高 AI 模型准确性的需求。事实上，AI 模型在取代传统方法时往往更准确，但这有时也会付出代价：复杂的 AI 模型是如何做出决策的;作为工程师，我们如何验证结果是否如预期那样有效?

2022-09-01 13:06:05

1629

浅谈AI模型在漂移检测中的应用

人工智能应用的开发过程中，AI 模型的泛化能力是一个非常重要的考量因素，理想情况下，基于训练数据集优化得到的 AI 模型，不存在过拟合或欠拟合问题，可以直接迁移到新数据上用于推断。

2023-11-13 10:58:54

433

宇宙的尽头是带货，大模型首战在营销

不能带货的大模型不是好AI

2024-01-16 09:32:19

1660

模型压缩技术，加速AI大模型在终端侧的应用

，加速AI技术与智能终端的融合。为什么需要模型压缩技术模型压缩是一种缩小训练后的神经网络的技术，目的是保证模型预测效果的前提下，尽可能地降低模型的大小。模型压缩之后，所需要的计算资源变小，有利于在移动端部署。

2023-04-24 01:26:00

1943

AI大模型在医疗领域起飞

大模型，包括在医疗领域。众多企业宣布推出医疗大模型日前，京东发布了京东言犀大模型、言犀AI开发计算平台，同时基于京东言犀通用大模型，京东健康发布了“京医千询”医疗大模型，可快速完成在医疗健康领域各个场景的迁移和学

2023-07-25 00:12:00

1434

AI大模型在端侧加速落地已成必然趋势，芯片厂商提前布局！

普遍认为，2024年AI大模型在商业应用会有极大突破。 “AI大模型在端侧的加速落地已成必然趋势。”在星宸科技上周举办的2023开发者大会暨产品发布会上，该公司董事长&总经理林永育谈到。事实确实如此，AI大模型如果想要实现大规模落地应用，离不

2023-12-29 00:47:00

1321

AI为什么如此耗能？

1 个 AI 模型 = 5 辆汽车终身碳排量，AI 为何如此耗能？

2021-01-22 06:35:03

AI算法中比较常用的模型都有什么？

AI算法中比较常用的模型都有什么

2022-08-27 09:19:06

加速度计和陀螺仪的数学模型和基本算法是什么？如何进行融合？

2021-11-12 07:15:08

AD8310SPICE模型只有7个引脚

你好，ADI工程师，请教两个问题，第一：在ADI官网上下载了两种AD8310的Spice模型文件（.cir）；发现模型文件里面只有7个引脚，少了COM脚，这是怎么回事？模型文件如下：第二：AD8310能用放在传感器后面，放大50uV左右的信号吗？他噪声有多大？谢谢！

2018-12-19 14:05:42

HarmonyOS：使用MindSpore Lite引擎进行模型推理

场景介绍 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件设备 AI 模型推理的功能，目前已经在图像分类、目标识别、人脸识别、文字识别等应用中广泛使用。本文介绍

2023-12-14 11:41:13

IBIS 模型

-------------interconnect------------------Receiver注意IBIS 模型描述的是Driver/Receiver 的行为特性而并不是它们的电路特性，因而内部的一些逻辑延时是没有考虑的（在此你就该好好明白为啥要区分Tco的概念

2008-07-30 23:07:19

PSpice模型怎么转换为spice模型

2014-12-20 00:12:54

cubemx ai导入onnx模型后压缩失败了怎么解决？

cubemx ai导入onnx模型后压缩失败。请问我怎么解决

2024-03-19 07:58:47

labview建立veristand模型

，但是在子VI中只有输入和输出，并没与参数这一选项，请问谁知道该怎样设置才能让子VI的输入作为veristand模型的输入而不是参数

2018-07-14 11:02:26

【KV260视觉入门套件试用体验】Vitis AI 构建开发环境，并使用inspector检查模型

FFT运算（Vivado）四、硬件加速之—使用PL加速矩阵乘法运算（Vitis HLS）五、Vitis AI 构建开发环境，并使用inspector检查模型六、Vitis AI 进行模型校准和来

2023-10-14 15:34:26

【KV260视觉入门套件试用体验】Vitis AI 进行模型校准和来量化

FFT运算（Vivado）四、硬件加速之—使用PL加速矩阵乘法运算（Vitis HLS）五、Vitis AI 构建开发环境，并使用inspector检查模型六、Vitis AI 进行模型校准和来

2023-10-15 10:51:32

什么是模型呢？模型给我们带来了什么？

什么是模型呢？什么是关系？怎样确定一个模型？模型给我们带来了什么？

2021-07-02 07:13:30

介绍在STM32cubeIDE上部署AI模型的系列教程

介绍在STM32cubeIDE上部署AI模型的系列教程，开发板型号STM32H747I-disco，值得一看。MCUAI原文链接:【嵌入式AI开发】篇四|部署篇：STM32cubeIDE上部署神经网络之模型部署

2021-12-14 09:05:03

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

看到CUBE_AI已经支持到STM32F0系列芯片，就想拿来入门嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直无法创建成功。查阅CUBE AI文档说在调用create函数前，要启用

2024-03-15 08:10:25

使用cube-AI分析模型时报错的原因有哪些？

使用cube-AI分析模型时报错，该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.ai v8.0.0-19389) INTERNAL ERROR: list index out of range ```

2024-03-14 07:09:26

压缩模型会加速推理吗？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 将简单的 CNN 导入到 STM32L462RCT我发现压缩模型对推理时间没有影响。aiRun 程序在 8

2023-01-29 06:24:08

在X-CUBE-AI.7.1.0中导入由在线AI平台生成的.h5模型报错怎么解决？

你好，我试图在 X-CUBE-AI.7.1.0 中导入由在线 AI 平台生成的 .h5 模型，收到错误：E010(InvalidModelError): Model saved with Keras 2.7.0 but

2022-12-27 06:10:35

基于RKNN程序开发和模型转换的NPU简要说明

/16bit 运算，运算性能高达 3.0TOPS。相较于 GPU 作为 AI 运算单元的大型芯片方案，功耗不到 GPU 所需要的 1%。可直接加载 Caffe / Mxnet / TensorFlow 模型

2022-05-31 11:10:20

如何加速电信领域AI开发？

在即将开展的“中国移动全球合作伙伴大会”上，华为将发布一款面向运营商电信领域的一站式AI开发平台——SoftCOM AI平台，帮助电信领域开发者解决AI开发在数据准备、模型训练、模型发布以及部署验证

2021-02-25 06:53:41

如何通过cube-ai扩展将机器学习模型部署到STM32H743ZIT6？

我正在尝试通过 cube-ai 扩展将机器学习模型部署到 STM32H743ZIT6。该模型采用 .tflite 格式。当我尝试分析模型时，结果如下：该工具指出 MCU 总共有 512KB 可用，模型超过了它，但在数据表上我发现有 1024KB。什么原因？

2022-12-30 08:57:53

将Pytorch模型转换为DeepViewRT模型时出错怎么解决？

我正在寻求您的帮助以解决以下问题.. 我在 Windows 10 上安装了 eIQ Toolkit 1.7.3，我想将我的 Pytorch 模型转换为 DeepViewRT (.rtm) 模型，这样

2023-06-09 06:42:58

嵌入式边缘AI应用开发指南

保驾护航。下面让我们来了解如何不借助手动工具或手动编程来选择模型、随时随地训练模型并将其无缝部署到TI处理器上，从而实现硬件加速推理。图1：边缘AI应用的开发流程第1步：选择模型边缘AI系统开发

2022-11-03 06:53:28

怎样将matlab中的数学模型封装成物理电气模型

各位朋友，本人现在正在搭建双馈异步电机的内部模型，但是要和外部的电气模型连接起来，不知道怎样把数学模型封装成电气模型啊，在MATLAB中，有个三相异步电机的原始电气模型，打开里面的建模，是将数学模型封装成电气模型的，但是却看不到是如何封装的，希望各位多多帮忙啊，大家可以交流下！

2012-12-13 21:37:21

恩智浦最新的应用处理器 i.MX 95采用专有NPU IP进行片上AI加速

恩智浦最新的应用处理器 i.MX 95 使用恩智浦专有的 NPU IP 进行片上 AI 加速，这与之前使用第三方 IP 的 i.MX 系列产品有所不同。实际上，越来越多的嵌入式处理器公司正在使用自己

2023-02-16 11:20:03

深度学习模型是如何创建的？

具有深度学习模型的嵌入式系统应用程序带来了巨大的好处。深度学习嵌入式系统已经改变了各个行业的企业和组织。深度学习模型可以帮助实现工业流程自动化，进行实时分析以做出决策，甚至可以预测预警。这些AI

2021-10-27 06:34:15

训练好的ai模型导入cubemx不成功怎么解决？

训练好的ai模型导入cubemx不成功咋办，试了好几个模型压缩了也不行，ram占用过大，有无解决方案？

2023-08-04 09:16:28

请问是否可以使用x-cube ai将多个模型放入一个MCU中呢？

请问是否可以使用x-cube ai将多个模型放入一个MCU中。第一个模型将生成一个输出，该输出将成为另一个具有 13 个输入和 3 个输出的模型的输入之一。如果您可以提供有关如何实现此目标的步骤，那也会非常有帮助。

2023-01-05 06:33:23

请问有人知道IBIS模型怎么使用吗？

请问有人知道IBIS模型怎么使用吗？想用MULTISIM仿真AD7683,结果库里面没有，官网只有IBIS模型，但不知道怎么用。有人知道吗？

2017-02-13 22:15:17

轻松实现一键部署AI模型至RT-Thread系统

RT-AK 是 RT-Thread 团队为 RT-Thread 实时操作系统所开发的 AI 套件，能够一键将 AI 模型部署到 RT-Thread 项目中，让用户可以在统一的 API 之上

2022-09-02 15:06:14

防止AI大模型被黑客病毒入侵控制（原创）聆思大模型AI开发套件评测4

，应用场景和安全需求会有所不同。我会帮助客户构建安全的 AI 大模型。上面的只是一些基本的安全措施，在实际中我可以利用eFPGA芯片对上述的功能进行加速，下面我编写一个加速代码： // 这是一个用FPGA

2024-03-19 11:18:16

基于模型的动态测试工具TPT

基于模型的动态测试工具TPTTPT特性PikeTec公司是全球知名的基于模型的嵌入式系统测试工具TPT的软件供应商，总部位于德国柏林，其创始人均在戴姆勒公司拥有十多年的软件测试经验。TPT作为针对

2022-07-25 15:35:26

3D打印高性能材料模型树脂 RE 51 高耐磨高精度无气泡快速打印

3D打印高性能材料模型树脂 RE 51 RE 51 模型树脂RE 51是一款可快速打印的模型树脂材料，具有高精度的材料特性，可使打印模型具有光洁、精细的纹理表面

2023-02-15 14:50:30

AI大模型的存储焦虑，如何被曙光消除？

大模型

脑极体发布于 2023-07-21 22:37:10

能把百城主官聚在一起的，也只有AI大模型了，和华为云一起，探秘城市+AI的化学反应

AI大模型

脑极体发布于 2023-09-20 20:40:16

AI新新人类现身，知识库存储给予大模型“大脑”，开箱即用的大模型长啥样？

AI大模型

脑极体发布于 2023-09-22 18:14:44

AI大模型可以设计电路吗?

AI大模型

电子发烧友网官方发布于 2024-01-02 15:09:29

AI大模型会不会取代电子工程师?

AI大模型

电子发烧友网官方发布于 2024-01-02 15:11:43

AI大模型怎么解决芯片过剩?

AI大模型

电子发烧友网官方发布于 2024-01-02 15:42:05

AI大模型可以取代大学教育吗？

AI大模型

电子发烧友网官方发布于 2024-01-02 16:27:52

AI大模型远程控制启动车辆（原创）

AI大模型

还没吃饭发布于 2024-03-18 15:18:29

MD5算法硬件加速模型

针对MD5软件实现方法存在占用资源大、安全性差等缺点，提出了基于NetMagic平台的MD5硬件加速模型设计方案，并基于ModelSim和NetMagic平台对提出的非流水线与流水线硬件加速模型进行

2018-01-12 16:45:07

AI模型利用神经网络数据“藏毒”？

然而，如果攻击者在使用AI模型时也“以管理员身份运行”，给AI模型埋藏一个“后门”，平时程序运行正常，然而一旦被激活，模型输出就会变成攻击者预先设置的目标。

2020-08-23 09:47:39

1412

Buffer加载AI模型的步骤

我们在进行CNN模型推理的时候，需要预先从DDR或者ROM中加载AI模型。

2021-01-23 09:36:48

2292

大模型时代的AI之变与开发之根

自2018年谷歌发布Bert以来，预训练大模型以强大的算法效果，席卷了NLP为代表的各大AI榜单与测试数据集。随着产学研各界的深入研究，大模型在AI产学研各界的地位得到不断加强。到2021年，我们

2021-09-29 08:54:42

2406

从Buffer加载AI模型

我们在进行CNN模型推理的时候，需要预先从DDR或者ROM中加载AI模型。大家平时一般用的是create from file的形式，为了保护自己的模型IP，...

2022-01-25 19:26:13

移植深度学习算法模型到海思AI芯片

本文大致介绍将深度学习算法模型移植到海思AI芯片的总体流程和一些需要注意的细节。海思芯片移植深度学习算法模型，大致分为模型转换，...

2022-01-26 19:42:35

Microsoft使用NVIDIA Triton加速AI Transformer模型应用

Microsoft 的目标是，通过结合使用 Azure 与 NVIDIA GPU 和 Triton 推理软件，率先将一系列强大的 AI Transformer 模型投入生产用途。

2022-04-02 13:04:21

1456

使用NGC目录中的生产级模型加速AI开发工作

使用 NGC 目录中的生产级模型，加速 AI 开发工作。

2022-06-28 15:46:50

864

参天生长大模型：昇腾AI如何强壮模型开发与创新之根？

自2018年谷歌发布BERT以来，预训练大模型经过几年的发展，以强大的算法效果，席卷了以NLP为代表的各大AI榜单与测试数据集。2020年OpenAI发布的NLP大模型GPT-3，实现了千亿级参数

2022-08-11 09:10:39

1338

AI大模型的白垩纪

美好的长假即将过去，我们又该忙起来了。在AI领域，这两年最忙的一项基础技术应该非大模型莫属。随着最近AI绘画、AI生成视频等能力不断刷新大众对AI技术边界的认知，站在AI创作家们背后的大模型的地位

2022-10-08 22:12:57

584

加速边缘设备中计算机视觉和语音的AI推理模型

　　加速AI推理模型已成为一项基本任务，因为我们正朝着创建更复杂，更高效的AI应用程序迈进。灵活和完整的AI辅助是在快速增长的AI领域取得成功的关键组成部分。

2022-10-19 09:08:50

423

NVIDIA GPU加速潞晨科技Colossal-AI大模型开发进程

通过 NVIDIA GPU 加速平台，Colossal-AI 实现了通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等方式，更高效快速部署 AI 大模型训练与推理。

2022-10-19 09:39:39

1149

NVIDIA 为全球企业带来生成式 AI 推出用于创建大型语言模型和视觉模型的云服务

为AI驱动的应用构建自定义模型加利福尼亚州圣克拉拉 – GTC – 太平洋时间 2023年3月21日 – 为了加速企业应用生成式AI，NVIDIA今日宣布推出一套云服务，使企业能够构建、完善

2023-03-22 13:45:40

261

ChatGPT:AI模型框架研究

　　一、AI框架重要性日益突显，框架技术发展进入繁荣期，国内AI框架技术加速发展：　　1、AI框架作为衔接数据和模型的重要桥梁，发展进入繁荣期，国内外框架功能及性能加速迭代；　　2、Pytorch

2023-03-29 17:06:16

什么是预训练 AI 模型？

预训练 AI 模型是为了完成特定任务而在大型数据集上训练的深度学习模型。这些模型既可以直接使用，也可以根据不同行业的应用需求进行自定义。如果要教一个刚学会走路的孩子什么是独角兽，那么我们首先应

2023-04-04 01:45:02

1025

深度：国内AI大模型分析概览

百度由于多年在AI领域的深耕，其文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系，打造大模型总量约40个，产业应用也较为广泛，例如电力、燃气、金融、航天等，构建了国内业界较大的产业大模型。

2023-04-21 09:25:13

3585

紧跟AI步伐， Gitee已支持AI模型托管

AI 模型的管理界面和代码的管理界面风格统一，比较明显的区别在于在大文件（如 AI 模型文件）后会对其进行 LFS 文件的标注，并注明其所占空间大小，这样就能很方便地定位到 AI 模型文件。

2023-04-27 14:36:40

489

深度：国内4家AI大模型分析

2023-04-28 14:47:49

9586

在AI爱克斯开发板上用OpenVINO™加速YOLOv8分类模型

本系列文章将在 AI 爱克斯开发板上使用 OpenVINO 开发套件依次部署并测评 YOLOv8 的分类模型、目标检测模型、实例分割模型和人体姿态估计模型。

2023-05-05 11:47:53

561

在AI爱克斯开发板上用OpenVINO™加速YOLOv8目标检测模型

《在 AI 爱克斯开发板上用 OpenVINO 加速 YOLOv8 分类模型》介绍了在 AI 爱克斯开发板上使用 OpenVINO 开发套件部署并测评 YOLOv8 的分类模型，本文将介绍在 AI 爱克斯开发板上使用 OpenVINO 加速 YOLOv8 目标检测模型。

2023-05-12 09:08:12

789

什么是预训练AI模型？

预训练 AI 模型是为了完成特定任务而在大型数据集上训练的深度学习模型。这些模型既可以直接使用，也可以根据不同行业的应用需求进行自定义。

2023-05-25 17:10:09

595

AI爱克斯开发板上使用OpenVINO加速YOLOv8目标检测模型

《在AI爱克斯开发板上用OpenVINO加速YOLOv8分类模型》介绍了在AI爱克斯开发板上使用OpenVINO 开发套件部署并测评YOLOv8的分类模型，本文将介绍在AI爱克斯开发板上使用OpenVINO加速YOLOv8目标检测模型。

2023-05-26 11:03:18

662

在AI爱克斯开发板上用OpenVINO™加速YOLOv8-seg实例分割模型

《在 AI 爱克斯开发板上用 OpenVINO 加速 YOLOv8 目标检测模型》介绍了在 AI 爱克斯开发板上使用 OpenVINO 开发套件部署并测评 YOLOv8 的目标检测模型，本文将介绍在 AI 爱克斯开发板上使用 OpenVINO 加速 YOLOv8-seg 实例分割模型。

2023-06-05 11:52:15

561

蚂蚁集团正研发贞仪大模型

蚂蚁集团正研发贞仪大模型生成式人工智能给各行各业带来新的增长机会，很多科技企业都在研发大模型；甚至OpenAI也正在考虑创建一个应用程序商店，OpenAI构建平台供客户向企业出售定制的AI模型。蚂蚁集团的技术研发团队正在自研语言和多模态大模型，蚂蚁集团这个正在研发的大模型命名为“贞仪”。

2023-06-21 17:16:17

957

AI大模型网络如何搭建

2023年，以ChatGPT为代表的AIGC大模型全面崛起，成为了整个社会关注的焦点。大模型表现出了强悍的自然语言理解能力，刷新了人们对AI的认知，也掀起了新一轮的“算力军备竞赛”。大家

2023-06-27 11:28:42

1784

在AI爱克斯开发板上用OpenVINO™加速YOLOv8-seg实例分割模型

2023-06-30 10:43:54

420

AI大模型的的三个发展阶段

AI大模型可分为自然语言处理大模型，CV大模型、科学计算大模型等。AI大模型支持的模态更加多样，从支持文本、图片、图像、语音单一模态下的单一任务，逐渐发展为支持多种模态下的多种任务。

2023-07-06 12:31:56

1386

华为发布大模型时代AI存储新品

7月14日，华为发布大模型时代AI存储新品，为基础模型训练、行业模型训练，细分场景模型训练推理提供存储最优解，释放AI新动能。企业在开发及实施大模型应用过程中，面临四大挑战： ● 首先，数据

2023-07-14 15:20:02

475

AI大模型企业智谱华章获数亿元融资

智谱成立于2019年，清华大学计算机系的技术成果为基础成立的智能型智能系，正在努力打造提出模型as a service （maas）市场概念的新型通用认知智能模型。在AI大模型研究领域，智能分析组始终受到业界的关注。

2023-07-21 09:54:49

621

AI大模型和小模型是什么？AI大模型和小模型的区别

　　随着人工智能的不断发展和应用，机器学习模型的大小越来越成为一个重要的问题。在机器学习中，我们通常将模型分为两类：大模型和小模型。本文将介绍AI大模型和小模型是什么，并分析它们各自的优缺点以及区别。

2023-08-08 16:55:33

4555

AI大模型的开源算法介绍

AI大模型的开源算法介绍什么是开源？简单来说就是不收取任何费用，免费提供给用户的软件或应用程序。开源是主要用于软件的术语，除了免费用户还可以对开源软件的源代码进行更改，并根据自身的使用情况进行

2023-08-08 17:25:01

1234

ai大模型和小模型的区别

ai大模型和小模型的区别人工智能领域中的模型分为两种，一种是大模型，另一种是小模型，两者在训练和应用中有着明显的区别。本文将从定义、特点、应用等方面详细介绍这两种模型的区别。一、概念定义

2023-08-08 17:30:54

4485

ai算法和模型的区别

ai算法和模型的区别人工智能（AI）是当今最热门的技术领域之一。虽然AI被广泛应用于各种领域，但其核心是由算法和模型组成的。AI算法和模型是AI成功应用的基础。因此，理解AI算法和模型的区别

2023-08-08 17:35:39

2264

盘古大模型测评盘古大模型是开源的吗？盘古ai大模型是软件吗?

盘古大模型测评盘古大模型是开源的吗？盘古ai大模型是软件吗? 盘古大模型测评随着人工智能的快速发展，越来越多的企业开始研发和使用人工智能技术，希望借助这项技术提高效率、降低成本、提升用户

2023-08-30 17:26:38

3364

盘古ai大模型用的什么芯片？

，具有自学能力，能够自动从大量数据中提取并学习规律，从而实现人工智能的基础。盘古AI大模型采用了GPU（图形处理器）加速技术，GPU优化的算法使其在短时间内能够完成非常庞大的数据集的学习和处理。GPU的基本原理是通过并行处理来加

2023-08-31 09:01:40

2008

如何加速生成2 PyTorch扩散模型

加速生成2 PyTorch扩散模型

2023-09-04 16:09:08

782

MeetKai着眼于数字孪生与新一代AI模型结合

数字孪生并不是一个新概念。但通过将其与新一代AI模型相结合，初创公司MeetKai正在投入资源创建有效的互动工具，例如供工厂用于优化生产流程和远程虚拟培训的工具。

2023-09-01 10:34:40

643

盘古ai大模型怎么使用

盘古ai大模型怎么使用盘古AI大模型是一个基于自然语言处理的人工智能模型，是华为公司发布的超大规模预训练模型，可以进行文本分析、问题回答、智能客服、智能写作等多种应用。盘古ai大模型

2023-09-04 10:42:44

9386

如何使用Vitis-AI加速YOLOX模型实现视频中的目标检测

本文将介绍如何使用Vitis-AI加速YOLOX模型实现视频中的目标检测，并对相关源码进行解读。由于演示的示例程序源码是Vitis-AI开源项目提供的，本文演示之前会介绍所需要的准备工作。演示之后会对关键源码进行解析。

2023-10-16 15:43:25

491

AI大模型对数据存储技术的发展趋势

AI大模型将AI带入新的发展阶段。AI大模型需要更高效的海量原始数据收集和预处理，更高性能的训练数据加载和模型数据保存，以及更加及时和精准的行业推理知识库。以近存计算、向量存储为代表的AI数据新范式正在蓬勃发展。

2023-10-23 11:26:09

326

AI 模型构建的五个过程详解

AI 模型构建的过程模型构建主要包括 5 个阶段，分别为模型设计、特征工程、模型训练、模型验证、模型融合。

2023-11-17 10:31:04

1845

华为云发布三大基础方案和AI出海计划加速大模型生态发展

今天，以“开放同飞，共赢行业AI新时代”为主题的华为云盘古大模型主题论坛·深圳站成功举办。华为云与多位不同行业的客户和伙伴围绕AI大模型、技术创新应用和产业发展新机遇等话题展开深入交流分享。同时

2023-11-23 11:25:12

240

基于AI大模型，千方科技做了哪些尝试呢？

AI大模型逐步走入冷静期，思考大模型如何助力解决实际问题、实现商业化落地成为新趋势。

2024-01-12 09:18:04

207

加速度传感器的基本力学模型是什么

加速度传感器的基本力学模型是一个受力物体的运动学和动力学模型的组合。本文将从以下几个方面介绍加速度传感器的基本力学模型。一、运动学模型加速度传感器的运动学模型主要描述传感器在空间中的位置、速度

2024-01-17 11:08:38

260

是德科技如何赋能医疗AI大模型应用呢？

自从ChatGPT爆火以来，各种AI大模型纷纷亮相，如百度科技的文心一言，科大讯飞的讯飞星火，华为的盘古AI大模型，腾讯的混元AI大模型、阿里哪吒大模型等。

2024-02-28 09:35:04

1245

已全部加载完成

搜索历史

大模型正在被加速，AI不是只有大模型

评论