龙架构向量创新赋能AI图像识别计算，促进NCNN神经网络前向计算框架性能翻倍-电子发烧友网

前言背景

近期，经过龙芯中科与NCNN社区的共同努力，在NCNN中使用龙架构（LoongArch）向量优化实现了大部分算子，得益于龙架构向量的高效实现，优化后NCNN在平台上各项性能测试比通用实现普遍提升一倍以上。

基于龙架构向量优化开启前后的NCNN各项性能对比

（竖轴为耗时高度，越高耗时越久，性能越低）

NCNN作为业界首个为移动端优化的神经网络前向计算框架，在2017年首次开源，是腾讯优图实验室第一次对外公开深度学习的研究成果。目前多应用在图像方面，例如人像自动美颜，照片风格化，超分辨率，物体识别等等。NCNN计算框架，因其高性能、无第三方依赖、跨平台支持大部分常见CNN网络的特点，是许多开发者在移动端、嵌入式设备上部署深度学习算法的首选框架。

龙架构向量优化加入NCNN生态社区

本次优化共产出3万多行代码，成果将应用于龙芯AI边缘计算场景，完成基于龙架构平台的特征识别、图像处理、人脸识别等模型的部署和推理，如门禁系统、手势识别、口罩检测等等。依托于NCNN计算框架优秀的低耦结构，开发者只需关注算子在龙架构平台上的高效实现，无需考虑整个系统结构问题，实现更高效的开发与部署工作。前期，NCNN与龙芯CPU进行了较为全面的适配和性能优化，共同打通了AI应用和国产CPU硬件间的壁垒。

可搭载NCNN框架的龙芯AI边缘计算场景

龙芯中科将与NCNN社区保持密切合作，继续根据龙架构平台向量特点不断优化算子，推进龙架构生态成果落地更多场景、服务更多领域、欢迎社区广大开发者与龙芯中科一道共建自主开放的龙架构生态体系。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4772

浏览量
100835
AI

AI

+关注

关注
87

文章
30991

浏览量
269278
龙芯中科

龙芯中科

+关注

关注
0

文章
275

浏览量
7639

原文标题：龙架构向量创新赋能AI图像识别计算，促进NCNN神经网络前向计算框架性能翻倍

文章出处：【微信号：gh_53fadbdbd4d4，微信公众号：龙芯中科】欢迎添加关注！文章转载请注明出处。

【飞凌嵌入式OK3576-C开发板体验】RKNPU图像识别测试

RKNPU在深度学习运算能力上有了显著的提升。 2.3、技术特点高性能：RKNPU采用专门的硬件架构和优化算法，能够实现高效的神经网络计算，满足复杂场景下的实时处理需求。低功耗

发表于 10-10 09:27

基于迅为RK3588开发板的AI图像识别方案

操作）算力的高性能神经网络处理器单元（NPU）。这款NPU不仅拥有强大的计算能力，支持TensorFlow、Caffe、Tflite、Pytorch、Onnx NN、Android NN 等常见

发表于 08-13 11:26

pytorch中有神经网络模型吗

当然，PyTorch是一个广泛使用的深度学习框架，它提供了许多预训练的神经网络模型。 PyTorch中的神经网络模型 1. 引言深度学习是一种基于人工神经网络的机器学习技术，它在

发表于 07-11 09:59 •707次阅读

人工神经网络模型的分类有哪些

人工神经网络（Artificial Neural Networks, ANNs）是一种模拟人脑神经元网络的计算模型，它在许多领域，如图像识别、语音识

发表于 07-05 09:13 •1245次阅读

神经网络前向传播和反向传播在神经网络训练过程中的作用

过程中的作用。 1. 前向传播（Forward Propagation）前向传播是神经网络在接收输入数据后，通过一系列

发表于 07-03 11:11 •1448次阅读

反向传播神经网络和bp神经网络的区别

神经网络在许多领域都有广泛的应用，如语音识别、图像识别、自然语言处理等。然而，BP神经网络也存在一些问题，如容易陷入局部最优解、训练时间长、对初始权重敏感等。为了解决这些问题，研究者们

发表于 07-03 11:00 •819次阅读

BP神经网络算法的基本流程包括

BP神经网络算法，即反向传播（Backpropagation）神经网络算法，是一种多层前馈神经网络，通过反向传播误差来训练网络权重。BP

发表于 07-03 09:52 •512次阅读

卷积神经网络计算过程和步骤

卷积神经网络（Convolutional Neural Network, CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积神经网络的计算

发表于 07-03 09:36 •607次阅读

卷积神经网络在图像识别中的应用

卷积操作卷积神经网络的核心是卷积操作。卷积操作是一种数学运算，用于提取图像中的局部特征。在图像识别中，卷积操作通过滑动窗口（或称为滤波器、卷积核）在输入图像上进行扫描，

发表于 07-02 14:28 •1162次阅读

神经网络前向传播和反向传播区别

神经网络是一种强大的机器学习模型，广泛应用于各种领域，如图像识别、语音识别、自然语言处理等。神经网络的核心是前

发表于 07-02 14:18 •847次阅读

神经网络在图像识别中的应用

随着人工智能技术的飞速发展，神经网络在图像识别领域的应用日益广泛。神经网络以其强大的特征提取和分类能力，为图像识别带来了革命性的进步。本文将详细介绍

发表于 07-01 14:19 •689次阅读

神经网络架构有哪些

神经网络架构是机器学习领域中的核心组成部分，它们模仿了生物神经网络的运作方式，通过复杂的网络结构实现信息的处理、存储和传递。随着深度学习技术的不断发展，各种

发表于 07-01 14:16 •719次阅读

基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

* 通过开源开放推动更多人开展基于 FPGA 的类脑体系结构研究与学习，目前已开放至 Github。 1.2 应用领域从 SNN 算法角度：该目标图像识别基于脉冲前馈卷积网络，运用

发表于 06-25 18:35

实现图像识别神经网络的步骤

我们的下一个任务是使用先前标记的图像来训练神经网络，以对新的测试图像进行分类。因此，我们将使用nn模块来构建我们的神经网络。

发表于 01-22 10:01 •1042次阅读

计算机视觉：AI如何识别与理解图像

计算机视觉是人工智能领域的一个重要分支，它致力于让机器能够像人类一样理解和解释图像。随着深度学习和神经网络的发展，人们对于如何让AI识别和理

发表于 01-12 08:27 •1469次阅读

搜索历史

龙架构向量创新赋能AI图像识别计算，促进NCNN神经网络前向计算框架性能翻倍

评论

【飞凌嵌入式OK3576-C开发板体验】RKNPU图像识别测试

基于迅为RK3588开发板的AI图像识别方案

pytorch中有神经网络模型吗

人工神经网络模型的分类有哪些

神经网络前向传播和反向传播在神经网络训练过程中的作用

反向传播神经网络和bp神经网络的区别

BP神经网络算法的基本流程包括

卷积神经网络计算过程和步骤

卷积神经网络在图像识别中的应用

神经网络前向传播和反向传播区别

神经网络在图像识别中的应用

神经网络架构有哪些

基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

实现图像识别神经网络的步骤

计算机视觉：AI如何识别与理解图像