0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

龙架构向量创新赋能AI图像识别计算,促进NCNN神经网络前向计算框架性能翻倍

龙芯中科 来源:龙芯中科 作者:龙芯中科 2022-11-25 17:11 次阅读

近期,经过龙芯中科与NCNN社区的共同努力,在NCNN中使用龙架构(LoongArch)向量优化实现了大部分算子,得益于龙架构向量的高效实现,优化后NCNN在平台上各项性能测试比通用实现普遍提升一倍以上。

40d1d064-6c9e-11ed-8abf-dac502259ad0.png

基于龙架构向量优化开启前后的NCNN各项性能对比

(竖轴为耗时高度,越高耗时越久,性能越低)

NCNN作为业界首个为移动端优化的神经网络前向计算框架,在2017年首次开源,是腾讯优图实验室第一次对外公开深度学习的研究成果。目前多应用在图像方面,例如人像自动美颜,照片风格化,超分辨率,物体识别等等。NCNN计算框架,因其高性能、无第三方依赖、跨平台支持大部分常见CNN网络的特点,是许多开发者在移动端、嵌入式设备上部署深度学习算法的首选框架。

40e4711a-6c9e-11ed-8abf-dac502259ad0.png

龙架构向量优化加入NCNN生态社区

本次优化共产出3万多行代码,成果将应用于龙芯AI边缘计算场景,完成基于龙架构平台的特征识别、图像处理、人脸识别等模型的部署和推理,如门禁系统、手势识别、口罩检测等等。依托于NCNN计算框架优秀的低耦结构,开发者只需关注算子在龙架构平台上的高效实现,无需考虑整个系统结构问题,实现更高效的开发与部署工作。前期,NCNN与龙芯CPU进行了较为全面的适配和性能优化,共同打通了AI应用和国产CPU硬件间的壁垒。

可搭载NCNN框架的龙芯AI边缘计算场景

龙芯中科将与NCNN社区保持密切合作,继续根据龙架构平台向量特点不断优化算子,推进龙架构生态成果落地更多场景、服务更多领域、欢迎社区广大开发者与龙芯中科一道共建自主开放的龙架构生态体系。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4749

    浏览量

    100443
  • AI
    AI
    +关注

    关注

    87

    文章

    29884

    浏览量

    268171
  • 龙芯中科
    +关注

    关注

    0

    文章

    257

    浏览量

    7587

原文标题:龙架构向量创新赋能AI图像识别计算,促进NCNN神经网络前向计算框架性能翻倍

文章出处:【微信号:gh_53fadbdbd4d4,微信公众号:龙芯中科】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【飞凌嵌入式OK3576-C开发板体验】RKNPU图像识别测试

    RKNPU在深度学习运算能力上有了显著的提升。 2.3、技术特点 高性能 :RKNPU采用专门的硬件架构和优化算法,能够实现高效的神经网络计算,满足复杂场景下的实时处理需求。 低功耗
    发表于 10-10 09:27

    基于迅为RK3588开发板的AI图像识别方案

    操作)算力的高性能神经网络处理器单元(NPU)。这款NPU不仅拥有强大的计算能力,支持TensorFlow、Caffe、Tflite、Pytorch、Onnx NN、Android NN 等常见
    发表于 08-13 11:26

    pytorch中有神经网络模型吗

    当然,PyTorch是一个广泛使用的深度学习框架,它提供了许多预训练的神经网络模型。 PyTorch中的神经网络模型 1. 引言 深度学习是一种基于人工神经网络的机器学习技术,它在
    的头像 发表于 07-11 09:59 606次阅读

    人工神经网络模型的分类有哪些

    人工神经网络(Artificial Neural Networks, ANNs)是一种模拟人脑神经元网络计算模型,它在许多领域,如图像识别、语音
    的头像 发表于 07-05 09:13 864次阅读

    反向传播神经网络和bp神经网络的区别

    神经网络在许多领域都有广泛的应用,如语音识别图像识别、自然语言处理等。然而,BP神经网络也存在一些问题,如容易陷入局部最优解、训练时间长、对初始权重敏感等。为了解决这些问题,研究者们
    的头像 发表于 07-03 11:00 612次阅读

    BP神经网络算法的基本流程包括

    BP神经网络算法,即反向传播(Backpropagation)神经网络算法,是一种多层神经网络,通过反向传播误差来训练网络权重。BP
    的头像 发表于 07-03 09:52 385次阅读

    卷积神经网络计算过程和步骤

    卷积神经网络(Convolutional Neural Network, CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积神经网络计算
    的头像 发表于 07-03 09:36 400次阅读

    卷积神经网络图像识别中的应用

    卷积操作 卷积神经网络的核心是卷积操作。卷积操作是一种数学运算,用于提取图像中的局部特征。在图像识别中,卷积操作通过滑动窗口(或称为滤波器、卷积核)在输入图像上进行扫描,
    的头像 发表于 07-02 14:28 878次阅读

    神经网络传播和反向传播区别

    神经网络是一种强大的机器学习模型,广泛应用于各种领域,如图像识别、语音识别、自然语言处理等。神经网络的核心是
    的头像 发表于 07-02 14:18 603次阅读

    神经网络图像识别中的应用

    随着人工智能技术的飞速发展,神经网络图像识别领域的应用日益广泛。神经网络以其强大的特征提取和分类能力,为图像识别带来了革命性的进步。本文将详细介绍
    的头像 发表于 07-01 14:19 589次阅读

    神经网络架构有哪些

    神经网络架构是机器学习领域中的核心组成部分,它们模仿了生物神经网络的运作方式,通过复杂的网络结构实现信息的处理、存储和传递。随着深度学习技术的不断发展,各种
    的头像 发表于 07-01 14:16 562次阅读

    基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

    * 通过开源开放推动更多人开展基于 FPGA 的类脑体系结构研究与学习,目前已开放至 Github。 1.2 应用领域 从 SNN 算法角度: 该目标图像识别基于脉冲馈卷积网络,运用
    发表于 06-25 18:35

    实现图像识别神经网络的步骤

    我们的下一个任务是使用先前标记的图像来训练神经网络,以对新的测试图像进行分类。因此,我们将使用nn模块来构建我们的神经网络
    的头像 发表于 01-22 10:01 939次阅读
    实现<b class='flag-5'>图像识别</b><b class='flag-5'>神经网络</b>的步骤

    计算机视觉:AI如何识别与理解图像

    计算机视觉是人工智能领域的一个重要分支,它致力于让机器能够像人类一样理解和解释图像。随着深度学习和神经网络的发展,人们对于如何让AI识别和理
    的头像 发表于 01-12 08:27 1321次阅读
    <b class='flag-5'>计算</b>机视觉:<b class='flag-5'>AI</b>如何<b class='flag-5'>识别</b>与理解<b class='flag-5'>图像</b>

    使用Python卷积神经网络(CNN)进行图像识别的基本步骤

    Python 卷积神经网络(CNN)在图像识别领域具有广泛的应用。通过使用卷积神经网络,我们可以让计算机从图像中学习特征,从而实现对
    的头像 发表于 11-20 11:20 5458次阅读