0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型在代码缺陷检测领域的应用实践

OSC开源社区 来源: 百度Geek说 2023-11-08 10:27 次阅读

作者 | 小新、车厘子

导读

静态代码扫描(SA)能快速识别代码缺陷,如空指针访问、数组越界等,以较高ROI保障质量及提升交付效率。当前扫描能力主要依赖人工经验生成规则,泛化能力弱且迭代滞后,导致漏出。本文提出基于代码知识图谱解决给机器学什么的问题,以及基于代码大模型解决机器怎么学的问题,让计算机像人一样看懂代码,并自动发现代码中的缺陷,给出提示,以期达到更小的人力成本,更好的效果泛化和更高的问题召回。

01代码缺陷检测背景介绍

静态代码扫描(SA)指在软件工程中,程序员写好源代码后,在不运行计算机程序的条件下,对程序进行分析检查。通过在代码测试之前,在编码阶段就介入SA,提前发现并修复代码问题,有效减少测试时间,提高研发效率,发现BUG越晚,修复的成本越大。

2c513e60-7d5d-11ee-939d-92fbcf53809c.png

MEG的SA能力于2018年建立,支持C++、GO等语言,建设100+个规则,覆盖大部分MEG的模块,一定程度保障线上质量。当前检测主要依赖人工生成规则,存在人工编写成本高,以及泛化能力弱且迭代滞后,导致问题漏出。2022年Q2,我们团队尝试引入大模型:通过代码语言大模型,实现机器自主检测缺陷,提升泛化能力和迭代效率,减少人工编写规则的成本。接下来,为大家带来相关介绍。

02基于规则的代码缺陷检测主要问题

随着缺陷规则增多,覆盖的语言和模块增多,有两个突出的痛点急需解决:

1、每种规则都需人工根据经验和后续的漏出分析维护,成本较高;以空指针场景为例,人工编写的规则代码共4439行,维护的回归case共227个,但Q2仍有3个bug漏出。我们如何引入大模型减少开发成本,提质增效?

2、有效率偏低,扫描的能力有限(如断链、框架保证非空、复杂场景静态很难识别等,且风险的接受不同,扫描的部分高风险问题存在修复意愿低,对用户造成打扰。我们如何通过模型,从历史误报中学习经验,进行过滤,减少打扰,提升召回?

03解决方案

为了解决2个痛点问题,提出对应的解决方案。

3.1基于大模型的缺陷自动扫描

如何让计算机像人一样看懂代码,并自动发现代码中的缺陷,给出提示。要让计算机自主进行缺陷检测,核心需要解决2个技术难题:

【学什么】给计算机输入什么内容,能让计算机更快、更好的学习;主要依托代码知识图谱提取目标变量相关的片段,减少机器学习需要的样本量,提升学习的准确性。

【怎么学】针对输入的内容,采用什么算法,能让机器像人一样读懂多种程序语言,并完成检测任务;采用深度学习的方法,主要包含预训练和微调两部分。预训练技术让计算机在海量无标签的样本中学习到多种语言的通用代码语义,本项目主要采用开源的预训练大模型。微调技术通过给大模型输入缺陷检测的样本,从而得到适配场景的大模型,让机器自主的进行缺陷识别。

2c662870-7d5d-11ee-939d-92fbcf53809c.png

3.1.1 代码知识图谱提取片段

为了平衡模型性能和资源,不同大模型允许输入的token量级不同,如Bert模型限制512个token,因此,需要对输入进行缩减。代码知识图谱是基于程序分析手段,对业务源代码经过模糊或精准的词法分析、语法分析和语义分析后,结合依赖分析、关系挖掘等手段,构建得到的软件白盒代码知识网。图谱提供了多种数据访问方式,用户可以低成本的访问代码数据。

借助于代码知识图谱能力,可以根据不同场景制定不同的与目标变量或目标场景相关的上下文源码获取能力,提取的关键步骤包括:

构建被分析代码的知识图谱

目标变量检测识别:在变更代码中识别目标变量,作为待检测变量

变量依赖分析:基于控制流和数据流的与目标变量相关的依赖变量分析

特征语句提取和剪枝

2c70de32-7d5d-11ee-939d-92fbcf53809c.png

以空指针风险检测为例,最终得到如下样例的代码切片信息

2c893d10-7d5d-11ee-939d-92fbcf53809c.png

3.1.2 采用大模型学习算法进行缺陷预测

大模型检测缺陷有两种思路:

1、一种是通过判别式的方法,识别是否有缺陷以及缺陷类型;

2、一种是通过生成式的方法,构建prompt,让程序自动扫描所有相关缺陷。

本项目主要采用判别式的方法,并在实践中证明该方法具有一定可行性。生成式的方法同步实验中,接下来分别介绍两种思路的一些实践。

3.1.2.1 判别式的方法

通过分类的思想,基于模型,从历史的样本中学习规律,从而预测新样本的类别。深度学习众多算法中,如TextCNN、LSTM等,应该采用哪一种?我们通过多组对比实验,最终选择效果最佳的BERT代码大模型。

2c94b690-7d5d-11ee-939d-92fbcf53809c.png

△模型效果

采用BERT进行缺陷检测共含3步,分别是预训练、微调和推理。

预训练阶段采用开源的多语言大模型,已较好的学习多种程序语言的语义。

微调阶段,给模型输入上述通过代码知识图谱提取的变量使用点相关的切片,以及是否有缺陷或者缺陷类型的标签,生成微调模型,让机器具备做检测任务的能力。输入的格式:

 {
 "slices": [{"line":"行代码内容", "loc": "行号"}],
 "mark": {"label":"样本标签", "module_name":"代码库名", "commit_id":"代码版本", "file_path":"文件名", "risk_happend_line":"发生异常的行"}
 }

推理阶段,分析使用点目标变量的相关切片,通过微调模型进行预测,得到使用点是否有缺陷,以及缺陷类型

模型上线后,用户对结果反馈状态包括误报和接受,采集真实反馈样本,加入微调模型自动训练,从而到达自动迭代、快速学习新知识的目的。

2ca62f24-7d5d-11ee-939d-92fbcf53809c.png

3.1.2.2 生成式的方法

生成式模型百花齐发,有闭源的如chatgpt、文心一言,有开源的如llama、bloom和starcode等。我们主要尝试文心一言、llama和bloom,通过prompt(few shot、引入思维链、指定抽象的引导规则)和微调的方式,探索模型在空指针缺陷检测的预测效果。整体f1测度不高,最佳的bloom61.69%,相比Bert路线的80%有差距,且模型的稳定性较差。因生成式路线有自身的优势,如参数量大存在智能涌现具有更强的推理能力,允许输入的token量不断增加可减少对切片清洗的依赖,可与修复一起结合等,我们预判在缺陷检测场景生成式是个趋势,接下来我们将继续优化,不断尝试prompt和微调,通过更合适的引导,更好的激发模型的潜力,从而提升生成式方法在检测场景的效果。

2cb07ccc-7d5d-11ee-939d-92fbcf53809c.png    

3.2 采用规则+机器学习进行误报过滤

缺陷检测场景识别的缺陷是风险,存在接受度问题,如何过滤掉其中低风险问题,是个难题。通过分析误报和修复的样本,我们采集误报相关的特征,如指针类型,模块误报率、文件误报率等跟误报相关的10+特征,训练机器学习模型(逻辑回归),判断是否需要过滤.

整体方案架构图如下:

2ccdfb80-7d5d-11ee-939d-92fbcf53809c.png

04业务落地

基于AI的代码缺陷检测能力可以集成进入code管理平台,每次代码提交,展示可能存在的代码缺陷,阻塞合入,并采集研发人员的反馈,便于模型迭代。

05收益和展望

5.1 收益

通过理论和实践证明,让计算机自主学习程序语言并完成缺陷检测任务具有一定可行性。

1、本项目的方法已在IEEE AITest Conference 2023发表论文:

2、实际落地效果:2023Q2 C++空指针场景已覆盖1100+模块,修复问题数662个,相比规则型静态代码扫描召回占比26.9%,增量召回484个,重合度26.8%,初步证明AI的召回能力,打开了大模型做代码缺陷检测的大门,同时也验证大模型具备传统规则的扩召回、低成本的优势,可形成标记+训练+检测的自闭环。

5.2 展望

基于5.1收益,给了我们用大模型做代码缺陷检测的信心,后续我们继续在以下几个方面加强:

1、扩展更多语言和场景,如除零、死循环、数组越界场景,并在多语言go、java等进行快速训练,并进行发布;

2、随着生成式模型的兴起,也会逐渐积累有效的问题和修复数据,贡献文心通用大模型,进行预训练和微调,以探索生成式模型在智能缺陷检测与修复领域的应用;

3、同时将调研更多基础切片技术,拿到更多丰富有效代码切片,以提升准召率。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7488

    浏览量

    87847
  • 代码
    +关注

    关注

    30

    文章

    4779

    浏览量

    68519
  • 缺陷检测
    +关注

    关注

    2

    文章

    142

    浏览量

    12221
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2638

原文标题:大模型在代码缺陷检测领域的应用实践

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践

    的未来发展方向进行了展望,包括跨领域、跨模态和自动提示生成能力方向,为读者提供了对未来技术发展的深刻见解。《大语言模型原理与工程实践》是一本内容丰富、深入浅出的技术书籍。它不仅为读者提供了大语言
    发表于 04-30 15:35

    【大语言模型:原理与工程实践】大语言模型的评测

    知识获取、逻辑推理、代码生成等方面的能力。这些评测基准包括语言建模能力、综合知识能力、数学计算能力、代码能力和垂直领域等多个维度。对于微调模型
    发表于 05-07 17:12

    缺陷检测工业生产中的应用

    自己开发出的SVS系列工业智能软件缺陷检测的具体应用“充电器字符缺陷检测系统”为例为大家说明。检测
    发表于 11-18 13:48

    [转]产品表面缺陷检测

    ` 工业制造过程中,总会有各种生产缺陷。以前大多数的产品检测都是用肉眼检查的,随着机器视觉技术的发展,使用机器代替人眼检测已成为未来的发展趋势。机器视觉
    发表于 08-07 16:40

    labview深度学习应用于缺陷检测

    标注产品后通过训练平台完成模型训练经过少量样品训练得到测试结果,表明深度学习对传统视觉算法比较棘手的缺陷检测方面,能简单粗暴的解决问题,后续就是增加缺陷样品的收集,标注,以及
    发表于 08-16 18:12

    机器视觉检测系统薄膜表面缺陷检测的应用

    高产量下的薄膜质量,提出了基于机器视觉检测技术在线薄膜缺陷自动化检测方法。机器视觉检测技术的薄膜表面缺陷
    发表于 10-30 16:15

    广东机器视觉缺陷检测系统包装袋封口检测的应用

    、测量、识别和定位功能中,视觉缺陷检测的能力更强。除此之外,它还可以提高生产效率和自动化程度,因此工业领域得到了非常广泛的应用,是智能制造的重要基础。四元数致力于运动控制、图像与视觉
    发表于 06-30 09:53

    芯片缺陷检测

    Tips:需要了解项目细节或者相关技术支持,以下是联系方式。(源码中去掉了部分核心代码,需要Github账号,将项目Star之后截图发到邮箱,我会把核心代码进行回复)机器视觉项目----芯片缺陷
    发表于 07-23 06:42

    表面检测市场案例,SMT缺陷检测

    很多,一种电路板从几十种到几百种缺陷,这对检测人员要求很高;并且检测人员有岗位流动的情况下,要确保每个检测人员达到合格水平是非常困难的。
    发表于 11-08 14:28

    基于改进万有引力优化的LSSVM模型标签缺陷检测中的应用

    基于改进万有引力优化的LSSVM模型标签缺陷检测中的应用_庄葛巍
    发表于 12-28 14:24 0次下载

    表面缺陷检测系统的应用领域有哪些

    国辰表面缺陷检测系统能实时检测、显示和识别布匹上的表面缺陷,能检测分别出断经/纬、松经/纬、孔洞、疵点、脏/污点、破损、蚁虫、尘埃等常见表面
    发表于 09-16 17:11 1014次阅读

    魔方大模型智能汽车领域的应用实践与探索

    汽车领域最新的应用实践与探索。 当前,大模型的出现正在加速信息技术进入智能原生时代,并使得人机自然交互真正成为可能。而混合AI,端云协同等人工智能技术新的发展趋势,为大模型
    的头像 发表于 08-30 10:01 1505次阅读

    瑞萨电子深度学习算法缺陷检测领域的应用

    浪费大量的人力成本。因此,越来越多的工程师开始将深度学习算法引入缺陷检测领域,因为深度学习特征提取和定位方面取得了非常好的效果。
    的头像 发表于 09-22 12:19 889次阅读
    瑞萨电子深度学习算法<b class='flag-5'>在</b><b class='flag-5'>缺陷</b><b class='flag-5'>检测</b><b class='flag-5'>领域</b>的应用

    深度学习工业缺陷检测中的应用

    工业制造领域中,产品质量的保证是至关重要的任务之一。然而,人工的检测方法不仅费时费力,而且容易受到主观因素的影响,从而降低了检测的准确性和一致性。近年来,基于深度学习的技术工业
    的头像 发表于 10-24 09:29 1530次阅读
    深度学习<b class='flag-5'>在</b>工业<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>中的应用

    描绘未知:数据缺乏场景的缺陷检测方案

    Neuro-T 视觉平台 克服了数据缺乏状况的困难,通过零代码设置 GAN模型 和 无监督学习模型 ,轻松实现缺陷图像的标注、绘制和导出。 工业应用中存在较多的
    的头像 发表于 01-25 10:46 562次阅读
    描绘未知:数据缺乏场景的<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>方案