0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对话aiXcoder总裁刘德欣:智能化软件开发2.0时代,企业如何落地领域化大模型

话说科技 来源:话说科技 作者:话说科技 2024-08-16 09:40 次阅读

科技日新月异的今天,以大模型、Agent等为代表的人工智能技术正引领各行各业的深刻变革。软件开发领域,一场由AI驱动的产业智能化升级快速演变,进入智能化软件开发2.0时代。

近日,我们采访了硅心科技(以下简称:aiXcoder)总裁刘德欣,主要围绕企业如何落地领域化大模型,如何更好地拥抱智能化软件开发2.0时代等话题进行深入探讨。以下内容根据采访实录整理。

请刘总简单介绍下智能化软件开发1.0时代及其发展现状?

智能化软件开发1.0时代可以说是通过引入大模型技术,集中实现了软件开发的一些初级自动化场景,包括代码生成、代码补全、单元测试生成和缺陷检测等。系统也支持简单的需求捕获和拆分等任务。但是,这些功能通常是以独立的方式执行,不能深入理解和应用企业特定的业务逻辑。

目前国内外的玩家主要有GitHub的Copilot、Amazon的CodeWhisperer、百度的comate 、阿里的通义灵码、甚至包括我们aiXcoder的上一代产品等。各家产品在功能和能力上差异并不大,缺乏明显的差异化。尽管产品在宣传中,强调了具有更强的上下文理解能力和更大的参数量,甚至与GPT-3.5等模型进行比较占据优势,但实际上并没有真正解决大模型与企业领域知识融合这一核心问题,使得它们无法满足企业基于自身的业务落地大模型的需求,简单来讲,觉得大模型学不会自己企业的领域知识,幻觉和生成结果不确定性严重;而这种孤立性和对业务逻辑的理解不足,也导致了其产品对软件开发复杂需求的处理浮于表面,实际上代码输出的准确性和实用性往往会大打折扣,限制了其在实际企业业务环境中的应用效果和用户的信任度。

您认为智能化软件开发1.0时代具体存在的问题有哪些?

智能化软件开发1.0存在的问题主要问题是不进行有效个性化训练而直接落地大模型,这会直接产生两大缺陷:应用模式缺陷和技术缺陷。

首先,从应用模式来看,主要缺陷表现在两个方面。

第一,在训练层面,缺乏对业务原始需求与设计的考量。1.0时代的产品往往只关注代码本身的语法和结构,忽略了代码必须服务于具体的业务需求和逻辑,所以并没有将需求分析和设计文档等企业背景知识融合进模型的训练中,导致生成/补全的代码往往缺乏业务逻辑,从而使产品的准确性和可用性不足。

第二,在测试层面,无法形成需求到测试的闭环。测试自动化在1.0时代通常只基于现有代码进行,忽略了测试的本质是验证需求的完整性和正确性,没能深入到需求层面,而是仅依赖于代码级的表面生成,没有实现对原始需求的全面交互和验证。

其次,从技术缺陷来看,主要表现在三个方面。

一是环境依赖信息的缺失,现在的大模型训练主要是在开源代码及企业代码上的训练,这种脱离企业背景知识,仅对代码训练的方式,依然缺乏足够的项目上下文支持,这导致生成的代码虽然在语法上正确,但经常与项目的实际业务需求不符。虽然各大模型厂商都在上下文长度上努力,但并不会从根源上解决这一技术缺陷。

二是当前的智能化开发辅助主要依赖于大模型的语言能力,通过模式匹配和简单的Prompt指令生成代码。然而,这种方法仅停留在表层语言模型的使用上,无法深入理解复杂的业务逻辑和编程规范,导致大模型在实际应用中的表现不尽如人意,影响了结果的有效性和可靠性,尤其是生成内容的可靠性仍然存在较大问题。

三是微调方法的局限性,尽管在1.0时代我们采用了全参微调(Fine Tuning)、以及LoRaAdapter、Prompt等PEFT高效参数微调(部分参数微调)方式,甚至尝试使用RAG和MoE等方法让大模型学习特定领域知识,但这些常规微调技术和方法仍存在局限性。尽管它们在某些特定任务中表现出一定的效果,但由于没有充分训练企业领域的专有数据和背景知识,这些方法在真实业务应用中的表现往往难以达到预期,无法完全满足实际业务的需求。

从客户角度来看,我们发现很多大模型在通用的场景或者主流的测评集上表现都不错,声称也能达到30%到50%的准确率。但是一旦拿到企业中去应用,通常发现准确率下降到了10%以下。即使用各种方式做微调,效果也不尽如人意。对于企业而言,技术团队和商务团队尽力引入并上线了智能软件开发产品,也进行了相应的微调,但如果最终结果无法达到预期,可能会引发内部大量用户和软件开发人员的投诉,带来巨大的风险。综合来看,真实企业软件开发场景是非常复杂的,具有很强的业务逻辑、拥有明确的编码规范和独特的代码风格,在多阶段的复杂开发流程中更是涉及多角色、多工具、多团队的共同协作参与。尽管智能化软件开发1.0时代提供了一定的软件自动化支持,但其并没有真正解决企业领域知识问题,也没有充分考虑真实开发场景的复杂需求。所以基于这样一个背景,aiXcoder率先提出了软件开发2.0时代的概念,并已成功在多家大型企业中落地实施。通过这一模式,企业才能真正抓住并充分利用大模型所带来的技术红利。

aiXcoder如何定义智能化软件开发2.0时代的?

智能化软件开发2.0时代:首先通过严格的数据治理和链式管理,对企业的特定领域知识进行全面的结构化处理,确保从需求定义、设计、编码到最终代码提交的每个环节都得到精准记录和系统关联。在此基础上,进行低成本、高度个性化的模型训练,构建基于领域的软件工程大模型。通过多智能体协同自动化、传统软件开发方法和最佳实践的有机结合,全面保障了开发流程的高效性与结果的准确性,使大模型从单一的代码生成工具转变为与企业开发过程深度协同的智能体集合,显著提升了开发效率和产品质量。

我们所定义的智能化软件开发2.0时代,其核心概念并不复杂。可以用一个公式来概括:智能化软件开发2.0 = 专业软工领域大模型 + 多Agent协同 + 传统软件工程方法。

首先,本阶段的智能软件开发强调对软件研发流程的高度数据治理。整个开发全过程,从需求分析、概要设计、详细设计、编码实现、测试,直到最终产品上线,每一个环节都通过结构化的数据治理和全面的数据链管理进行链式数据追踪,确保软件开发的原始需求被精确记录并与系统紧密关联。这种全链条的协同工作方式,不仅使得大模型能够最大程度地理解企业特定的业务逻辑,还能够在开发的每一个阶段中准确反映这些逻辑。同时,基于经过治理的领域化数据集,对模型进行个性化训练,使大模型能够深入学习并应用企业的领域知识,从而构建一个低成本、高度个性化的企业领域化大模型,这将是最关键的一步。此外,在实现领域个性化的基础上,通过多Agent方式处理软件开发流程中的各类任务,并结合传统的软件开发方法、工具和最佳实践,确保了领域大模型输出的准确性和可靠性。

这种结合了专业软工领域大模型、多Agent协同,以及传统软件工程方法、工具与最佳实践的协同自动化方式,正是我们所定义的智能化软件开发2.0时代。

根据智能化软件开发2.0时代的定义和特性,刘总,您认为企业在迈入2.0时代时,应该重点关注哪些关键行动或策略?有哪些具体的准备工作是企业需要优先考虑的?

结合多年来我们团队对软件工程领域的深刻理解,以及aiXcoder在企业领域化大模型落地方面的丰富经验。我们总结了以下4个核心策略,帮助企业更好的拥抱智能软件开2.0时代。

第一是面向领域的开发数据治理,这一点非常关键。简而言之,企业需要对最原始的需求文档进行深入治理,将自然语言表达的“大白话”需求逐步转化为精确的开发语言描述,从需求分析、设计,到开发、测试及运维等环节的数据、知识都进行整合并进行全链条数据治理,并确保数据质量、规模与多样性,以服务于领域大模型的构建与优化。值得一提的是,这种数据管理框架和方法能够高效复用,日后大模型产生的海量数据都是基于该框架治理,从而可持续用于训练,这有助于提高企业在应对市场变化时的灵活性和响应速度。

第二是基于领域数据的个性化模型构建。通过利用治理好的领域知识数据集,并充分考虑企业算力资源、代码量等因素,对大模型进行灵活的个性化训练及参数调优,确保大模型能够精准捕捉并反映企业业务需求,使其逐步掌握企业特定的业务流程与逻辑、专业术语和编码规范。进一步地,通过应用PEFT、MoE、RAG和AI Agent等技术和方法,确保个性化训练能够根据企业具体业务需求进行灵活调整和优化。这样的策略不仅增强了模型的业务适应性,还提升了模型训练效率和输出的准确性。

第三点是将大模型的先进能力与传统软件工程的方法和工具相结合。许多企业在引入大模型后,往往倾向于完全依赖大模型,忽视了原本效果优异的软件开发工具。这种做法实际上并不合理,因为大模型虽然具有强大的能力,但其生成结果并非总是精准无误。为了确保大模型输出结果的准确性与可靠性,企业应继续结合和利用传统的软件工程工具与方法,使其与大模型协同工作,从而保障开发流程的时效性和结果的高质量。

最后一点是面向各场景的智能协同。通过引入Agent技术,将其与企业特有的软件开发流程和现有的软件开发工具相结合,以提升开发流程的透明度和效率。同时,确保所有自动化过程的合规性和可追踪性,实现需求分析、设计、编码、测试和部署等各个开发场景的深度协同。通过系统化的数据共享和流程整合,开发团队能够在各个阶段实现无缝衔接,从而更加高效地应对复杂的项目需求和快速变化的市场环境。

aiXcoder如何帮助企业落地智能软件开发2.0时代?

在与很多大型企业交流的过程中,我们发现目前企业普遍面临着搞不懂、训不转、学不会三大挑战,展开来讲,就是企业缺乏优秀人才,现有的技术人员搞不懂模型应该如何训练。有些企业技术积累较好,试图通过开源模型+各种微调的方式,尝试让大模型的能力更贴近企业的真实开发环境要求,最终还是发现大模型学不会企业的领域知识,效果不尽如人意。

为此,我们发布了一个大模型落地框架LLM Adoption Framework(LAF),旨在帮助企业了解如何将大模型与领域知识相结合,并利用我们的经验,帮助来自各个领域和行业的企业有效地部署和落地领域大模型。具体来说,该框架是一种咨询的方法论,分为以下三个阶段:第一个阶段,评估阶段。我们首先会根据企业的商业目标进行全面评估,深入了解企业已开展的工作,以及为何未能实现大模型落地的预定业绩目标,并分析导致这些差距的原因。第二阶段,模型构建及训练阶段。基于这些差距企业应该怎么选择模型,怎么准备和处理数据,如何训练模型,可以通过哪些数据治理的方法来达到预期的状态。此阶段旨在精确构建并优化大模型,确保模型深度融合并体现企业特有的领域知识。在这一阶段,不仅进行模型架构的设计与搭建,还包括针对企业独特业务逻辑和领域特定数据的深入治理及训练过程。第三阶段,上线及产品化阶段。这一阶段主要涉及产品化的过程。我们将帮助企业将领域大模型与其内部多个平台通过API进行集成,并确保模型能力能够有效输出到业务端,所有这些都需要根据企业的实际需求进行定制化实现。

总而言之,aiXcoder的LAF并非特定于任何一个开源/闭源大模型提供商,而是大量利用aiXcoder提供的大模型训练、领域经验和软件工程最佳实践为企业提供更具体的深度咨询和指导。同时,aiXcoder的LAF不仅限于aiXcoder模型使用,企业可以选择任何闭源和开源模型,它是完全可以通用的,并非aiXcoder“独门秘籍”,可以根据企业“领域知识”量身定制大模型落地实施及行动计划。

最后,总结一下我们的观点:

●无论是开源还是闭源,选择专业的软件工程大模型,而不是通用大模型。

●不关注大模型厂商宣传支持了多少功能和HumanEval、MBPP、MultiPL-E等常规的“打榜”评测集评测结果,要关注大模型实际生成内容是否真的理解企业的业务。

●务必要结合领域知识治理并训练,再做进一步微调。直接使用常规的全参微调、高效微调、RAG等方式帮助不大。

●大模型落地要高度自治、解耦,企业业务的复杂程度和连续性,更不允许绑定某个大模型厂商。

●一定要做个性化训练,不能直接落地代码大模型,同时培养自己的技术人员,有效规避直接部署模型的高风险。

关于aiXcoder简介:aiXcoder孵化自北京大学软件工程研究所,创始团队均来自北京大学,是全球最早将深度学习技术应用于代码生成与代码理解领域的团队,也是最早将深度学习应用在编程产品的团队。公司专注于AIGC for Code领域,致力于将前沿人工智能技术应用于软件工程,为企业提供完备的智能化软件开发解决方案,包括私有化部署、领域化大模型落地及定制化开发等服务,现已在金融、军工、航空航天、通信、高科技等行业头部企业部署实施。目前已服务智能编程社区版产品用户80万+,获得广泛行业及众多C端开发者们的认可。

审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 软件开发
    +关注

    关注

    0

    文章

    612

    浏览量

    27353
  • 智能化
    +关注

    关注

    15

    文章

    4869

    浏览量

    55343
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2641
收藏 人收藏

    评论

    相关推荐

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    在客服领域是大模型落地场景中最多的,也是最容易实现的。本身客服领域的特点就是问答形式,大模型接入难度低。今天跟随《大
    发表于 12-17 16:53

    北京软件开发公司有那些?做软件的公司有哪些?

    提供全面、系统的开发制作方案。在部队军工政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,军工软件
    的头像 发表于 10-28 15:02 379次阅读

    华为云联合中国信通院发布 智能化软件开发落地实践指南

    了一个可供参考的智能化软件开发落地策略和方法论。 1        智能化软件开发趋势 以大模型为代表的新一
    的头像 发表于 10-09 20:13 591次阅读
    华为云联合中国信通院发布 <b class='flag-5'>智能化</b><b class='flag-5'>软件开发落地</b>实践指南

    中软国际模型工场加速各行业智能化进程

    介绍了中软国际模型工场如何通过全栈AI场景服务,解决大模型企业应用中的核心痛点,帮助企业实现从探索到全面实践的
    的头像 发表于 09-19 14:14 322次阅读
    中软国际<b class='flag-5'>模型</b>工场加速各行业<b class='flag-5'>智能化</b>进程

    【⌈嵌入式机电一体系统设计与实现⌋阅读体验】+《智能化技术在船舶维护中的应用探索》

    船东合理规划清洁与维护周期,确保AF涂料的有效应用,减少对环境的负担。 综上所述,本文揭示了智能化技术在船舶维护领域的巨大潜力,展示了科技如何助力海洋工业应对传统挑战,推动行业向更加高效、安全
    发表于 08-26 22:22

    传奥迪与华为将在多款车型上合作,智能化驾驶新时代启航

    智能化
    北京中科同志科技股份有限公司
    发布于 :2024年08月15日 11:22:30

    工业智能网关如何助力企业实现数字转型与智能化管理

    在工业生产中的多重作用,揭示其如何助力企业实现数字转型与智能化管理。 一、工业智能网关概述 工业智能网关,也称为工业物联网网关、工业边缘计
    的头像 发表于 07-17 17:10 422次阅读
    工业<b class='flag-5'>智能</b>网关如何助力<b class='flag-5'>企业</b>实现数字<b class='flag-5'>化</b>转型与<b class='flag-5'>智能化</b>管理

    CodeArts 加速软件智能化开发,携手 HarmonyOS 重塑企业应用创新体验

    体验”为主题的分论坛。论坛汇聚了各行各业的专家学者、技术领袖和开发者,共同探讨 HarmonyOS 时代软件开发生产线智能化的优秀实践和未来发展的趋势。 CodeArts
    的头像 发表于 07-11 21:03 519次阅读
    CodeArts 加速<b class='flag-5'>软件</b><b class='flag-5'>智能化开发</b>,携手 HarmonyOS 重塑<b class='flag-5'>企业</b>应用创新体验

    中国电信发布星辰大模型软件工厂

    中国电信人工智能研究院,共同揭开了“星辰大模型软件工厂”的神秘面纱,这一创新产品的问世,标志着软件开发自动化智能化迈入了一个全新的
    的头像 发表于 07-10 15:42 937次阅读

    张永炜:智能物联2.0时代,如何用数字手段助力“双碳”目标的实现?

    2.0时代,如何用数字手段助力“双碳”目标的实现?》的主题探讨。以下根据直播访谈内容整理。数字技术助力绿色低碳智次方:您如何看待云计算、大数据、物联网、人工
    的头像 发表于 05-28 08:04 163次阅读
    张永炜:<b class='flag-5'>智能</b>物联<b class='flag-5'>2.0</b><b class='flag-5'>时代</b>,如何用数字<b class='flag-5'>化</b>手段助力“双碳”目标的实现?

    模型应用商业落地关键:给企业带来真实的业务价值

    过去的AICon全球人工智能开发与应用大会上,InfoQ采访了在大模型应用领域的领跑企业数势科技创始人兼CEO黎科峰博士,交流大模型商业
    的头像 发表于 05-23 16:32 665次阅读
    大<b class='flag-5'>模型</b>应用商业<b class='flag-5'>化</b><b class='flag-5'>落地</b>关键:给<b class='flag-5'>企业</b>带来真实的业务价值

    AI时代 麦当劳中国选择微软作为其首个智能化深度创新伙伴

    、自然语言互动、智能辅助办公、自动编程等国际先进领域的研发能力和技术支持,共同拓展新一智能技术在员工赋能,流程优化,效率提升和持续学习等
    的头像 发表于 03-21 11:23 636次阅读

    2.0适配FastChat框架,企业快速本地部署大模型对话平台

    北京2024年2月28日 /美通社/ -- 近日,浪潮信息Yuan2.0模型与FastChat框架完成全面适配,推出"企业快速本地部署大模型
    的头像 发表于 02-29 09:57 804次阅读
    源<b class='flag-5'>2.0</b>适配FastChat框架,<b class='flag-5'>企业</b>快速本地<b class='flag-5'>化</b>部署大<b class='flag-5'>模型</b><b class='flag-5'>对话</b>平台

    天壤加入元脑生态,携手浪潮信息让企业模型开发普适

    、应用服务一体领域,充分发挥各自在AI算法和应用、AI计算等方面的核心优势,向企业提供领先的一站式大模型应用开发服务,帮助
    的头像 发表于 01-29 09:04 811次阅读
    天壤加入元脑生态,携手浪潮信息让<b class='flag-5'>企业</b>大<b class='flag-5'>模型</b><b class='flag-5'>开发</b>普适<b class='flag-5'>化</b>

    基于ASPICE模型的汽车软件开发质量管理设计

    当前汽车领域正处于一个极具挑战性的历史时刻,随着电动智能化、网联和共享等不断变化的应用场景,大量新兴的业务和技术需求急速增长,汽车正
    的头像 发表于 01-08 09:06 1632次阅读
    基于ASPICE<b class='flag-5'>模型</b>的汽车<b class='flag-5'>软件开发</b>质量管理设计