0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第二届大会回顾第12期 | ClarifyGPT: 基于交互式需求澄清的大模型代码生成框架

OpenHarmony TSC 来源:OpenHarmony TSC 作者:OpenHarmony TSC 2024-02-25 17:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

演讲嘉宾 | 石 琳

回顾整理 | 廖 涛

排版校对 | 李萍萍

嘉宾介绍

开发者工具分论坛

石琳,北京航空航天大学软件学院教授,CCF高级会员,2022年度中国科学院软件研究所杰出青年科技人才。研究方向为智能软件工程,包括代码智能、智能需求工程、经验软件工程、开源软件、可信AI等。曾在软件工程、人工智能领域的高水平国际会议发表论文50余篇,三次获得杰出论文奖;主持参与多项国家自然科学基金项目、国家重点研发项目等;担任多个国际知名会议期刊审稿人。

视频回顾

打开哔哩哔哩APP,观看更清晰视频

正文内容

随着AI大模型能力的大幅提升,软件开发已经逐步走向新智能化时代。然而,目前代码大模型在可靠性、隐私和合规以及用户意图识别等方面仍存在一定局限性。如何基于交互式需求澄清方法,让大模型更好地理解用户意图,并给出更准确的答案?北京航空航天大学教授石琳在第二届OpenHarmony技术大会上进行了精彩分享。

72dbb404-cf89-11ee-b759-92fbcf53809c.png

2022年11月,OpenAI发布ChatGPT,利用GitHub数据与RLFH强化学习技术,在辅助编程取得进展;2023年1月,微软Copilot平台用户超过1亿,CEO表示Copilot很快就会替代程序员完成80%的代码开发。在GitHub的报告中,使用Copilot的开发者的开发效率几乎提升了一倍,一个用Copilot的初学者就能够像专业程序员一样,从零开始开发出最小可行产品程序。此外,清华大学推出的ChatDev项目,支持多个智能体分工合作,能够根据用户指令生成休闲小游戏、效率管理工具、绘画板、数学计算器、网络爬虫等软件。

通过前文可知,代码大模型在软件开发方面“一鸣惊人”,给开发者们带来了极大的便利。但是,代码大模型的快速发展同时也带来了新的问题,如:

模型问题:可靠性、幻觉、更新、形式重于内容

数据问题:数据演化、质量问题、安全问题、隐私和合规

应用问题:用户意图不明确、复杂问题抽象和分解、项目上下文、领域专业知识、遗留系统维护

7302e79a-cf89-11ee-b759-92fbcf53809c.png

其中,用户的意图表述不明确是代码大模型在实践中遇到的巨大阻碍。开发者想写出一个清晰明确且全面的Prompt并不容易。既然开发者写的Prompt不清晰,有没有办法让大模型帮开发者改写?目前,业界已经有一些尝试,例如GPT Engineer。GPT Engineer是一个基于需求描述自动生成项目源码的开源项目,主打轻量,灵活生成项目源码,可以在AI生成与人工生成之间进行切换。在接收到Prompt时,GPT Engineer不会直接生成代码,而是先梳理有哪些事项需要用户进一步澄清,然后让用户把需要澄清的事项输入后,再进一步生成代码。然而,GPT Engineer经常会问一些在Prompt中已经提供了答案的问题,对用户造成困扰。

如何找到Prompt中“不清楚”的地方,从而进行精准提问?石琳教授所在团队提出了ClarifyGPT工具。ClarifyGPT会先识别是否应该提问,再利用大模型生成问题。

ClarifyGPT的模块1:基于测试结果的代码多样性评价模块

如何判断是否应该向用户做Prompt澄清呢?这里我们从代码大模型的输出结果出发,提出一个基本假设:如果Prompt清晰,大模型生成的代码应该行为一致;如果Prompt模糊,大模型生成的代码可能五花八门。因此,ClarifyGPT会先通过种子输入进行代码多样性测试,并基于测试结果判断是否要做向用户做Prompt的澄清。

具体而言,(1)先进行种子测试输入初始化。构建prompt用于生成种子输入,Prompt包含三部分:Instruction,Demonstrations,Query。将Prompt输入LLM中生成一些测试输入,并用它们初始化一个种子池;(2)再进行类型感知的测试输入变异(采用了标准的基于变异的模糊流程)。在每次迭代时,从种子池中随机选择一个输入;对于选定的输入,我们检查其数据类型并执行与其类型一致的单个变异操作以创建新的测试用例;完成一轮突变后,我们将新生成的输入添加到种子池中,并重复上述过程,直到获得所需的生成输入数量。

7318fa44-cf89-11ee-b759-92fbcf53809c.png

ClarifyGPT的模块2:基于推理的LLM问题生成模块

在确定了需要向用户做Prompt澄清后,应该问什么内容呢?为了解决这个以问题,ClarifyGPT会进一步分析代码的细节差异,区分不一致的代码,比较solution的不同点,再基于推理进行LLM问题生成。

具体而言,首先生成中间推理步骤(分析导致歧义的因素),然后基于这些中间推理步骤产生最终结果(有针对性的澄清问题)。此外,ClarifyGPT鼓励LLM进行“超前规划”,使他们能够更好地利用他们的推理和理解能力来提高生成问题的质量。

73279cca-cf89-11ee-b759-92fbcf53809c.png

经过评测,ClarifyGPT将GPT-4在MBPP-sanitized上的表现(Pass@1)从70.96%提高到80.8%;将MBPP-ET的性能从51.52%提高到60.19%。相对改善平均为15.35%,优于基线。且增加Prompt中示例的数量会带来ClarifyGPT性能提升。

ClarifyGPT是一个交互式代码生成框架,会引导用户先澄清意图,再利用大模型帮助用户生成代码。后续,ClarifyGPT也会在其他生成类任务上进行进一步的研究和探索。

大模型加速了研发人员的工作效率,但同时也提出了新的挑战。我们必须大胆尝试LLM在改进软件开发方面的潜力,但同时也要谨慎行事,不要忘记工程思维、严谨性和经验验证的基本原则。 【材料分享】 [1] 论文原文下载 http://arxiv.org/abs/2310.10996 [2] 开源原型工具 https://github.com/ClarifyGPT/ClarifyGPT(点击阅读原文可跳转)

E N D

关注我们,获取更多精彩。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41051

    浏览量

    302560
  • 代码
    +关注

    关注

    30

    文章

    4976

    浏览量

    74369
  • OpenHarmony
    +关注

    关注

    33

    文章

    3974

    浏览量

    21351
  • 大模型
    +关注

    关注

    2

    文章

    3764

    浏览量

    5269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AAC瑞声科技精彩亮相第二届焉知人形机器人大会

    2026年3月27日,AAC瑞声科技精彩亮相第二届焉知人形机器人大会
    的头像 发表于 03-30 11:15 1159次阅读

    Faraday Future即将参加Cantor第二届全球科技与工业增长大会

    “公司”)今日宣布,公司将参加Cantor 第二届全球科技与工业增长大会(Cantor Global Technology & Industrial Growth Conference)。本次大会
    的头像 发表于 03-11 14:42 355次阅读

    普强荣登毕马威第二届智能制造科技50榜单

    普强荣登毕马威“第二届智能制造科技50"榜单,凭借深厚的技术沉淀、创新实践及行业影响力,成功跻身榜单,与众多优秀企业共同彰显中国制造的强劲活力。
    的头像 发表于 02-28 15:28 1021次阅读

    导远科技入选毕马威第二届智能制造科技50榜单

    1月16日,毕马威发布《第二届智能制造科技50》报告,并公开“未来行业50榜单——智能制造科技50榜单”。导远科技凭借卓越的智能制造能力,连续两年蝉联该榜单。
    的头像 发表于 01-22 13:40 446次阅读

    沐曦受邀出席第二届开源产业生态大会

    以“开源筑基·数实维新”为主题的第二届开源产业生态大会将于1月13日在上海举行。沐曦受邀出席本次行业盛会,联合创始人、CTO兼首席软件架构师杨建将发表主题演讲并参与圆桌论坛环节,分享沐曦在开源生态体系建设方面的实践经验与思考的同时,共探开源生态赋能可持续发展的路径。
    的头像 发表于 01-14 13:51 399次阅读

    见合八方亮相第二届分布光纤传感技术及应用大会

    2025年11月22日至23日,第二届分布光纤传感技术及应用大会(DOFS2025)在珠海圆满举办,大会以“学术引领·技术破壁”为使命,聚焦“从实验室到产业闭环”核心命题,汇聚全球顶
    的头像 发表于 11-30 14:17 698次阅读

    云天励飞出席湛江市第二届企业家大会

    近日,湛江市第二届企业家大会隆重举行。本届大会以“聚合力 兴产业 谋发展 创未来”为主题,吸引了央企、国企、外企、民企、侨商以及在外创业的湛江籍企业家齐聚湛江,共同探讨城市高质量发展的新路径。湛江市委书记余钢出席
    的头像 发表于 11-25 11:25 848次阅读

    梦芯科技出席第二届中国测绘地理信息大会主题论坛

    11月5-7日,以“科技融智创新,产业新质发展,北斗服务全球”为主题的第二届中国测绘地理信息大会在浙江湖州德清举行。大会围绕地理信息产业新质发展、北斗导航系统全球应用和测绘地理信息科技创新开展深入交流。
    的头像 发表于 11-11 16:40 745次阅读

    南方测绘亮相第二届中国测绘地理信息大会

    11月6日,第二届中国测绘地理信息大会在浙江省湖州市的德清国际展览中心开幕。本届大会由中国地理信息产业协会、中国测绘学会、中国卫星导航定位协会共同主办。
    的头像 发表于 11-11 16:12 1209次阅读

    北斗星通亮相第二届中国测绘地理信息大会

    11月6日,第二届中国测绘地理信息大会在浙江德清盛大开幕。本届大会以“科技融智创新 产业新质发展 北斗服务全球”为主题,旨在进一步打造测绘地理信息行业大会品牌,助力测绘地理信息科技创新
    的头像 发表于 11-06 17:46 1404次阅读

    梦芯科技亮相第二届中国测绘地理信息大会

    由自然资源部指导,中国地理信息产业协会、中国测绘学会和中国卫星导航定位协会共同主办的第二届中国测绘地理信息大会,于2025年11月5日至7日在浙江湖州德清举行。本届大会主题为“科技融智创新 产业新质
    的头像 发表于 11-06 17:12 1476次阅读

    易灵思与思特威第二届机器视觉方案大会圆满收官

    近日,由易灵思与思特威联合举办的第二届机器视觉方案大会在深圳福田会展中心成功举行。本次大会以技术驱动与应用落地为核心,汇聚了行业专家、合作伙伴与资深工程师,共同探讨了机器视觉领域的前沿技术与未来趋势。
    的头像 发表于 09-02 12:51 1043次阅读

    第二届Vector中国技术日即将举办

    第二届Vector中国技术日将于9月16日-17日在上海国家会展中心举办。
    的头像 发表于 08-21 11:30 1196次阅读

    龙芯中科亮相第二届算力之都开发者大会

    近日,以“开源·开放 融合·服务”为主题的第二届算力之都开发者大会暨天翼云AI生态合作大会在银川召开。大会由中国电信宁夏公司携手龙芯中科等业界领军企业与顶尖科研院所共同主办,旨在深度激
    的头像 发表于 08-16 13:52 1892次阅读

    海格通信亮相第二届中国移动产业投资生态合作大会

    2025年7月9日,第二届中国移动产业投资生态合作大会在四川成都召开。中国移动与参股及投资生态企业、投资机构齐聚探讨产业投资趋势,共谋产业合作发展。
    的头像 发表于 07-09 18:18 2003次阅读