0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI大模型快速生成题库-助力业务人效提升10+倍

京东云 来源:jf_75140285 作者:jf_75140285 2024-08-19 15:08 次阅读

一 现状·问题

1、培训考核涉及的文件数量较多

当前,京东航空公司维修部门面临着人员规模的快速增长和持续的培训需求。根据民航局的规定,维修培训必须确保所有维修人员都能够完成对飞机维修相关文件的学习,这包括维修方案、维修工程管理手册、工作程序手册等共计12本手册以及民航局发布的各类明传电报、维修工程部门发布的维修提示文件MT和技术通告文件TA等内容。这不仅适用于新招聘人员的初始培训,复训,而且每当手册更新时,都需要进行差异化培训。以上内容的培训都属于知识掌握类培训,经过近两年的运行,业务侧发现无论是课堂培训还是自学培训,培训效果都不太好,即员工常常无法在完成培训后,全面掌握所需要掌握的知识或程序要求。因此维修系统在今年对此类培训进行了改革,计划通过“以考促训”的方式提高培训效果,即通过编制考题覆盖所有需要掌握的知识点,要求受训人员通过反复做题,并在做题的过程中查询相关手册、文件等资料,最终达到100%掌握知识点的目标。按此改革计划,就需要培训分部根据每次培训材料编制海量的题库,相对于原有题库将呈指数倍增加,而且还需要实时根据资料的更新去更新对应的题目和答案。

2、培训考核涉及的文件变动频次较高、应用场景较为频繁

目前,维修系统需考核的手册类文件约12本,考题量需求约2400道;涉及的局方文件、维修发技术类文件约600条,且以20条/每月的速度增加,涉及的考题约3000道。

培训场景 频率
每月平均开展手册类培训次数 8~10次
每月开展技术类文件培训次数 8次
每月开展岗位授权类考试、技术等级评定、各类安全活动如知识竞赛 1次

以上培训场景每次均需对历史文件进行评估,对考题库进行更新修订。

3、人工拟定题目费时费力

为提高维修人员对手册程序的掌握程度,现有的培训有效性评估手段将从“一次考试机会,70分及格”转向“考试机会不限,但需满分及格”,为此需不断扩充题库数量、优化题库质量,以确保维修人员逐步熟练掌握手册中的各项要求。根据维修系统的文件数量、变动频次和应用场景,预计在2024~2025年每周需安排24时/人次梳理更新已有题库、增加新题库,全年预计增加工时1248时,需增编1人以免影响其他培训管理工作的开展。

4、无法评估现有题目有效性

题库中题目的数量快速增长。但是一旦依据的手册文件发生改版变更,原有题目是否依然正确且有效是存疑的,这需要人工投入大量时间对题库中的题目进行评估和复核,该工作量随着题库规模的增大,已经变为一项几乎不可能完成的任务。

新拟定的试题和现有题库中的试题相比,是否是重复性的试题?也无人力资源投入进行分析和判断,从而进一步导致题库规模的无节制增大,成为了一个死循环。

二、需求分析

将培训管理人员从这种低效、工作量大、技术含量低的工作中释放出来,聚焦更高价值的工作:需要根据指定的材料文件,自动生成试题,包含单选题、多选题、判断题。生成的试题对比现有题库,重复率不得高于设定值。对现有题库进行定时识别分析,判断是否存在失效风险,若和手册文件不匹配,则生成修订意见,提醒培训管理人员进行复核确认。

三、采取措施

采用向量库+大模型的方式,构建题库生成助手1、采用向量库,存储对文件材料进行向量化存储,从而实现通过简单指令快速召回相关手册的内容。2、使用大模型的自然语言处理能力,根据提供的手册内容及试题生成的要求,生成试题。

四、实践步骤

1、工具选择

大模型能力建设选择采用集团推出的AutoBots平台进行建设,该平台通过配置化的方式进行大模型、知识库、插件的快速搭建和集成,促进大模型场景的快速落地:

文件向量化方便快捷:该场景要求文件更新/新增的时候,能够及时进行向量库更新,以便能够生成试题使用。AutoBots平台提供配置化的向量库搭建能力,且打通了JoySpace,能对JoySpace中的文件快速进行解析并保存到数据库中,同时支持图片和表格的解析能里。在文档发生更新时,自动更新向量库的内容。解决了独立搭建时需要人工进行文件解析处理的问题,且解析和召回的准确度更高。

知识召回准确:AutoBots平台算法团队,对向量化的过程进行独立模型搭建,且算法调优,准确度得到保障。

流程编排能力:AutoBots平台支持通过流程编排的方式,快速对多个大模型、知识库、插件、文档解析等能力进行集成构建,支持复杂场景的实现。

2、整体流程设计

wKgaombC73qAJwgkAAFH4mhwkSs503.jpg

业务老师将文件材料上传至joypace上,Autobots自动将文件进行解析并存储在向量库中。采用培训系统作为功能载体,业务老师在系统上输入指令包含题目类型、题目难易程度、题目数量、知识范围等,机务系统后台进行大模型指令组装,调用Autobots平台上已调试好的大模型接口,进行生成结果的获取,并以预览的方式展示给用户。用户对于采纳的试题可一键加入题库。AutoBots平台上,先根据用户的指令,从向量库中召回相关知识。然后大模型根据提供的知识和要求进行试题的生成,并以JSON的格式进行结果返回。

3、大模型流程设计

采用AutoBots平台的流程编排能力,进行大模型能力的构建。

wKgZombC73uAPEhrAAL9muarmo0353.png

3.1 接收指令

接受指令中仅包含1个参数query,及为用户下发的指令,其中包含知识范围、题目类型、试题数量、难易程度等。(若直接通过接口调用的话,也可以拆解为多个参数,以便后续流程使用)

3.2 知识召回

知识召回节点的目的在于从向量库中,召回本次生成范围所需的相关知识,比如某本手册等。该节点会生成一个outputList列表,其中即为相关的知识。

3.3 大模型试题生成

通过大模型,结合召回的知识和试题生成的要求进行试题生成,由于需要和业务系统对接,所以需要对生成结果的格式进行指定,提示词如下:

# 角色

你是一位专业的题库专家,擅长根据{{document}}的内容按照{{question}}要求生成对应题型的试题。你的专业知识和丰富经验使你能够准确地理解和转化用户的需求,生成满足要求的题目和答案。

## 技能

### 技能1: 生成单选题

- 根据用户提供的内容,生成单选题。

- 保证每个单选题至少有四个选项。

- 选项编号按照ABCD排列

- 输出格式:{"type":"固定值:singleChoice","question": "题目描述","options": [{"optionName":"选项编号","optionContent":"选项描述"},{"optionName":"选项编号","optionContent":"选项描述"}],"correctAnswer": "正确选项编号"}

### 技能2: 生成多选题

- 根据用户提供的内容,生成多选题。

- 保证每个多选题至少有四个选项。

- 选项编号按照ABCD排列

- 输出格式:{"type":"固定值:multipleChoice","question": "题目描述","options": [{"optionName":"选项编号","optionContent":"选项描述"},{"optionName":"选项编号","optionContent":"选项描述"}],"correctAnswer": ["正确选项编号1", "正确选项编号2"]}

### 技能3: 生成判断题

- 根据用户提供的内容,生成判断题。

- 输出格式:{"type":"固定值:trueOrFalse","question": "题目描述","correctAnswer": "Y or N"}

### 技能4: 生成简答题

- 根据用户提供的内容,生成简答题。

- 输出格式:{"type":"固定值:shortAnswer","question": "题目描述","correctAnswer": "正确答案"}

## 约束:

- 只生成与用户提供内容相关的题目。

- 必须遵守指定的输出格式,并以JSON数组的格式整合返回结果,且不要包含json前缀。

- 保证每个题目的描述在100字以内。

- 保证每个选项的描述在50字以内。

- 保证每个题目的正确答案在50字以内。


3.4 结果返回

该节点为结果节点,像调用方返回最终的结果,由于本场景仅需最终生成的试题,因此直接输出大模型试题生成节点的结果即可:{{output}}。

3.5 效果

指令请根据CCAR-396-R3民用航空安全信息管理规定中对信息报告的相关要求,生成5道单选题。

知识库召回结果:

wKgaombC73yAQ2dPAAMKz80UEiE055.png



大模型生成结果:

[
    {
        "type": "singleChoice",
        "question": "根据CCAR-396-R3规定,民航局对在民用航空安全信息管理工作中做出突出贡献的单位和个人给予什么?",
        "options": [
            {
                "optionName": "A",
                "optionContent": "罚款"
            },
            {
                "optionName": "B",
                "optionContent": "表彰和奖励"
            },
            {
                "optionName": "C",
                "optionContent": "警告"
            },
            {
                "optionName": "D",
                "optionContent": "培训"
            }
        ],
        "correctAnswer": "B"
    },
    {
        "type": "singleChoice",
        "question": "根据CCAR-396-R3规定,紧急事件发生后,事发相关单位应当在事件发生后多少小时内填报民用航空安全信息报告表?",
        "options": [
            {
                "optionName": "A",
                "optionContent": "6小时"
            },
            {
                "optionName": "B",
                "optionContent": "12小时"
            },
            {
                "optionName": "C",
                "optionContent": "24小时"
            },
            {
                "optionName": "D",
                "optionContent": "48小时"
            }
        ],
        "correctAnswer": "B"
    },
    {
        "type": "singleChoice",
        "question": "根据CCAR-396-R3规定,民用航空安全信息工作实行什么原则?",
        "options": [
            {
                "optionName": "A",
                "optionContent": "统一管理、分级负责"
            },
            {
                "optionName": "B",
                "optionContent": "分散管理、统一负责"
            },
            {
                "optionName": "C",
                "optionContent": "自愿管理、分级负责"
            },
            {
                "optionName": "D",
                "optionContent": "统一管理、统一负责"
            }
        ],
        "correctAnswer": "A"
    },
    {
        "type": "singleChoice",
        "question": "根据CCAR-396-R3规定,局方和企事业单位应当为民用航空安全信息管理人员配备哪些设备?",
        "options": [
            {
                "optionName": "A",
                "optionContent": "便携式计算机、网络通讯设备"
            },
            {
                "optionName": "B",
                "optionContent": "移动存储介质、传真机"
            },
            {
                "optionName": "C",
                "optionContent": "录音笔"
            },
            {
                "optionName": "D",
                "optionContent": "以上都是"
            }
        ],
        "correctAnswer": "D"
    },
    {
        "type": "singleChoice",
        "question": "根据CCAR-396-R3规定,非紧急事件发生后,事发相关单位应当在事发后多少小时内填报民用航空安全信息报告表?",
        "options": [
            {
                "optionName": "A",
                "optionContent": "12小时"
            },
            {
                "optionName": "B",
                "optionContent": "24小时"
            },
            {
                "optionName": "C",
                "optionContent": "48小时"
            },
            {
                "optionName": "D",
                "optionContent": "72小时"
            }
        ],
        "correctAnswer": "C"
    }
]

4、业务系统集成

wKgaombC74GAWYtPAALeNlQlx9A681.png

生成条件采用结构化的方式,方便用户精准的识别到其需要填写的内容,从而促进指令下发的准确度,保证试题生成的质量。对于生成的结果,可一键加入题库,供后续使用。

5、持续升级

5.1 支持大批量试题生成

首次进行场景0-1的建设,因此对单次试题生成的数量进行了限制,避免资源消耗过大。后续会根据使用情况逐步放开,支持100道/次以上的生成规模。

5.2 支持针对于整份文件的生成

基于向量库知识召回的方式进行实现的方式,由于向量库进行知识召回返回的是TOP N,因此势必会存在内容缺失,该种方式更加便于针对文档中的部分内容进行试题生成。后续将通过文件识别的方式,直接解析文件,根据整份文件内容进行生成。

wKgZombC74KAH4vfAALXmJUMuVY511.png

5.3 生成的试题增加重复率限制

在试题生成节点之后,增加重复率识别的判断,若存在重复率不满足条件的试题,则从结果中剔除,并再次进行补充生成。

5.5 现有题库有效性识别

通过系统定时任务的方式,将通过试题题目进行文档知识召回,并将试题及试题相关的知识提交至大模型,由大模型进行有效性判断,若存在失效风险则返回标记及修改建议,在系统题库功能上进行着重表示并消息提醒相关用户,进行复核确认。

五、效能提升

wKgaombC74OADKGHAAC9mKS8eVE075.png

六、简要总结

通过AI大模型帮助用户进行培训试题的生成,在一定程度上将用户从低效、低技术含量、大工作量中解放出来,是面向用户痛点的一次尝试。同时通过该场景将大模型的能力和业务场景及工程系统结合了起来,让用户得到感知,也便于后续更多的大模型实践场景的发掘和落地。

该案例不仅用在航空领域,在其他诸多需要生成试题,生成问卷等相关场景方面都可进行参考和尝试。当前现在试题生成能力也仅是实现在从0到1的落地建设,能力需要不断的打磨和完善,后续会逐步进行1到100,100到∞的升级。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI大模型
    +关注

    关注

    0

    文章

    283

    浏览量

    228
收藏 人收藏

    评论

    相关推荐

    浪潮信息:元脑企智EPAI助力金融大模型快速落地

    将浪潮信息在AI算力底座建设、大模型开发领域积累的成熟、成功经验工具化,助力金融机构又快、又稳地部署生成AI应用,
    的头像 发表于 09-20 16:07 140次阅读
    浪潮信息:元脑企智EPAI<b class='flag-5'>助力</b>金融大<b class='flag-5'>模型</b><b class='flag-5'>快速</b>落地

    Al大模型机器

    理解能力强大: AI模型机器可以理解和生成自然语言,能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感,并据此作出适当的回应。广泛的知识储备: 这些
    发表于 07-05 08:52

    利用AI和加速计算提升天气预报效率和能

    在 NVIDIA GPU 驱动的扩散模型助力下,生成AI 在各个领域实现新的应用,大大提升了效率。   当台湾气象员得以在一台机器
    的头像 发表于 06-07 15:06 422次阅读

    阿里云通义大模型助力“小爱同学”强化多模态AI生成能力

    小米的人工智能助手“小爱同学”近期与阿里云通义大模型达成战略合作,共同提升其多模态AI生成能力,特别是在图片生成与理解方面。这次合作不仅将强
    的头像 发表于 05-13 09:19 605次阅读

    生成AI手机出货量或将飞速增长,市场份额提升显著

    同时,反转点还预期,至2027年,生成AI智慧型手机的市场保有量将超过10亿部。按照其定义,生成AI智慧型手机是采用大型、预训练
    的头像 发表于 04-16 16:55 534次阅读

    生成AI 进入模型驱动时代

    随着ChatGPT和大型语言模型(LLM)呈现爆炸式增长,生成式人工智能(GenerativeAI)成为近来的一大热词。由此引发了一场争论:哪种AI模型使用的训练参数最多?与此同时,更
    的头像 发表于 04-13 08:12 395次阅读
    <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 进入<b class='flag-5'>模型</b>驱动时代

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10

    的潞晨科技Colossal-AI系统,用户可实现在本地算力平台一键训练、微调、推理、部署大模型,将大模型开发效率提升10
    的头像 发表于 03-01 09:43 387次阅读
    潞晨科技Colossal-<b class='flag-5'>AI</b> + 浪潮信息AIStation,大<b class='flag-5'>模型</b>开发效率<b class='flag-5'>提升</b><b class='flag-5'>10</b><b class='flag-5'>倍</b>

    亚马逊云科技助力沐瞳应用生成AI技术打造卓越游戏体验 赋能业务决策

    业务决策。沐瞳旗下游戏产品《Mobile Legends: Bang Bang》(以下简称《MLBB》)基于亚马逊云科技和其合作伙伴在生成AI领域的创新技术与解决方案,显著提升辱骂识
    发表于 02-22 11:20 191次阅读
    亚马逊云科技<b class='flag-5'>助力</b>沐瞳应用<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>技术打造卓越游戏体验 赋能<b class='flag-5'>业务</b>决策

    亚马逊云科技助力沐瞳应用生成AI技术打造卓越游戏体验 赋能业务决策

    北京2024年2月21日 /美通社/ -- 亚马逊云科技宣布,上海沐瞳科技有限公司(以下简称"沐瞳")应用亚马逊云科技Amazon Bedrock等生成AI服务,为玩家打造卓越的游戏体验并赋能业务
    的头像 发表于 02-22 09:25 358次阅读

    OpenAI发布文生视频模型Sora,引领AI视频生成新纪元

    在人工智能(AI)领域掀起新一轮革命浪潮的,正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型,以其“逼真”和“富有想象力”的视频生成能力,彻底颠覆了传统视
    的头像 发表于 02-19 11:03 798次阅读

    利用 NVIDIA Jetson 实现生成AI

    交互速率运行的 Llama-2-70B 模型。 图 1. 领先的生成AI 模型在  Jetson AGX Orin 上的推理性能 如要在 Jetson 上
    的头像 发表于 11-07 21:25 784次阅读
    利用 NVIDIA Jetson 实现<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    亚马逊云科技生成AI最新案例分析,助力企业业务创新迭代

    的案例。 开启生成AI的探索之旅 生成AI热门方案 AI设计解决方案:Canva可画企业服务提供一站式设计解决方案;帮助团队
    的头像 发表于 10-24 17:06 540次阅读
    亚马逊云科技<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>最新案例分析,<b class='flag-5'>助力</b>企业<b class='flag-5'>业务</b>创新迭代

    10+工具,提升开发者生产力

    Azure 有哪些工具和资源有助于提高开发者生产力?本篇文章 一次性放送 10+ 开发者工具 ,助您将安全性纳入开发工作流程、了解如何简化测试、提升编码速度,以及学习与 AI 协作的新技巧。 面向
    的头像 发表于 10-24 10:40 303次阅读

    【重磅】首批 IBM watsonx 专有 “花岗岩”Granite 模型全球开始上市,化解企业采用生成AI 的“数据焦虑”

    模型系列的首批模型,该模型集合包含了一系列生成AI 模型,旨在促进将
    的头像 发表于 10-20 01:15 521次阅读
    【重磅】首批 IBM watsonx 专有 “花岗岩”Granite <b class='flag-5'>模型</b>全球开始上市,化解企业采用<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的“数据焦虑”

    从基础模型、应用到工具链,云计算助力初创快速抢滩生成AI新风口

    北京 ——2023 年 10 月 12 日 ——麦肯锡发布的《生成式人工智能的经济潜力》报告指出,“生成AI可以被用到16个业务部门的63
    发表于 10-12 14:03 132次阅读