0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

度小满轩辕:金融行业的大模型实战派

脑极体 来源:脑极体 作者:脑极体 2024-03-12 09:12 次阅读

金融行业被广泛认为是AI大模型技术落地的前哨站,也是“人工智能+”行动的焦点所在。面向金融场景广泛、多样化的大模型需求,度小满轩辕系列全新发布了12款金融大模型。其中包括6B、13B、70B参数的基座模型、对话模型、int4/int8量化模型,并且实现了完全开源,供广大开发者下载使用。

总体来看,12款金融大模型包括3种参数。2023年5月,度小满开源了国内首个千亿级中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。本次度小满“轩辕”模型矩阵再次升级,十亿-百亿-千亿参数全覆盖,实现多场景任务适配。

而从效果上看,度小满轩辕达成了18大维度金融实战能力遥遥领先,多场景6B模型与72B模型表现相当;通用能力同样达到开源模型TOP水平看齐GPT-4,并且采用了独创的数据处理流水线,生产更丰富、更安全、更符合中文场景的数据。通过首次将人类偏好对齐引入金融垂域大模型训练,相关模型实现了安全性显著提升、有用性突破瓶颈、金融任务表现明显增强 。

让我们来走进度小满轩辕,透视金融领域的大模型变革。

度小满「轩辕」大模型:全参数矩阵

wKgZomXvBWmAIjL5AAC0QbbZoC4267.jpg

(度小满轩辕大模型发布时间轴)

度小满轩辕系列已经有17款开源大模型,适配广泛场景任务,满足不同开发者需要。

wKgaomXvBWqAODvoAADv-8gMgUg452.jpg

(度小满轩辕大模型矩阵)

模型矩阵的设计考虑了不同的应用场景和性能要求:70B及以上的模型专门针对需要深度分析、复杂指令执行以及全方位Agent调用的场景,而6B、13B的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用,它们也同样能够处理计算、编程、创作等一系列通用需求。特别地,最小化的XuanYuan-6B-4-bit量化Chat模型以其低推理部署成本,进一步降低了大模型的应用门槛。

模型效果:18大维度金融实战能力遥遥领先

01金融能力

将轩辕系列大模型在金融自动评测集FinanceIQ测试集上进行测试,FinanceIQ涵盖了注册会计师(CPA)、税务师、经济师、银行从业资格、基金从业资格、证券从业资格、期货从业资格、保险从业资格(CICE)、理财规划师等十大权威金融领域考试。结果如下表,XuanYuan-70B-V2在该项评测任务上拥有超过GPT-4的水平,在知识层面展示出金融领域专家的水平。

同时,为了考察轩辕大模型在金融实际任务上的能力,轩辕团队还特别组织了金融专家为对话大模型进行人工评测。任务的设计均是从金融行业实际应用场景出发,去判断轩辕是否在各项金融任务上具备“实战能力”。

wKgZomXvBWuAJ-jYAADz_UHwVVU390.jpg

(人工金融评测集任务构成)

最终结果显示,轩辕大模型各个参数上均具有“以小搏大”的实力,达到自己2倍甚至5倍参数量的模型水平。在各项金融评测任务上,XuanYuan-6B表现超越市面最新13B中文开源模型(左图),XuanYuan-13B表现超越市面最新72B中文开源模型(中图),XuanYuan-72B-V2表现可以媲美GPT4(右图),并且在金融法规、金融产品信息等中文场景上超越。

wKgaomXvBWuATqMFAAFiRP5fBts125.jpg

(轩辕拥有远超同参数水平的金融能力)

02通用能力

将轩辕大模型在MMLU、CEVAL、CMMLU、GSM8K、HumanEval等中外主流评测集上进行评测,观察大模型在知识、逻辑、代码等通用能力上的表现。同时加入类似参数矩阵的LLaMA2系列进行比较,结果显示轩辕不同参数大模型在各项榜单成绩上均有优异表现,在CMMLU、C-Eval等多个中文评测榜单上,更是有超越GPT-4的水准

进一步分析发现,经过专门优化以增强考试能力的XuanYuan-6B和XuanYuan-13B模型,在C-Eval和CMMLU这两个中文考试评测指标上有了显著提升。然而,需要注意的是,“高分”并不意味着“高能力”。评测集成绩可通过优化模型考试能力来提升,不直接等同于模型在实际应用中的优势。因此,尽管小参数模型在某些评测中表现出色,这并不意味着它们的各方面真实能力均超越了同系列大参数模型。

wKgZomXvBW6AQMu9AADp6ysui6k450.jpg

(轩辕大模型在各个评测集上的分数)

「轩辕」技术解析:对齐技术突破能力瓶颈,面向公众开放自动化训练框架

度小满轩辕大模型团队在过去一年,对大模型训练的各个环节积累了丰富的经验。这包括建立了一套完整的数据处理流水线、采用更适配领域模型的高效训练方法等,以及本次突破性的利用人类偏好对齐技术,极大地提升了6B、13B、70B模型的对话能力,显著增强了模型的场景适应性。

轩辕系列大模型使用DeepSpeed分布式训练框架,引入动态评估与调整机制以优化训练过程。在微调阶段,轩辕特别的采用了Self-QA策略来收集指令微调数据。该方法能够在没有人工标注的情况下生成大量高质量的问答数据,为模型提供有监督的训练样本,有效提升模型的学习效率和质量。

wKgaomXvBW6ADi9lAABpQJ7EIVY781.jpg

(轩辕大模型Self-QA数据构造方法)

针对金融领域的特定需求,轩辕大模型还开发了一种混合微调训练框架,旨在通过融合通用与特定领域数据来增强模型性能及适应性。这种混合微调方法不仅显著提高了模型在特定任务的表现,也增强了其整体的泛化能力和适应性,为金融领域任务的性能提升开辟了新途径。

度小满创新地在金融领域大模型中引入了人类偏好对齐技术,开创了领域内强化对齐训练的先河。通常,领域大模型仅在微调阶段引入特定领域数据,但这种方法在实际应用中常常显示出局限性。金融行业的复杂性要求模型能够更深入地理解并适应行业特定的需求,而强化对齐训练有助于突破仅依靠微调所能达到的性能瓶颈。

轩辕团队精心构建了涵盖通用性、安全性和金融特性的Prompt数据集,并组织了专业的标注团队对成对的回答进行偏好标注。接下来,团队通过一系列实践、分析和改进,成功完成了奖励模型(Reward Model)和后续的强化(采用近端策略优化算法)训练。下图以XuanYuan-6B为例展示了模型在通用性和金融能力的综合评估结果。从图中可以看出,在两个领域,经过人类偏好对齐后,模型的能力都有了极大的提升,证明了强化对齐训练的有效性。

wKgZomXvBW6AAQTOAAA-vMIkB-Q331.jpg

(RLHF-model vs SFT-model)

wKgaomXvBW-AOn0hAACKEVPWOMg177.jpg

(通用能力:RLHF-model vs SFT-model)

wKgZomXvBW-AXXK9AAB9jXqdbfc509.jpg

(金融能力:RLHF-model vs SFT-model)

度小满轩辕大模型团队一向贯彻开源开放的原则。为了让广大开发者能够更容易的上手使用大模型,使用真实数据和真实代码作为示例,详细介绍了训练模型的每个关键步骤。现在相关代码已经上传开源社区,供广大用户实操体验。

金融行业需要怎样的大模型?

金融领域对大模型的要求远超过基本的“判断”与“生成”能力,更加强调在“分析”与“决策”过程中的高级能力,这些能力是触及金融企业核心利益的关键。大模型的价值体现在其能否在核心业务场景中发挥实际作用,如通过综合分析用户信息以支持风险评估、客户画像绘制、精准营销策略,或通过企业数据分析支持财务审查、智能投顾和行业研究。

金融大模型的最终目标是提高企业ROI。这意味着,高效的金融大模型应当能够在实际应用中,如客服场景,通过提升对话处理、指令遵循和意图理解能力,不仅短期内提高客服效率,长期还可能实现机器人客服的全面替代,重塑客户服务流程,推动金融服务向更高智能化水平迈进。

结束语:关于度小满「轩辕」大模型

度小满轩辕大模型系列具有以下特色:

· 多尺寸开源,开发者友好。

· 拥抱开源,免费下载使用。

· 版本快速迭代,社区持续更新。

· 持续面向金融行业伙伴交流共建。

在今年的政府工作报告中,提出了“大力发展科技金融、绿色金融、普惠金融、养老金融、数字金融”。在这样的宏观背景下,AI大模型落地金融场景,为行业带来全新的智能化发展机遇,是金融行业本身的发展意愿,也是“新质生产力”的客观要求。

作为“实战派”的度小满轩辕,已经应用在金融领域的各个业务场景,并且初见成效。未来,度小满轩辕会成为金融行业的一个支点,为更多智能化探索打开大门。

欲知“轩辕”大模型详情,可移步Github官网。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30095

    浏览量

    268357
  • 人工智能
    +关注

    关注

    1791

    文章

    46838

    浏览量

    237493
  • 大模型
    +关注

    关注

    2

    文章

    2320

    浏览量

    2461
  • AI大模型
    +关注

    关注

    0

    文章

    307

    浏览量

    288
收藏 人收藏

    评论

    相关推荐

    轩辕智驾荣获硬科技创新先锋企业奖

    近日,由高工智能汽车主办的2024年智能汽车产业链【硬科技】趋势峰会在江苏太仓隆重举行。轩辕智驾荣获“硬科技·创新先锋企业”奖。
    的头像 发表于 11-22 17:25 180次阅读

    国产工控机驱动金融行业发光发大,赋能金融领域的稳定与创新

    近年来,随着物联网、人工智能等新技术的不断发展,金融行业迎来了新的发展机遇。在金融领域,工控机是一种特殊的计算机设备,主要应用于各种行业,包括金融
    的头像 发表于 11-17 16:58 110次阅读

    小满,让“推理大模型”走向金融核心业务

    当慢思考的新风,吹入金融智能化的海洋
    的头像 发表于 10-31 09:06 1899次阅读
    <b class='flag-5'>度</b><b class='flag-5'>小满</b>,让“推理大<b class='flag-5'>模型</b>”走向<b class='flag-5'>金融</b>核心业务

    小满”V24.10源代码在AtomGit开源

    近日,由中国汽车工业协会指导,普华基础软件股份有限公司主办的“小满”安全车控操作系统开源发布会暨共建计划说明会成功举行。普华基础软件宣布将安全车控操作系统“小满”(简称“小满”)V24.10源代码
    的头像 发表于 10-27 14:41 299次阅读

    探讨IP查询技术在金融行业的深度应用

    随着互联网技术的飞速发展,金融行业对信息技术的依赖程度日益加深。其中,IP查询技术作为网络安全与风控的重要工具,在金融行业中的应用日益广泛且深入。本文将从多个角度探讨IP查询技术在
    的头像 发表于 09-07 10:08 225次阅读

    华为如何助力金融模型开出价值之花

    2024,我们正见证金融模型走向成熟
    的头像 发表于 07-09 13:59 2544次阅读

    捷科亮相2024阿里云金融创新峰会,推动金融科技领域数智转型

    5月24日,2024阿里云金融创新峰会在杭州隆重举行。本届大会以“创智变,新原力”为主题,聚焦金融行业与“云+大模型”技术的融合创新
    的头像 发表于 05-30 11:18 497次阅读
    捷科亮相2024阿里云<b class='flag-5'>金融</b>创新峰会,推动<b class='flag-5'>金融</b>科技领域数智转型

    智能云推出“千帆行业增强版”

    在近日于北京举办的2024智能经济论坛上,百集团执行副总裁、百智能云事业群总裁沈抖分享了百在人工智能领域的最新进展。他宣布,为了推动行业模型
    的头像 发表于 05-30 09:30 543次阅读

    商汤科技与海通证券携手发布金融行业首个多模态全栈式大模型

    商汤科技与海通证券联合研发并发布了金融行业内首个面向多业务场景的多模态全栈式大模型。双方计划将这一先进技术应用于智能问答、合规风控、代码辅助以及办公助手等关键业务领域,以实现大模型技术
    的头像 发表于 05-06 10:16 428次阅读

    商汤科技联合海通证券发布业内首个面向金融行业的多模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的多模态全栈式大模型
    的头像 发表于 04-26 09:48 424次阅读
    商汤科技联合海通证券发布业内首个面向<b class='flag-5'>金融</b><b class='flag-5'>行业</b>的多模态全栈式大<b class='flag-5'>模型</b>

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型 小编给大家汇总一下近期的AI资讯。 华为助力金融行业加速拥抱AI
    发表于 04-15 12:32 396次阅读

    华为发布金融AICC智能云联络中心解决方案2.0,赋能全球金融行业

    陈君和数字金融军团解决方案资深经理吕晨分享了金融行业数字化未来趋势的见解:过去一年中基于大模型的AI飞速发展,各金融机构积极拥抱AI,在客服
    的头像 发表于 03-06 14:33 504次阅读
    华为发布<b class='flag-5'>金融</b>AICC智能云联络中心解决方案2.0,赋能全球<b class='flag-5'>金融</b><b class='flag-5'>行业</b>

    华为云盘古大模型通过金融模型标准符合性验证

    近日,在中国信通院组织的可信AI大模型标准符合性验证中,华为云的盘古大模型表现出色,成功通过了金融模型标准的符合性验证,并荣获优秀级(4+级)评分。此评级不仅是本次
    的头像 发表于 03-05 10:12 593次阅读

    华为云盘古大模型通过金融模型标杆验证,获最高评级

    该验证标准主要关注金融模型对语言,语音,视觉以及多模态任务等多元领域的适应能力,涵盖数据合规性,模型安全性和服务稳定性等关键要素。
    的头像 发表于 03-04 15:58 618次阅读

    【飞腾4G版免费试用】第四章:部署模型到飞腾的尝试

    本章记录这几天尝试将训练的佩奇检测模型部署到飞腾的阶段总结。
    的头像 发表于 12-20 20:54 2405次阅读
    【飞腾<b class='flag-5'>派</b>4G版免费试用】第四章:部署<b class='flag-5'>模型</b>到飞腾<b class='flag-5'>派</b>的尝试