开源大模型在多个业务场景的应用案例-电子发烧友网

在人工智能发展浪潮中，大模型的开源与闭源之争一直是业内的热点话题。随着技术的不断进步和应用场景的日益丰富，如何降低大模型的使用门槛，让更多人能够便捷地应用于实际业务场景，成为了推动行业发展的关键所在。而开源大模型，无疑是这一进程中具有里程碑意义的重要一步。

近日，2024开放原子开发者大会暨首届开源技术学术大会——开源大模型落地实践分论坛上，武汉人工智能研究院院长、中国科学院自动化研究所副总工程师王金桥，武汉大学教授叶茫，腾讯机器学习平台专家、混元大模型预训练负责人孙兴武，北京智源人工智能研究院数据研究组负责人刘广，小米AI技术专家张俊博，阿里云智能集团技术专家马腾，中国科学院自动化研究所副研究员、武汉人工智能研究院算法架构师易东，Monkey大模型一作、华中科技大学硕士生杨彪等多位深耕开源大模型的技术专家，深入探讨了开源大模型的前沿技术进展、应用创新及行业落地实践。本论坛由开放原子开源基金会、中国通信学会主办，CSDN、武汉人工智能研究院协办。

王金桥在致辞中强调了开源对大模型生态发展的推动作用，以及它在降低技术门槛、促进技术创新方面的价值。他提到，尽管开源大型模型已取得显著成就，但还需面对数据质量、隐私保护、模型解释性以及安全可靠性等挑战。他期望通过不懈努力，进一步促进开源社区的繁荣发展，推动技术共享的进程。

在主题内容分享环节，叶茫分享了团队在多模态大模型微调、持续学习和轻量化等方面的研究，特别是跨模态目标检索系统的开发，以及无人机场景下的工业检索和夜间场景下可见光与红外图像的跨模态匹配等工作。

孙兴武介绍了腾讯混元大模型在技术和应用上的最新成果，包括自研星脉高性能计算网络及其Angel训练框架，以及广告推荐、代码生成、AI客服等多个业务场景的应用案例。

刘广聚焦于高质量数据集的构建及其对模型性能的重要性，介绍了BGE向量模型及Aquila语言模型，并强调了中文互联网最大规模的数据集CCL3.0的价值。他指出，通过定义高质量数据的标准并结合小模型验证效果的方法，可以有效提高模型的表现力。

张俊博介绍了XIAOMI DASHENG声音预训练模型。该模型具有优秀的场景区分能力和环境音识别能力，只需简单几行代码就能达到SOTA级别的性能，不仅适用于音频表征任务，还可以作为多模态大模型的一部分，提供稳定的音频编码服务。

马腾分享的Mooncake项目，是一个用于优化大模型推理服务的开源项目。采用P/D分离架构和KVCache缓存池提升吞吐量，减少算力开销，支持多种通讯协议和存储方式，适配多种推理框架，增强了分布式部署能力。

易东讲解了“紫东太初”多模态大模型的研发历程和发展方向，展示了在医疗、教育、政务等多个领域的应用实例，并公布了FAST SAM、FLAP等多个开源项目，这些项目进一步丰富了多模态大模型的应用生态。

最后，杨彪介绍了Monkey多模态大模型及其在文档智能中的应用，通过切块处理提高图片分辨率和更详细的标注数据进行微调，提出了TEXTMonkey，针对文档领域进行优化，实现了更高的精度和更好的可解释性。

如今，各行各业都已进入智能化升级关键阶段，开源大模型的创新已无处不在。通过服装模特AI生成技术，企业可以降低拍摄海报的人力成本；通过跨领域合作，实现了文本指令区域编辑和动图生成，为智能电视提供了更丰富的用户体验；通过多模态情感语义理解基础模型，不仅有助于提升情感意图识别的准确性，还为精神疾病诊断提供了新的思路，类似的案例不胜枚举。

总体而言，在开源生态中，大模型在众多应用场景中均展现出良好的性能表现。众多企业不仅在大模型的微调、持续学习和轻量化等领域进行了深入研究，而且正积极推动这些技术在具体业务场景中的广泛应用和落地实施。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47334

浏览量
238678
开源

开源

+关注

关注
3

文章
3360

浏览量
42524
大模型

大模型

+关注

关注
2

文章
2473

浏览量
2770

原文标题：从理论到实践，开源大模型在多领域的应用探索

文章出处：【微信号：开放原子，微信公众号：开放原子】欢迎添加关注！文章转载请注明出处。

腾讯混元大模型开源成绩斐然，GitHub Star数近1.4万

内外部技术的开源共享，旨在促进技术创新与生态发展。据悉，腾讯混元大模型已经在多个模态上实现了开源，包括语言大

发表于 12-26 10:30 •207次阅读

【「大模型启示录」阅读体验】如何在客服领域应用大模型

在客服领域是大模型落地场景中最多的，也是最容易实现的。本身客服领域的特点就是问答形式，大模型接入难度低。今天跟随《大模型启示录》这本书，学

发表于 12-17 16:53

开源AI模型库是干嘛的

开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练，能够执行特定的任务。以下，是对

发表于 12-14 10:33 •196次阅读

阿里云开源Qwen2.5-Coder代码模型系列

Qwen2.5-Coder-32B-Instruct，在代码生成领域取得了显著成就。据官方介绍，该模型在EvalPlus等十多个主流的代码生成基准测试中，均刷新了

发表于 11-14 11:28 •363次阅读

科技云报到：假开源真噱头？开源大模型和你想的不一样！

查看、修改、分发。开源自此深刻影响了互联网行业的每一个角落。在大模型和GenAI崛起的当下，开源再次成为业界关注焦点，对于开源和闭源的争论

发表于 11-03 10:46 •234次阅读

Llama 3 与开源AI模型的关系

在人工智能（AI）的快速发展中，开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新，还促进了全球开发者社区的合作。Llama 3，作为一个新兴的AI项目，与开源AI

发表于 10-27 14:42 •379次阅读

RISC-V在中国的发展机遇有哪些场景？

RISC-V在中国的发展机遇广泛存在于多个场景，这主要得益于其开源、开放、简洁、灵活等特性，以及中国作为全球最大的数据大国和信息技术市场的重要地位。以下是一些RISC-V

发表于 07-29 17:14

深度学习模型有哪些应用场景

深度学习模型作为人工智能领域的重要分支，已经在多个应用场景中展现出其巨大的潜力和价值。这些应用不仅改变了我们的日常生活，还推动了科技进步和产业升级。以下将详细探讨深度学习

发表于 07-16 18:25 •1992次阅读

英伟达开源Nemotron-4 340B系列模型，助力大型语言模型训练

近日，英伟达宣布开源了一款名为Nemotron-4 340B的大型模型，这一壮举为开发者们打开了通往高性能大型语言模型（LLM）训练的新天地。该系列模型不仅包含高达3400亿参数，而且

发表于 06-17 14:53 •570次阅读

通义千问开源千亿级参数模型

通义千问近日开源了其首个千亿级参数模型Qwen1.5-110B，这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B模型继承了

发表于 05-08 11:01 •758次阅读

【大语言模型：原理与工程实践】大语言模型的评测

计算和代码纠错等。这些场景覆盖日常生活和学习的多个方面，使得对话能力评测变得尤为复杂和关键。为了全面评估大语言模型在各种应用场景下的对话能力

发表于 05-07 17:12

通义千问推出1100亿参数开源模型

通义千问近日震撼发布1100亿参数的开源模型Qwen1.5-110B，这一举措标志着通义千问在AI领域迈出了重大步伐。该模型成为通义千问全系列首个千亿级参数

发表于 05-06 10:49 •589次阅读

李彦宏：开源模型将逐渐滞后，文心大模型提升训练与推理效率

李彦宏解释道，百度自研的基础模型——文心 4.0，能够根据需求塑造出适应各类场景的微型版模型，并支持精细调整以及后预训练。相较于直接使用开源模型

发表于 04-16 14:37 •447次阅读

IBM在watsonx上提供开源的Mistral AI模型

IBM 提供 Mixtral-8x7B 的优化版本，该版本可将延迟时间最多缩短 75% IBM、第三方和开源模型的目录不断增加，为客户提供更多选择和灵活性是 watsonx 人工智能与数据平台

发表于 03-12 19:10 •1339次阅读

机器人基于开源的多模态语言视觉大模型

ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型，只用单机就可以训练。

发表于 01-19 11:43 •424次阅读

搜索历史

开源大模型在多个业务场景的应用案例

评论