电子发烧友网报道(文/李弯弯)7月7日,华为云盘古大模型3.0正式发布。华为云CEO张平安介绍,盘古大模型3.0是完全面向行业的大模型,包含L0基础大模型、L1行业大模型及L2场景模型三层架构,重点面向政务、金融、制造、医药、矿山、铁路、气象等行业。
不仅仅是华为的盘古大模型3.0,近段时间,大量面向行业的垂直类大模型陆续发布。今年二三月,大模型主要还是在概念阶段,而经过几个月的发展,如今探索大模型落地应用成为了主旋律。业界普遍认为,针对具体行业的垂直类大模型,更能够快速实现应用落地。
面向垂直领域的大模型陆续发布
360集团周鸿祎前不久在接受媒体采访的时候表示,在这场工业革命中,关键的就是要掌握大模型的核心技术和应用场景。
他认为,大模型要真正能够变成生产力工具,能为我们所用,还是要走垂直化的路。做一个通用的GPT4.0对大模型的能力要求是最高的,一旦用到垂直领域、行业领域、企业领域,其实对大模型的能力要求反而是降低了。所以,在这种情况下,大模型这个市场就很大。
360针对不同的场景提供不同的大模型服务,除了原本的ToC场景,浏览器、桌面和搜索等之外,360也与创业黑马等企业合作,提供一个大模型基础,企业进行行业数据训练。将大模型提供给政府和企业,不过目前还在探索阶段。
拓尔思也以行业大模型作为产业落地的先行突破,推出了拓天媒体大模型,具有内容生产智能助手、新一代搜索与推荐、多模态传播与服务三大行业应用;拓天金融大模型,已在投研服务、信贷风控、审查审批、客户服务等场景助力用户实现智能化转型;拓天政务大模型,在公文辅助写作、政务咨询、政策服务、接诉即办、智能工作助手等场景提高用户办公效率,提升政务服务质量。拓尔思表示,下半年还将陆续推出更多的行业大模型。
在近日正在举办的2023世界人工智能大会,也有不少企业推出垂直领域大模型,比如,蜜度发布了自主研发的3个行业领域AI大模型,应用于出版、媒体、政务、教育等行业。
包括用于辅助写作、新闻稿件辅助生成的蜜巢知识问答与内容生成大语言模型;国内首个智能校对领域大语言模型“蜜度文修”;蜜巢智能舆情分析大语言模型,以及旗下生成式 AI(AIGC)应用产品“蜜小豆”、“文稿通”等。
蜜度是一家语言智能科技企业,专注于多模态多语言智能科技,利用跨模态检索(CMR)、多语言校对(MLC)、计算机视觉(CV)、自然语言处理(NLP)、知识图谱(KG)等技术,为政府和企业各类办公场景提供智能应用软件产品,以及智能应用解决方案。
达观数据在2023世界人工智能大会上也正式发布了名为“曹植”的大模型。“曹植”大模型是一款垂直专用的大语言模型,具有长文本、垂直化和多语言的特点。“曹植”大模型还将实现多模态内容生成,例如长文档中的表格、图表、图片等;支持中文、英文、法语、德语、日语、韩语等数十种语言的写作,辅助人工大幅提高办公效率。
早前,彭博社就针对金融领域推出了大型语言模型(LLM)——BloombergGPT。这是一个500亿参数的语言模型,支持金融行业的各种任务。
该团队表示,通用的模型涵盖了许多领域,能够在各种各样的任务中高水平地执行,并且在训练期间不进行专门的专业化训练。然而,现有特定领域模型的结果表明,通用模型无法覆盖它们。因此,他们着手建立一个模型,该模型能够在财务维度上实现最佳的效果,同时在通用LLM基准上保有有竞争力的性能。
在医疗领域,谷歌的团队此前也推出过相应的大模型产品Med-PaLM 2,谷歌发布的大型语言模型(LLMs)PaLM 2,是一款对标OpenAI最新大模型GPT-4的竞品,具有强大的多语言和推理能力。Med-PaLM 2是由谷歌DeepMind的医疗健康团队在PaLM 2的基础上微调得到。据介绍,可以直接给Med-PaLM 2输入一幅X光片,它会自动根据输入信息来对患者的病情进行分析和诊断。
大语言模型落地应用的机会和挑战
在最近举办的2023世界人工智能大会上,大模型面临的挑战、产业化路径以及发展机会等是众多企业探讨的重点话题。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在某论坛上就谈到,目前大模型产业化面临几大挑战:1、模型体积大,训练难度高;2、算力规模大,性能要求高;3、数据规模大,质量参差不齐。
他认为,大模型产业化的路径,可以类比芯片产业,由芯片设计公司设计完芯片之后,交给晶圆代工企业生产,最后给到需求方使用。大模型产业化的路径可以是:在大算力、大数据企业的支撑下,模型开发企业开发出大模型,使用方在此基础上根据自身应用场景进行精调等,最终实现高效支撑千行百业应用。
大模型发展过程中还有一个是合规、安全的问题。复旦大学计算机科学技术学院副院长杨珉谈到,国内在新技术的应用上,发展的速度非常快,然而很多新技术在安全方面却还没有完善。业界在大模型的发展上,对数据、算力等重视程度很高,而对安全的重视程度可能并没有同步的去开展。杨珉表示,我们一直在做大模型合规、安全的研究,也发现一些问题,希望业界在推进新技术应用的同时,也能够去提升国产大模型的安全。
大模型在金融、医疗等行业具有很大的应用价值,然而同时它也面临挑战。上海好买财富管理有限公司CIO付晓敏谈到,金融领域本身对数字化程度要求比较高,对新技术的出现和应用也较为敏感。如今在金融领域已经有相关的大模型出现,比如上文提到的BloombergGPT。当下,不少金融行业人士都在探讨大模型如何在金融领域落地。
在付晓敏看来,金融领域对合规、安全的要求比较高,这是当前大模型在金融领域落地面临的比较大的挑战。
至于国产大模型如何能够弯道超车呢?付晓敏也提到,主要还是在垂直领域,当前无论是在算力,还是算法上,都可能受到国际上一些限制,在此处寻求超越其实多多少少存在一些困难,而国产大模型可以基于我们本身市场的优势,在垂直领域找到机会。
上海微创卜算子医疗科技有限公司石思远表示,大模型在医疗领域存在很大的发展价值,比如在日志管理、文档书写方面,这些工作需要消费医生大量的时间,而如果通过大模型形成相应的AI助手,就可以很好的帮助医生解决这个问题,比如谷歌此前推出的医学大模型Med-PaLM 2,就表现出了很高的交互水平。
不过目前大模型在医疗领域存在的问题是,医疗领域很多细分场景中,比如怎么做诊断、怎么治疗等都是一些很严肃的场景,而大模型在这些方面还难以满足需求。业界也正在探索,比如,怎样把知识图谱融入到医疗领域的中,避免大模型一本正经的胡说八道等。
小结
如今探索大模型如何落地应用是关键,业界都认为,面向某个行业的垂直大模型更能够实现落地应用。近段时间,已经有大批针对媒体、政务、金融、医疗的大模型出现,并逐步取得应用。然而在大模型的应用过程中仍然存在挑战,比如安全问题。对此,业界还需要不断去探索解决之道,让大模型在更多细分场景中的应用变得安全、可靠。
-
大模型
+关注
关注
2文章
2354浏览量
2539
发布评论请先 登录
相关推荐
评论