0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百川智能发布Baichuan2 Turbo系列API,或将替代行业大模型

甲子光年 来源:甲子光年 2023-12-20 16:54 次阅读

定义一种全新的“定制化”模式。

百川智能依然保持着一如既往的快节奏。

12月19日,百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超长上下文窗口的基础上,还增加了搜索增强知识库的能力。

即日起,API用户可上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。

2个多月前的9月25日,百川智能便发布了Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。作为首批通过备案的大模型企业之一,百川智能此次还开放了Baichuan2-53B API接口,正式进军to B领域,开启商业化进程。

在当天的媒体沟通会上,百川智能创始人、CEO王小川,百川智能联合创始人、联席总裁洪涛,百川智能技术联创陈炜鹏及百川智能商用业务部总经理李剑共同出席,为「甲子光年」等媒体解答了百川智能在to B模式中最新的技术与商业思考。

1.行业模型之外,大模型to B的第二条路

在过去一年对大模型商业化的讨论中,行业大模型一直被认为是大模型在B端商业落地的主要路径。

而百川智能此次走出了一条不同的路。

百川智能认为,企业自有数据/知识库是企业的核心竞争力。大模型如果不能与企业自有数据/知识库进行结合,对企业而言是没有价值的。

如何将大模型与企业自有数据/知识库更好地相结合呢?

一个已经为人熟知的方法是,打造行业大模型。然而,基于特定数据预训练或微调垂直行业大模型需要高密度的技术人才团队、大量的算力支持,并且每更新一次数据都要重新训练或微调模型。

这种方式不仅成本高昂、灵活性差,更关键的是不能保证训练的可靠性和应用的稳定性,多次训练后仍会出现问题。

此外,大部分企业数据,都是结构化的数据,也不适合SFT(Supervised fine-tuning,有监督微调),模型无法准确记忆结构化信息,就会带来幻觉。

针对这些痛点,行业摸索了一套基本操作,即“向量数据库+长上下文窗口”。而百川智能在此基础上进一步完善了大模型技术栈,拓展至四个维度:

向量数据库,百川智能在向量检索c-mteb位列第一

长窗口Baichuan2-192K,一次可输入35万字

实现稀疏检索(索引库)与向量搜索并行,模型的可用率从80%提升至95%

搜索系统和大模型对齐

具体来看,百川智能将向量数据库升级为搜索增强知识库,提升了大模型获取外部知识的能力;把搜索增强知识库和超长上下文窗口结合,让模型可以连接全部企业知识库以及全网信息,能够替代绝大部分的企业个性化微调,解决99%企业知识库的定制化需求。 这套技术栈背后,也反映了百川智能对于大模型更深层次的思考。 在百川智能的技术思考中,大模型+搜索增强是大模型时代的新计算机——

大模型类似于计算机的CPU,通过预训练将知识内化在模型内部,然后根据用户的Prompt生成结果;

上下文窗口可以看做计算机的内存,存储了当下正在处理的文本;

互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘。

那么,百川智能如何将这套技术栈真正落地在商业场景呢?

2.用“产品化”取代“项目化”

事实上,无论王小川还是他所召集的搜狗“旧部”,过往的工作经验更多集中在to C领域。此次带领百川智能进军to B,无疑会面临诸多挑战。

洪涛告诉「甲子光年」:“企业真正要用好大模型的起点,是把企业知识和大模型结合,而这也是最大的困难。”

王小川认为,to B要面对的最大需求是定制化,光靠调用API可能不够。

“我们今天用搜索增强最大的意愿不是解决幻觉问题,而是解决大模型可定制化的问题。如何让企业的私有数据为模型所用,让模型为企业服务,是大模型to B商业化过程中要解决的关键问题。”王小川表示。

在上一波以计算机视觉为核心的AI浪潮中,AI公司变成了集成商,需要下场做很重交付的定制化项目,往往利润很低,甚至越做越亏。如何避免在定制化项目中“越做越亏”的故事在大模型的商业化路上重演,是所有大模型创业公司今天要面对的一大难题。

在王小川的判断中,定制化是客户天生的需求,to B企业真正要避免的是“项目化”。

所以,基于上述技术栈,百川智能定义了一种全新的“定制化”方式——用“产品化”取代“项目化”。

“整体来看,一些能盈利的to B公司卖的大多是产品。我们目前打造的可配置、可调整的搜索增强知识库,就是希望用产品的方式,以更低的成本解决客户的定制化需求。客户提出的各种需求可以通过我们不同的产品组合来解决, 我们不需要单独开发一套全新的数据库。”洪涛进一步解释道。

据「甲子光年」观察,百川智能并不直接针对某个行业做“企业服务”,而是基于不同的场景需求,构建大模型解决问题的能力。这些能力最终可被应用在多个行业。

在众多场景中,百川智能主要瞄准有两大特征的场景——有大量文本数据,并且需要与客户打交道,如客服场景。

目前,和大多数企业类似,百川智能为企业提供API调用、云上部署以及本地部署三种大模型部署方式。

在此次沟通会中,王小川还透露了C端产品的最新信息。

王小川表示,C端产品依然是百川智能十分看重的方向。关于C端超级应用的定义,王小川认为:“以往做应用更多是在造工具,我们要求它以更精确的方式和我们互动,提高我们的效率。但今天,我们要造的是新物种,是一种人类的伙伴。”

王小川进一步透露,百川智能的C端产品第一重心是医疗方向,产品预计会在明年上线。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    1439

    浏览量

    61246
  • 大模型
    +关注

    关注

    2

    文章

    1892

    浏览量

    1509

原文标题:百川智能发布Baichuan2 Turbo系列API,或将替代行业大模型|甲子光年

文章出处:【微信号:jazzyear,微信公众号:甲子光年】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    百度文心大模型4.0 Turbo,正式发布 用户规模已达3亿

    的最新数据,并正式发布文心大模型4.0 Turbo、飞桨框架3.0等最新技术,披露飞桨文心生态最新成果。  01 文心大模型4.0 Turbo
    的头像 发表于 06-29 10:06 485次阅读

    亚马逊云科技接入百川智能和零一万物基础模型

    近日,亚马逊云科技在中国峰会上宣布,两大中文基础模型——百川智能Baichuan2-7B和零一万物的Yi-1.5 6B/9B/34B,即将或已正式登陆中国区域的SageMaker J
    的头像 发表于 06-04 11:53 400次阅读

    亚马逊云科技扩展生成式AI合作

    百川智能和零一万物基础模型登陆中国区域SageMaker JumpStart 上海2024年5月30日 /美通社/ -- 亚马逊云科技在中国峰会2024上宣布,由百川
    的头像 发表于 05-30 16:36 153次阅读
    亚马逊云科技扩展生成式AI合作

    百川智能发布Baichuan 4大模型及首款AI助手“百小应”

    百川智能近日发布了其新一代基座大模型Baichuan 4,并同步推出了首款AI助手“百小应”。这款AI助手是在
    的头像 发表于 05-23 14:15 333次阅读

    百度智能云正式发布了《百度智能云水业大模型白皮书》

    3月28日,由E20环境平台主办的2024(第二十二届)水业战略论坛在北京召开。会上,百度智能云正式发布了《百度智能云水业大模型白皮书》(以
    的头像 发表于 03-29 09:20 1023次阅读
    百度<b class='flag-5'>智能</b>云正式<b class='flag-5'>发布</b>了《百度<b class='flag-5'>智能</b>云水<b class='flag-5'>业大</b><b class='flag-5'>模型</b>白皮书》

    数势联动百川发布首批大模型联合解决方案,推动中国大模型价值落地

    近日,行业领先的数据智能产品提供商北京数势云创科技有限公司(以下简称“数势科技”)和国内通用大模型厂商北京百川智能科技有限公司(以下简称“
    的头像 发表于 02-28 11:40 266次阅读
    数势联动<b class='flag-5'>百川</b>,<b class='flag-5'>发布</b>首批大<b class='flag-5'>模型</b>联合解决方案,推动中国大<b class='flag-5'>模型</b>价值落地

    百川智能发布超千亿大模型Baichuan 3

    百川智能近日发布了超千亿参数的大语言模型Baichuan 3,引发了业界的广泛关注。这款模型在多
    的头像 发表于 01-31 14:58 538次阅读

    搜索出生的百川智能模型RAG爬坑之路总结

    今天对百川的RAG方法进行解读,百川智能具有深厚的搜索背景,来看看他们是怎么爬RAG的坑的吧~
    的头像 发表于 01-05 15:02 1089次阅读
    搜索出生的<b class='flag-5'>百川</b><b class='flag-5'>智能</b>大<b class='flag-5'>模型</b>RAG爬坑之路总结

    OpenAI发布的GPT-4 Turbo版本ChatGPT plus有什么功能?

    GPT-4的最新版本。OpenAI凭借承诺增强功能和成本效率的模型实现了巨大飞跃,为人工智能行业树立了新标准。 我们来看看OpenAI带来了什么: 文本和图像理解 GPT-4 Turbo凭借两个独特的版本脱颖而出:以文本为中心的
    的头像 发表于 12-05 17:57 1899次阅读
    OpenAI<b class='flag-5'>发布</b>的GPT-4 <b class='flag-5'>Turbo</b>版本ChatGPT plus有什么功能?

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3

    发布GPT-4 Turbo模型 北京时间11月7日凌晨两点,OpenAI首届开发者大会在洛杉矶正式开幕。 Sam Altman分享了ChatGPT取得的成就。“有大约200万开发人员,在我们的
    的头像 发表于 11-07 18:20 2340次阅读
    ChatGPT重磅更新 OpenAI<b class='flag-5'>发布</b>GPT-4 <b class='flag-5'>Turbo</b><b class='flag-5'>模型</b>价格大降2/3

    寒武纪的思元(MLU)云端智能加速卡与百川智能完成大模型适配,携手创新生成式AI

    近日,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、
    的头像 发表于 11-06 20:32 1012次阅读
    寒武纪的思元(MLU)云端<b class='flag-5'>智能</b>加速卡与<b class='flag-5'>百川</b><b class='flag-5'>智能</b>完成大<b class='flag-5'>模型</b>适配,携手创新生成式AI

    百川智能获阿里腾讯小米等3亿美元投资

    百川智能推出了4款开源baichuan-7b/13b、baichuan 2-7b/13b的免费商用产品和baichuan-53b、
    的头像 发表于 10-17 10:15 591次阅读

    声智科技联合中国信通院正式发布国内首个金融行业大模型标准

    金融大模型最新消息! 9月,2023可信AI大会暨南京人工智能产业发展大会成功召开,声智科技联合中国信通院正式发布国内首个金融行业大模型标准
    的头像 发表于 09-22 09:58 549次阅读

    白海科技与百川智能顺势而为、携手共进,助力领域大模型应用快速落地

    (2023年08月08日,中国北京讯)近日,AI基础软件服务商白海科技与国内领先的AGI服务企业百川智能宣布达成战略合作协议。这次合作旨在加速大语言模型在各行各业的应用,并为客户提供智能
    的头像 发表于 08-08 14:23 855次阅读

    华为云盘古大模型3.0发布,一个完全面向行业的大模型

    华为云盘古大模型3.0正式发布引发全球AI产业震荡,张平安称,盘古大模型3.0是一个完全面向行业的大模型
    的头像 发表于 07-07 16:30 1613次阅读