0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从容大模型亮相!云从科技:公司具有系列模型,并具有对模型的剪枝能力

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-05-30 09:14 次阅读

电子发烧友网报道(文/李弯弯)日前,云从科技在广州南沙发布了其自主研发的AI大模型从容。在发布会现场,云从科技董事长兼总经理周曦及技术人员展示了从容大模型的基础功能,包括模型在趣味问答、中英翻译、编程与阅读理解等方面的应用。

值得一提的是,从容大模型除了能够准确地回答问题,还能够在回答内容下做出参考资料来源的标注,从而解决了目前公众对于生成式人工智能参考内容不明的疑问。

具备大模型理论与实践融合经验

云从科技自成立以来,始终专注于提供高效人机协同操作系统和行业解决方案,致力于助推人工智能产业化进程和各行业智慧化转型升级。

人机协同操作系统从行业属性上属于人工智能平台领域。目前人工智能平台领域形成了丰富的产品形态,如人工智能芯片平台、深度学习框架、AIoT 操作系统、 算法算力平台、知识中台、自动驾驶平台、机器人开发平台等。人工智能企业根据自身技术积累和发展战略选择的人工智能平台发展路径存在差异。

根据人工智能平台领域产品类别和技术特点,云从科技人机协同操作系统属于算力算法平台和知识中台相结合的产品,支持主流的多个深度学习框架。感知智能、认知智能和决策智能相结合,帮助用户系统性的解决更复杂的业务问题,是人工智能行业发展最重要的趋势之一。

自从ChatGPT出圈以来,全球科技公司纷纷加入大模型的研究大军,其中百度、阿里、科大讯飞、商汤科技、第四范式等公司的大模型已经问世。作为人工智能领域的明星企业,云从科技自然也要加速,今年3月,云从科技开始向科创板申请定增计划并获得受理,此次将定向融资36亿元,旨为用于云从“行业精灵”大模型研发项目。

云从科技称,投入大模型的研发对公司来说有利,一是符合国家有关产业政策以及未来公司整体战略发展方向;二是云从科技具备大模型理论与实践融合的经验。

云从科技从2019年开始就在自然语言处理、OCR、视觉语义理解、语音识别等多个领域实践“预训练大模型+下游任务迁移”的技术范式,产出多个百亿参数以内规模的模型。

如金融行业的票据证照识别和服务合规性督查、智慧城市的道路状态监控、机场的航班节点保障等场景中,充分发挥预训练模型的小样本学习能力,凭借少量训练样本可以在以小时计的时间周期内完成具体场景的任务迁移。

具有系列模型,具有对模型的剪枝能力

经过多年积累,云从科技此次创新推出从容大模型。通过实时学习并同步反馈结果,从容大模型可以解决AI应用的痛点,从而有利于快速普及个性化应用。

有了基础大模型,还需要在各领域的行业落地方面努力。云从科技也在全力投入行业大模型的研发,并把其引入到人机协同操作系统之上,希望在to B、to G等方向上发力。

比如针对主播群体,基于大模型云从推出了一个“大麦数字人直播平台”,除了提供背景风格、主播库、音色库及整体视觉风格的选择,大模型还能帮助主播撰写直播文稿,设置互动问答库以应对直播过程中的粉丝提问等,便于主播随时挑选直播话术等。

在金融领域,云从科技基于从容大模型、金融行业模型、智能业务流等核心技术研发的虚拟客户经理,具备智能问答、自动语义、意图判断、多意图理解、动态追问等AI交互能力,可赋能金融机构实现从客户引流、咨询、营销、运营等全流程智能化客户服务能力,创新金融机构服务触达通道,以AI驱动金融机构客户服务智能化转型升级。

在游戏行业,云从科技将联手游族网络共同致力于针对游戏行业的人工智能大模型技术研究及应用实践,以赋能产业发展,全面提升游戏开发和发行等环节的业务效率。游族网络与云从将共同研究游戏垂直领域的LLM大模型。

相比于其他企业的大模型,比如百度的“文心一言”、阿里的“通义千问”、科大讯飞的“星火认知大模型”等,云从科技的从容大模型有何区别?

对此,云从科技表示,首先公司拥有自主的预训练大模型和在预训练层调优模型的能力,这与仅用开源的大模型具有显著地差别;其次,公司提供模型级别的AI赋能服务和过去提供API形式的赋能服务不同,与客户合作更加深度,粘性更强;第三,公司具有系列模型,并具有对模型的剪枝能力,公司可以根据行业场景需求去帮助客户部署模型,实现性价比最优。

小结

如今,已经有多家企业宣布推出大模型,包括百度、阿里、科大讯飞、商汤科技、第四范式等,作为人工智能领域的明星企业,云从科技自然也不会例外,虽然从容大模型在发布时间上稍有落后,不过其深厚技术和经验积累,让它也具备了其他企业所不具有的独特优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云从科技
    +关注

    关注

    1

    文章

    70

    浏览量

    9695
收藏 人收藏

    评论

    相关推荐

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    训练模型如BERT、GPT等。这些模型在理解自然语言、生成文本、处理对话等方面具有不同的能力。因此,在选择模型时,需要了解每个
    发表于 12-17 16:53

    揭示大模型剪枝技术的原理与发展

      当你听到「剪枝」二字,或许会联想到园丁修整枝叶的情景。而在 AI 大模型领域,这个词有着特殊的含义 —— 它是一种通过“精简”来提升大模型效率的关键技术。随着 GPT、LLaMA 等大模型
    的头像 发表于 11-19 16:25 489次阅读
    揭示大<b class='flag-5'>模型</b><b class='flag-5'>剪枝</b>技术的原理与发展

    阿里开源Qwen2.5-Coder代码模型系列

    近日,阿里通义大模型团队宣布开源其通义千问代码模型系列,共包含6款Qwen2.5-Coder模型。这一举措展示了阿里
    的头像 发表于 11-14 11:28 340次阅读

    知声山海大模型多项能力全球领跑

    国内人工智能权威机构清华大学基础模型研究中心发布SuperBench九月综合榜单。本次评测选取海内外24个具有代表性的大模型,结果显示,山海大模型对齐、智能体、安全等多项
    的头像 发表于 10-12 14:30 396次阅读
    <b class='flag-5'>云</b>知声山海大<b class='flag-5'>模型</b>多项<b class='flag-5'>能力</b>全球领跑

    【《大语言模型应用指南》阅读体验】+ 基础知识学习

    习语言的表达方式和生成能力。通过预测文本中缺失的部分或下一个词,模型逐渐掌握语言的规律和特征。 常用的模型结构 Transformer架构:大语言模型通常基于Transformer架
    发表于 08-02 11:03

    Al大模型机器人

    理解能力强大: AI大模型机器人可以理解和生成自然语言,能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感,据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的
    发表于 07-05 08:52

    【大规模语言模型理论到实践】- 阅读体验

    再次感谢电子发烧友提供的书籍试读机会。今天来分享下我在学习大模型训练中 注意力机制 的心得体会。 虽然注意力机制可以显著提高模型处理长序列数据的能力,但这也带来了计算成本的增加。在大型模型
    发表于 06-07 14:44

    大语言模型:原理与工程时间+小白初识大语言模型

    解锁 我理解的是基于深度学习,需要训练各种数据知识最后生成自己的的语言理解和能力的交互模型。 对于常说的RNN是处理短序列的数据时表现出色,耳真正厉害的是Transformer,此框架被推出后直接
    发表于 05-12 23:57

    【大语言模型:原理与工程实践】大语言模型的应用

    的提示词设计。当人类运用“系统2”决策时,他们会在思考、观察和行动之间灵活切换。他们了解自己的局限,知道如何利用工具获取所需信息,进而指导推理过程。此外,人类还具有反思的能力,能够修正和优化决策
    发表于 05-07 17:21

    【大语言模型:原理与工程实践】大语言模型的评测

    大语言模型的评测是确保模型性能和应用适应性的关键环节。基座模型到微调模型,再到行业模型和整体
    发表于 05-07 17:12

    【大语言模型:原理与工程实践】大语言模型的预训练

    和多样性。高质量数据能确保模型稳定收敛,而数据的多样性则有助于模型学习广泛的通用能力,如文本生成、信息抽取、问答和编程等。此外,数据的多样性对于确保模型在实际应用中
    发表于 05-07 17:10

    【大语言模型:原理与工程实践】大语言模型的基础技术

    :Transformer 2017年,谷歌公司推出了具有划时代意义的Transformer结构,最初专为机器翻译任务设计。凭借其卓越的特征学习能力,Transformer迅速崭露头角,继卷积神经网络(CNN)和RNN
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    。这一过程的不断迭代使大语言模型的语言理解和生成能力逐步提升。大语言模型在自然语言处理领域应用广泛,尤其在问答系统和机器翻译方面。它能理解用户意图生成准确答案,实现高质量的自动翻译。
    发表于 05-04 23:55

    包含具有多种类型信息的3D模型

    ® Structures : Tekla由行业领导者Trimble公司开发,提供丰富数据的建筑模型,可以提高生产力,促进跨学科的协作,最大限度地减少模型数据的错误率。 Tekla S
    发表于 03-28 17:18

    科技发布DataGPT

    科技正式宣布推出国内首款AI原生数据分析产品DataGPT。这款产品基于自主研发的从容多模态大
    的头像 发表于 02-04 10:13 914次阅读