0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

360开源70亿参数模型,助力360k长文本输入

微云疏影 来源:综合整理 作者:综合整理 2024-03-29 15:54 次阅读

近日,360公司创始人周鸿祎透露,他们即将发布基于360智脑7B的新版本(70亿参数模型),并支持全文字符长度达360K(50万字)的文本输入。

周鸿祎指出,近期大模型产业正在以数据量为竞争重点,百万字文本处理能力“有望成为未来标配”。他表示,360决定发布这项功能,以避免相关行业研发者重复投入精力,同时360K作为长度单位也是象征性的选择。

此外,周鸿祎也被视为“开源信徒”,他深信开源的力量。

据悉,360智脑的长文本处理能力已经落实在他们的大模型产品——360AI浏览器上。周鸿祎亦提及其对小型模型的看法,即小型模型优势在于速度和用户体验良好,且只需单机单卡运行,具有较高的性价比。

当前,360AI浏览器已经向用户提供100万字的长文本处理能力和网页、中英论文等常见文档、音频视频处理服务,帮助用户快速实现要点总结、思维导图生成等操作。

据先前的信息披露,京东推出的模型Kimi以及其他国产品牌大模型都已纷纷加入“长文本”战场,包括百度文心一言预计下月升级后将开放200至500万字的长文本能力;360智脑正在试验500万字长文本,即将发布至360AI浏览器;阿里通义千问则宣布面向所有用户提供1000万字长文档处理免费服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浏览器
    +关注

    关注

    1

    文章

    1014

    浏览量

    35265
  • 开源
    +关注

    关注

    3

    文章

    3243

    浏览量

    42378
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2448
收藏 人收藏

    评论

    相关推荐

    单日获客成本超20万,国产大模型开卷200万字以上的长文本处理

    更精准的推理和高并发流量以外,似乎已经没有太多值得厂商大肆宣传的特性了,直到最近超长文本处理的爆火。   国产大模型的新卷法,长文本处理   当下将大模型
    的头像 发表于 03-27 00:53 3303次阅读
    单日获客成本超20万,国产大<b class='flag-5'>模型</b>开卷200万字以上的<b class='flag-5'>长文本</b>处理

    月访问量超2亿,增速113%!360AI搜索成为全球增速最快的AI搜索引擎

    与传统搜索引擎不同,作为AI原生搜索引擎的360AI搜索基于公开网络、知识库、大模型三大支柱。借助首创的 CoE 技术架构,360AI搜索整合了国内主流的16家厂商51款大模型,支持用
    的头像 发表于 09-09 13:44 403次阅读
    月访问量超2<b class='flag-5'>亿</b>,增速113%!<b class='flag-5'>360</b>AI搜索成为全球增速最快的AI搜索引擎

    请问InDTU IHDMP协议使用的CRC校验使用的什么参数模型

    InDTU IHDMP协议使用的CRC校验使用的什么参数模型
    发表于 07-25 06:39

    通义千问开源千亿级参数模型

    通义千问近日开源了其首个千亿级参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B模型继承了
    的头像 发表于 05-08 11:01 696次阅读

    讯飞星火长文本功能全新升级

    科大讯飞近日宣布,其首个长文本、长图文、长语音大模型已完成全新升级。这一大模型不仅具备强大的学习能力,可以快速吸收海量文本、图文资料以及会议录音等多元化信息,更能在各行业场景中提供精准
    的头像 发表于 05-06 11:22 518次阅读

    通义千问推出1100亿参数开源模型

    通义千问近日震撼发布1100亿参数开源模型Qwen1.5-110B,这一举措标志着通义千问在AI领域迈出了重大步伐。该模型成为通义千问全系
    的头像 发表于 05-06 10:49 554次阅读

    科大讯飞创新推出长文本、长图文、长语音大模型,解决落地难题

    近期,科大讯飞推出了首个支持长文本、长图及语音大数据处理的大模型,该系统融合了多元化数据源,包括海量文字、图片以及会议音频等,能为各行业场景提供专业化、精准化的答案。
    的头像 发表于 04-28 09:32 354次阅读

    Kimi爆火背后的技术奥秘 大模型长文本能力的技术难点

    当用户认为在国内的大模型中,长文本=kimi的时候,除非竞争对手能以绝对的实力碾压几个量级,但凡与kimi打平或者是微弱超越,都很难威胁到kimi在用户心目中的地位。
    发表于 04-17 10:11 1174次阅读
    Kimi爆火背后的技术奥秘 大<b class='flag-5'>模型</b><b class='flag-5'>长文本</b>能力的技术难点

    阿里云通义千问发布320亿参数模型,优化性能及效率

    与之前的模型相比,新版320亿参数模型在性能、效率以及内存占用方面取得了明显改善。具体来说,32B在智能体场景下能力优于14B模型,并且推理成本较小。
    的头像 发表于 04-08 14:44 778次阅读

    Databricks发布DBRX开源AI模型,性能优于Meta的Lama 2

    据了解,DBRX模型运用的是Transformer架构,内置参数高达1320亿,拥有由16个专家网络组成的复杂系统。每次进行推理时,仅需使用其中的四个专家网络就能激活360
    的头像 发表于 03-28 10:18 346次阅读

    360集团和哪吒汽车合作 将共同发布NETA GPT大模型

    360集团和哪吒汽车合作 将共同发布NETA GPT大模型 3月1日,360集团与哪吒汽车签署战略合作协议,双方计划共同发布大模型产品NETA GPT,预计发布时间在4月份。届时将会把
    的头像 发表于 03-02 15:51 924次阅读

    快速全面了解大模型长文本能力

    那关于LLM的长文本能力,目前业界通常都是怎么做的?有哪些技术点或者方向?今天我们就来总结一波,供大家快速全面了解。
    发表于 02-22 14:04 815次阅读
    快速全面了解大<b class='flag-5'>模型</b><b class='flag-5'>长文本</b>能力

    Meta发布CodeLlama70B开源模型

    Meta发布CodeLlama70B开源模型 Meta发布了开源模型CodeLlama70B
    的头像 发表于 01-31 10:30 1360次阅读

    求助,关于ADuCM360与AD7903使用官网例程问题

    ( sckx)不接入千人360时可以从ad7903获取数据,而且得到的数据可以随着输入变化而变化,这是什么原因呢?毕竟sdox 和 sdox 键是根据sccx( sckx)来输出数据的。 图 3 不接
    发表于 12-05 07:29

    阿里云通义千问720亿参数模型宣布开源

    12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型
    的头像 发表于 12-01 17:08 1310次阅读