0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI大模型「量子速读」,一分钟抵人类五小时

智能感知与物联网技术研究所 来源:智能感知与物联网技术研 2023-05-15 09:42 次阅读

OpenAI 的 GPT-4 可以处理的上下文 token 最多可达 32k(约 50 页文本)。如今,前 OpenAI 员工创建的 Anthropic 公司再次升级了对标模型 Claude,将上下文 token 扩展到了 100k,处理速度也大大加快。

最近一段时间,OpenAI 凭借 GPT 系列模型以及 ChatGPT,一直是最受关注的研究机构。但最近两年,一家 AI 初创公司正在走进大家的视野,这家公司名为 Anthropic,成立于 2021 年,专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。

不知大家是否还记得 2020 年末,OpenAI 核心员工集体离职事件,当时这件事在 AI 圈还引起了不小的轰动。Anthropic 就是由这些离职的人员创建的,其中包括 OpenAI 前研究副总裁 Dario Amodei、GPT-3 论文一作 Tom Brown 等人。

今年一月,Anthropic 已筹集了超过 7 亿美元的资金,最新一轮的估值达到了 50 亿美元。与此同时,在 ChatGPT 发布两个月后,这家公司就迅速开发了一种对标老东家 ChatGPT 的人工智能系统 Claude。

Claude 申请访问地址:https://www.anthropic.com/earlyaccess

Claude 使用了 Anthropic 自行开发的一种被称为「constitutional AI」的机制,其旨在提供一种「基于原则」的方法使 AI 系统与人类意图保持一致。

Claude 可以完成摘要总结、搜索、协助创作、问答、编码等任务。根据用户反馈,Claude 生成有害输出的可能性较小,更容易进行对话,并且更易于控制。除此以外,Claude 还可以根据指示来设定个性、语气和行为。

9b82c368-f2b5-11ed-90ce-dac502259ad0.gif

不过 Anthropic 并没有提供关于 Claude 的太多技术细节,但在论文《Constitutional AI: Harmlessness from AI Feedback》中描述了 Claude 背后技术,感兴趣的读者可以前去查看。

论文地址:https://arxiv.org/pdf/2212.08073.pdf

早在一月份,就有研究者对 Claude 一次性可以处理的最大文本量进行了测试,显示 Claude 可以回忆起 8k 个 token 中的信息

时隔没多久,本周四,Anthropic 推出了 100K Context Windows,它将 Claude 的上下文窗口从 9k token 扩展到了 100k,这相当于 75,000 个单词。这意味着企业可以提交数百页材料让 Claude 消化和解释,并且与它的对话可以持续数小时甚至数天。现在可以通过 Anthropic API 访问 100K context windows。

9bbadab4-f2b5-11ed-90ce-dac502259ad0.png

我们知道,大模型越先进,能够同时处理的文本就越长,7.5 万字是个什么概念呢?大概相当于一键总结《哈利波特》第一部。

9be57558-f2b5-11ed-90ce-dac502259ad0.jpg

看起来绝大多数论文、新闻报道和中短篇小说都不在话下了。

Claude 再进化:真「AI 量子速读」

根据科学研究,普通人可以在 5 小时左右的时间里阅读 100,000 个 token,并可能需要更长的时间来消化、记忆和分析这些信息。现在 Claude 可以在不到 1 分钟的时间里完成这些。

9bfe33fe-f2b5-11ed-90ce-dac502259ad0.png

上下文窗口的一般计算。

Anthropic 首先将《了不起的盖茨比》的整个文本加载到了 Claude-Instant(72 K tokens,Claude 两个版本 Claude 和 Claude Instant,Claude 是最先进的高性能模型,而 Claude Instant 是更轻、更便宜、更快的选择。)中,并修改了一行「Carraway 先生是一位在 Anthropic 从事机器学习工作的软件工程师」。当 Anthropic 要求模型找出与原文的不同之处时,它会在 22 秒内给出正确答案。

除了阅读长文本之外,Claude 还有助于从文档中检索信息,从而对业务运营产生助益。用户可以将多个文档甚至一本书放入 prompt 中,然后向 Claude 提出问题(需要对文本的很多部分进行综合知识分析)。对于复杂的问题,这可能比基于向量搜索的方法有效得多。Claude 可以按照用户的指令返回他们正在搜寻的信息,就像人类助手一样。

Anthropic 接着将大语言集成工具 LangChain API 开发者文档(240 页)放入模型中,然后针对所提问题给出了使用 Anthropic 语言模型的 LangChain demo。

9c15e986-f2b5-11ed-90ce-dac502259ad0.gif

与此同时,100k token 可以转换为 6 个小时左右的音频。AssemblyAI 对此做了很好的演示,他们将一个长播客转录为了近 58k 个单词,然后使用 Claude 进行摘要总结和问答。

9c677aee-f2b5-11ed-90ce-dac502259ad0.png

图源:AssemblyAI

总之,使用 100k context windows,用户可以做到如下:

消化、总结和解释财务报表或研究论文等密集文件;

基于公司年度报告分析战略风险和机遇;

评估一项立法的利弊;

识别法律文件中的风险、主题和不同形式的争论;

阅读数百页的开发者文档,并给出技术问题的答案;

通过将整个代码库放入上下文并智能地构建或修改以快速制作原型。

有网友用以下梗图形象地描述了 Context Windows 与 Claude 100k、GPT-4 32K 的关系。

至于价格,Anthropic 技术人员 Ben Mann 表示,100K Context Windows 的百万 token 售价与以往模型一样。

9cbbd472-f2b5-11ed-90ce-dac502259ad0.png

9cceec42-f2b5-11ed-90ce-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3268

    浏览量

    48946
  • OpenAI
    +关注

    关注

    9

    文章

    1100

    浏览量

    6591
  • ChatGPT
    +关注

    关注

    29

    文章

    1564

    浏览量

    7833

原文标题:一口气看完《哈利波特》:AI大模型「量子速读」,一分钟抵人类五小时

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LG AI Research使用亚马逊云科技开发AI模型 加快癌症诊断速度

    LG集团旗下AI智库利用亚马逊云科技进行癌症早期风险识别 Amazon SageMaker助力LG AI Research将基因测试时间从两周缩短至不到一分钟,加快患者诊断速度 北京2024年12月
    的头像 发表于 12-16 15:13 120次阅读
    LG <b class='flag-5'>AI</b> Research使用亚马逊云科技开发<b class='flag-5'>AI</b><b class='flag-5'>模型</b> 加快癌症诊断速度

    用现代移位寄存器克服最后一分钟的特征蠕变

    电子发烧友网站提供《用现代移位寄存器克服最后一分钟的特征蠕变.pdf》资料免费下载
    发表于 09-21 11:20 0次下载
    用现代移位寄存器克服最后<b class='flag-5'>一分钟</b>的特征蠕变

    波型输出正常,但工作不到一分钟时间TPA3221总是无故烧毁,为什么?

    波型输出正常,但工作不到一分钟时间TPA3221总是无故烧毁,绝对不是过流或过热。
    发表于 08-14 07:50

    INA199A3 3脚和4脚短路接24V输入,不到一分钟就烧了,为什么?

    INA199A3 3脚和4脚短路接24V输入,取样电阻是33毫欧,插上电源24V,VOUT可以输出14V,INA199A3不到一分钟就烧了,试了两个都是样的问题;后面把3脚接到7550输出5V
    发表于 08-02 06:45

    在MWC上海,被荣耀的端侧AI新功能硬控一分钟

    AI行业资讯
    脑极体
    发布于 :2024年06月28日 18:41:51

    中兴2400 (v4.3)维修求助

    机子改过0-230V可调,正常的时候满载(230V、12A)接着负载(电池)直接通电后机子电压直跳不上去,最多只能到60多V,僵持一分钟左右后炸管,后面换了管,换管后电压最高还是只能到60多V,直硬升压的话过
    发表于 06-05 16:18

    主播5小时打造iPad Pro妙控键盘&quot;白加黑&quot;效果

    据报道,5 月 20 日,播客兼苹果电视爱好者西格蒙德·贾奇经过长达五小时的努力,成功地为iPad Pro的妙控键盘实现了“白加黑”的效果。
    的头像 发表于 05-20 10:24 549次阅读

    一分钟看完看懂电机的接线方法

    今天给大家讲解下,看懂电机的接线方法,一分钟看完,看就懂!。 电机的接线方法无外乎以下两种 1a星形接法(实物图)
    发表于 03-31 15:40 3912次阅读
    <b class='flag-5'>一分钟</b>看完看懂电机的接线方法

    M8连接器挑选起来并不复杂,一分钟完成选型

    M8连接器挑选起来并不复杂,德索精密工业教您一分钟完成选型!德索精密工业,专业生产M8连接器十八年,欢迎前来采购M8相关产品。选择合适自己使用的连接器非常重要,在日后的使用中可以避免许多麻烦,那么究竟该如何选择呢?今天就来为大家详细介绍下。
    的头像 发表于 03-18 17:06 483次阅读
    M8连接器挑选起来并不复杂,<b class='flag-5'>一分钟</b>完成选型

    M8连接器受什么因素影响,一分钟即可读懂!

    M8连接器受什么因素影响,德索一分钟让您明白!随着时候的发展,M8连接器的使用范围越来越广泛,那么,如何才能购买到质量好、价格低的M8连接器呢?其实,影响M8连接器主要影响的因素包括温度、电压,电流,绝缘,防水防湿等等。
    的头像 发表于 03-02 17:29 405次阅读
    M8连接器受什么因素影响,<b class='flag-5'>一分钟</b>即可读懂!

    国内公司与SORA模型代差约半年,行业发展亟待加速

    根据我们的计算,基于SORA模型生成视频的过程中,如果假设张图的价格是0.02美元,一分钟生成十几张图片,那么生成段60秒的视频可能需要消耗10到12美元。
    的头像 发表于 02-22 10:31 615次阅读

    OpenAI发布文生视频模型Sora,开启AI内容创作新纪元

    近日,人工智能领域的领军企业OpenAI在其官网上正式发布了名为Sora的文生视频大模型。这款模型具备根据用户提示生成长达一分钟视频的能力,并在视频连贯性、角色致性等方面表现出色,几
    的头像 发表于 02-20 13:44 680次阅读

    奥特曼发布王炸模型Sora

    奥特曼,作为科技界的先驱者,近日携手OpenAI发布了其首个视频生成模型——Sora。这创新模型完美继承了DALL·E 3的卓越画质和强大指令遵循能力,能够生成长达一分钟的高清视频。
    的头像 发表于 02-18 10:06 1053次阅读

    TC1728在擦除Flash时,STM中断会暂停一分钟然后恢复,请问是什么原因呢?

    TC1728在擦除Flash时,STM中断会暂停一分钟,然后恢复,请问是什么原因呢?
    发表于 02-02 12:15

    什么是一分四功器?

    一分四功器是种电子设备,用于将个输入信号分成四个输出信号,并且可以分别调节每个输出信号的功率。
    的头像 发表于 01-22 18:08 1221次阅读