0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI 软件TLDR:可用一句话概括文章

ss 来源:学术头条 作者:学术头条 2020-11-27 17:00 次阅读

摘要在一篇文章中有着至关重要的作用,它浓缩了整篇文章的精华,可以让你快速了解该篇文章的研究背景、研究意义和研究亮点,进而决定了你是否会点开这篇文章仔细阅读。

如果摘要太长或者逻辑混乱,就会失去它让人快速浏览的意义,很有可能让人忽略掉一篇正文内容还不错的文章。那么,是否可以在摘要的基础上进一步提炼,用一句话概括文章?

答案是:AI 可以做到。

近日,一款科学搜索引擎在其官网上就推出了这样一款 AI 软件——TLDR,即“太长了,没有读”(too long,didn’t read)的意思,该软件可以自动生成研究论文的一句话总结。这款软件的开发者认为,这样可以帮助研究人员更快地浏览论文,减少阅读摘要的时间。

TLDR 经常被用于网上关于科学论文的非正式讨论(比如,Twitter 或 Reddit)。

本周,这款软件在华盛顿州西雅图的非营利性艾伦人工智能研究所(AI2)创建的搜索引擎 Semantic Scholar 的搜索结果中开始上线使用。目前,该软件只为 Semantic Scholar 所覆盖的 1000 万篇计算机科学论文生成一句话摘要。

AI2 管理 Semantic Scholar 小组的 Dan Weld 表示,他们目前正在优化 TLDR,预计一个月左右的时间后,TLDR 将陆续涵盖其他学科领域的论文。

图 | TLDR 与普通总结的对比 (来源:Semantic Scholar)

初步测试表明,该工具可以帮助读者比查看标题和摘要的方式更快地整理搜索结果,特别是在手机上。

图 | TLDR 在手机上的效果(来源:Nature)

介绍该软件的预印本于 4 月 1 日首次发表在 arXiv 预印本服务器上,并在 11 月举行的自然语言处理会议上经过同行评审后被接收发表。研究人员免费提供了他们的代码,以及一个测试 demo,任何人都可以尝试使用。

图 | 生成 TLDR 的测试 (来源:SCITDLR)

如何训练 TLDR?

TLDR 本质上就是对科学论文的一种新的总结。Weld 创建 TLDR 软件的灵感一部分来自于他的同事,其在 Twitter 上分享标记文章的活泼句子。与其他语言生成软件一样,该软件是利用深度神经网络,通过进行大量的训练而生成。

图 | TLDR 的介绍 (来源:arxiv)

为了训练 TLDR,研究人员准备了 SCITLDR,这是一个多目标数据集,包含5411篇TLDR,覆盖计算机科学领域的 3229 篇科学论文。

其中,训练集包含 1992 篇论文,每篇论文都有一个“黄金”TLDR,也就是最佳 TLDR。开发集和测试集分别包含 619 篇和 618 篇论文,分别有 1452 个和 1967 个 TLDR。

通常情况下,总结数据集会假设一个给定文档只有一个黄金总结,而 SCITLDR 与大多数现有的总结数据集不同。正如早期的摘要评估工作所证明的那样,人类撰写的摘要具有可变性。

将每篇论文只考虑一个黄金 TLDR 作为自动评估的基础,可能会导致系统质量评估不准确,因为可能出现在 TLDR 中的内容可能具有很大的可变性。此外,为每份文件提供多个黄金摘要,可以进行更深入的分析和彻底的评估。

为了解决这个问题,SCITLDR 包含了从作者角度撰写的 TLDR("TLDR-Auth")和从同行评审者角度撰写的 TLDR("TLDR-PR")。

TLDR-Auth 可在各种在线平台上获得。在公开的科学评审平台 OpenReview.org 上,作者提交其论文的 TLDR,为审稿人和其他感兴趣的学者总结主要内容。学者们也会在Twitter 和 Reddit 等社交媒体平台上分享 TLDR。

TLDR-PR 是将同行评审员已经仔细检查了源论文后写的评论中的总结重写成 TLDR。为了完成这项任务,研究人员从华盛顿大学招募了 28 名计算机科学专业的本科生,他们有自我报告的阅读科学论文的经验。在接受一个小时的一对一写作训练并筛选后完成 TLDR 的写作工作。

图 | TLDR-Auth 和 TLDR-PR的对比(来源:arxiv)

图 | TLDR-Auth 和 TLDR-PR的对比(来源:arxiv)

TLDR-Auth 和 TLDR-PR 即使包含相同的信息内容,也会有很大的差异。总的来说,TLDR-PR 总结的更为抽象。

引入 CATTS 对 TLDR 进行优化

CATTS(Controlled Abstraction for TLDRs with Title Scaffolding),这是一种简单而有效的学习生成 TLDR 的方法,它可以在以上介绍的数据集训练的基础上进行补充训练。该方法解决了两个主要挑战:(1) 训练数据的大小是有限的;(2) 为了编写高质量的黄金 TLDR,需要领域知识。

为了解决这些挑战,研究人员提出使用科学论文的标题作为额外的生成目标。由于标题通常包含有关论文的关键信息,假设训练模型生成标题将允许它学习如何定位论文中的突出信息,这些信息对生成 TLDR 也很有用。

通过多任务学习纳入辅助脚手架任务之前已经研究过,用于改进跨度标注和文本分类 。与多任务学习类似,在带有控制代码注释的异质数据上进行训练已经被证明可以改善自回归语言模型中的控制生成。

为了让标题生成完成辅助 TLDR 生成的任务,研究人员提出用标题生成数据集洗牌 SCITLDR,然后分别用控制代码 <|TLDR|> 和 <|TITLE|> 附加每个源。这使得模型的参数可以学习生成 TLDR 和标题。在生成时,适当的控制代码被附加到源中。此外,上采样特定任务可以被视为应用特定任务的权重,类似于多任务学习设置中的权重损失。

图 | CATTS引入可视化(来源:arxiv)

对 TLDR 未来的期待

"我预测,在不久的将来,这种工具将成为学术搜索的标准功能。事实上,考虑到科研人员实际的需求,我很惊讶等了这么长时间才看到它的实际应用。" 西雅图华盛顿大学的信息科学家杰文 - 韦斯特(Jevin West)说,他应《自然》杂志的要求测试了该工具。"虽然它并不完美,但它绝对是朝着正确方向迈出的重要一步。" 他说。

Weld 指出,TLDR 软件并不是唯一的科学总结工具:自 2018 年以来,网站 Paper Digest 也一直提供论文摘要,但它似乎是从文本中提取关键句子,而不是生成新句子。

TLDR 可以从论文的摘要、引言和结论中生成一句话。它的摘要往往是根据文章文本中的关键短语建立起来的,所以它的受众人群是已经了解论文行话的专业的科研人员。对于普通人来说,阅读起来依旧存在一些难度。但 Weld 表示,该团队正在努力为非专家受众提供更为简单易懂的升级版产品

研究人员还计划将该技术授权给出版商,并将其服务扩展到提供个性化的研究简报,总结某个领域的关键论文。"我们只是到了人工智能可以以人们可以接受的水平生成新颖的摘要的阶段,"Weld 说。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 软件
    +关注

    关注

    69

    文章

    4677

    浏览量

    87062
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267906
收藏 人收藏

    评论

    相关推荐

    OpenAI又打出王炸!一句话生成60秒视频,马斯克:人类认输吧

    电子发烧友网报道(文/梁浩斌)在大年初七,春节假期的尾声,OpenAI突然发布的AI文字生成视频模型Sora被全网刷屏,马斯克甚至感叹“gg Humans”(gg是good game的缩写,在竞技
    的头像 发表于 02-19 09:02 3707次阅读
    OpenAI又打出王炸!<b class='flag-5'>一句话</b>生成60秒视频,马斯克:人类认输吧

    文生视频Pika 1.0爆火!一句话生成视频,普通人也能当“导演”

    几乎不需要任何门槛,用户只需要输入一句话,就可以生成想要的各种风格的视频,并通过简单的描述,更改视频中的形象和风格。   Pika labs官方宣传视频效果图相当惊艳   一句话生成视频,颠覆传统视频制作   Pika成立于今年4月,创始人郭文景和联合创始人兼CTO Ch
    的头像 发表于 12-01 01:08 3641次阅读
    文生视频Pika 1.0爆火!<b class='flag-5'>一句话</b>生成视频,普通人也能当“导演”

    开关电源布线 一句话:要运行最稳定、波形最漂亮、电磁兼容性最好

    开关电源在布线上最大的特点是拓扑引起的高频(高压)强电流与控制级的弱电信号交织在起,首先要保证强电流的存在不干扰电源内部的控制信号,其次要尽量减少对外部的干扰(EMC)。一句话:要运行最稳定、波形
    的头像 发表于 10-28 14:06 983次阅读
    开关电源布线 <b class='flag-5'>一句话</b>:要运行最稳定、波形最漂亮、电磁兼容性最好

    求助,关于TLE2141的供电问题求解

    在TLE2141的DATASHEET中,在供电方面有一句话,Single or Split Supply . . . 4 V to 44 V,此句话不甚明确,虽然DATASHEET中有例子,可证明 此运放可5V单电源供电,我本人仍有疑问,40V单电源供电可否,请各位大拿
    发表于 09-09 06:46

    想把差分信号转为单端信号,不是音频信号,OPA365是否还可以使用呢?

    我想请教下,想把差分信号转为单端信号(频段在100-600KHz),不是音频信号,这款芯片是否还可以使用呢?另:用TINA想仿真OPA365对于所需频段差分信号得的放大效果是否满足实用性,但是搭建不通。可能刚上手,玩不转这款软件。所以想取捷径,问问诸位,我的第一句话可否
    发表于 08-27 06:33

    知网状告AI搜索:搜到我家论文题目和摘要,你侵权了!

    创业团队秘塔AI搜索,被知网给告了!足足28页的侵权告知函,总结一句话就是:贵司的AI搜索,能搜到我家的学术文献题录及摘要数据,且没经我司许可,严重侵权。
    的头像 发表于 08-16 17:47 250次阅读
    知网状告<b class='flag-5'>AI</b>搜索:搜到我家论文题目和摘要,你侵权了!

    如何设计RC去耦的R和C的值?

    如何设计RC去耦的R和C的值,最后一句话的意思是负载电流的变化决定R和C的值,能举个例子怎么计算这个值吗?
    发表于 08-14 07:47

    esp32c3 vdd_spi如何作为gpio11使用?

    看到C3的手册里有这样一句话 当 VDD_SPI 无需为外部供电时,VDD_SPI 亦可作为 GPIO11 使用 请问 怎么设置呢? 在 arduino 中设定 pinMode(11
    发表于 06-17 06:27

    一句话让你理解线程和进程

    今天给大家分享下线程与进程,主要包含以下几部分内容:一句话说明线程和进程操作系统为什么需要进程为什么要引入线程图说明线程和进程的关系一句话让你理解进程和线程进程:是指⼀个内存中运⾏
    的头像 发表于 06-04 08:04 997次阅读
    <b class='flag-5'>一句话</b>让你理解线程和进程

    一句话概括DDR、LPDDR、GDDR的区别

    以DDR开头的内存适用于计算机、服务器和其他高性能计算设备等领域,目前应用广泛的是DDR3和DDR4;
    的头像 发表于 05-10 14:21 5148次阅读
    <b class='flag-5'>一句话</b><b class='flag-5'>概括</b>DDR、LPDDR、GDDR的区别

    AI推理,和训练有什么不同?

    如果要用一句话概括AI的训练和推理的不同之处,我觉得用“台上分钟,台下十年功”最为贴切。话说小明已经和心目中的女神交往数年,在邀约女神出门这件事上积累了大量的经验数据,但却依然捉摸不
    的头像 发表于 04-29 08:06 210次阅读
    <b class='flag-5'>AI</b>推理,和训练有什么不同?

    三层交换机的工作原理 三层交换机不能完全取代路由器的原因

    三层交换机的工作原理可以用一句话概括为:”次路由,多次交换“。
    的头像 发表于 03-29 09:29 648次阅读

    请问AD2428 TX crossbar是个什么功能?

    AD2428 TRM中,描述升采样功能的最后一句话时,提到了个TX crossbar功能,全文搜索crossbar只有这处,这是个什么功能?
    发表于 03-07 07:00

    RS触发器逻辑门组成和逻辑功能表

    RS是由两个或非门组成,而或非门的输出又作为另个或非门的输入。下面说一句对RS触发器理解最重要的一句话:或非门如果有个输入端为1,那么不用考虑另
    的头像 发表于 03-05 17:35 1.1w次阅读
    RS触发器逻辑门组成和逻辑功能表

    一句话证明我是工程师?这不纯纯送分题

    晶振扬兴科技
    扬兴科技
    发布于 :2023年12月05日 18:57:33