使用知识图谱作为输入的表征，研究一个端到端的graph-to-text生成系统-电子发烧友网

背景

生成表达复杂含义的多句文本需要结构化的表征作为输入，本文使用知识图谱作为输入的表征，研究一个端到端的graph-to-text生成系统，并将其应用到科技类文本写作领域。作者使用一个科技类文章数据集的摘要部分，使用一个IE来为每个摘要提取信息，再将其重构成知识图谱的形式。作者通过实验表明，将IE抽取到知识用图来表示会比直接使用实体有更好的生成效果。

graph-to-text的一个重要任务是从 Abstract Meaning Representation (AMR) graph生成内容，其中图的编码方法主要有graph convolution encoder，graph attention encoder，graph LSTM，本文的模型是graph attention encoder的一个延伸。

数据集

作者构建了一个Abstract GENeration Dataset(AGENDA)，该数据包含40k个AI会议的论文标题和摘要。对于数据集中的每篇摘要，首先使用SciIE来获取摘要中的命名实体及实体之间的关系(Compare, Used-for, Feature-of, Hyponymof,Evaluate-for, and Conjunction)，随后将得到的这些组织成无连接带标签图的形式。

模型

GraphWriter模型总览

编码器

构建图

将之前数据集中的无连接带标签图，转化为有连接无标签图，具体做法为：原图中的每个表示关系的边用两个节点替代，一个表示正向的关系，一个表示反向的关系；增加一个与所有实体节点连接全局向量节点，该向量将会被用来作为解码器的初始输入。下图中表示实体节点，表示关系，表示全局向量节点

最终得到的有连接，无标签图为G=(V,E)，其中V表示实体/关系/全局向量节点，E表示连接矩阵(注意这里的G和V区别上述图中的G和v)。

Graph Transformer

Graph Transformer由L个Block Network叠加构成，在每个Block内，节点的嵌入首先送入Graph Attention模块。这里使用多头自注意力机制，每个节点表征通过与其连接的节点使用注意力，来得到上下文相关的表征。得到的表征随后再送入正则化层和一个两层的前馈神经网络层。最后一层的得到的即表示上下文后的实体，关系，全局向量节点。

解码器

在每个时间步t使用隐藏状态来计算图和标题的上下文向量和，其中通过使用多头注意力得到，

也通过类似的方式得到，最终的上下文向量是两者的叠加。随后使用类似pointer-network的方法来生成一个新词或复制一个词，

实验

实验包含自动和人工评估，在自动评估中，GraphWriter代表本篇文章的模型，GAT中将Graph Transformer encoder使用一个Graph Attention Network替换，Entity Writer仅使用到了实体和标题没有图的关系信息，Rewriter仅仅使用了文章的标题，

从上图可以看到，使用标题，实体，关系的模型（GraphWriter和GAT)的表现要显著好于使用更少信息的模型。在人工评估中，使用Best-Worst Scaling，

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据集

数据集

+关注

关注
4

文章
1208

浏览量
24743
Transformer

Transformer

+关注

关注
0

文章
144

浏览量
6026
知识图谱

知识图谱

+关注

关注
2

文章
132

浏览量
7717

原文标题：【论文解读】基于图Transformer从知识图谱中生成文本

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

端到端自动驾驶技术研究与分析

编者语：「智驾最前沿」微信公众号后台回复：C-0450，获取本文参考报告：《端到端自动驾驶行业研究报告》pdf下载方式。自动驾驶进入2024年，端

发表于 12-19 13:07 •238次阅读

黑芝麻智能端到端算法参考模型公布

黑芝麻智能计划推出支持华山及武当系列芯片的端到端算法参考方案。该方案采用One Model架构，并在决策规划单元引入了VLM视觉语言大模型和PRR行车规则的概率化表征子模块，进

发表于 12-03 12:30 •334次阅读

爆火的端到端如何加速智驾落地？

编者语：「智驾最前沿」微信公众号后台回复：C-0551，获取本文参考报告：《智能汽车端到端技术研究报告》pdf下载方式。 “端

发表于 11-26 13:17 •327次阅读

连接视觉语言大模型与端到端自动驾驶

端到端自动驾驶在大规模驾驶数据上训练，展现出很强的决策规划能力，但是面对复杂罕见的驾驶场景，依然存在局限性，这是因为端到

发表于 11-07 15:15 •286次阅读

端到端测试用例怎么写

编写端到端测试用例是确保软件系统从头到尾能够正常工作的关键步骤。以下是一个详细的指南，介绍如何编

发表于 09-20 10:29 •502次阅读

如何判断同相输入端和反相输入端

和两个输入端口，即同相输入端（Non-inverting Input）和反相输入端（Invert

发表于 07-31 10:54 •2370次阅读

单端输入和双端输入的区别是什么

信号通常连接到电路的一个端点，而另一个端点则接地或接参考电压。 1.1 单端输入的原理单端

发表于 07-31 10:50 •2823次阅读

与非门的闲置输入端如何处理

在数字电路设计中，与非门（NAND gate）是一种基本的逻辑门，它具有两个或多个输入端和一个输

发表于 07-30 14:47 •1847次阅读

三星电子将收购英国知识图谱技术初创企业

在人工智能技术日新月异的今天，三星电子公司再次展现了其前瞻性的战略布局与技术创新实力。近日，三星正式宣布完成了对英国领先的人工智能（AI）与知识图谱技术初创企业Oxford Semantic Technologies的收购，此举标志着三星在提升设备端AI能力、深化个性化用

发表于 07-18 14:46 •547次阅读

知识图谱与大模型之间的关系

在人工智能的广阔领域中，知识图谱与大模型是两个至关重要的概念，它们各自拥有独特的优势和应用场景，同时又相互补充，共同推动着人工智能技术的发展。本文将从定义、特点、应用及相互关系等方面深入探讨知识图谱与大模型之间的关系。

发表于 07-10 11:39 •1113次阅读

比较器输入端和输出端的关系

比较器是一种电子设备，用于比较两个电压或电流信号的大小。比较器的输入端和输出端之间的关系是其核心功能之一

发表于 07-10 10:39 •2524次阅读

差分放大电路单端输入和双端输入的区别

端输入差分放大电路是指只有一个输入端的差分放大电路。其主要特点是电路结构简单，易于实现，但

发表于 07-08 14:54 •3234次阅读

佐思汽研发布《2024年端到端自动驾驶研究报告》

端到端自动驾驶是直接从传感器信息输入（如摄像头图像、LiDAR等）到控制命令输出（如转向、加减速等）映射的

发表于 04-20 11:21 •3404次阅读

利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统（下）

对于语言模型（LLM）幻觉，知识图谱被证明优于向量数据库。知识图谱提供更准确、多样化、有趣、逻辑和一致的信息，减少了LLM中出现幻觉的可能性。

发表于 02-22 14:13 •1239次阅读

ttl门多余的输入端如何处理 ttl多余的输入端可以悬空吗

不同的方式进行处理，但悬空连接并不是推荐的做法。悬空连接是指将多余的输入端保持未连接，也就是断开输入信号。尽管这样做可能不会对系统造成直接的损害，但它可能导致

发表于 02-18 16:26 •3272次阅读