金华网站建设制作,seo关键词挖掘工具,做社交网站怎么赚钱,防红链接在线生成笔记整理#xff1a;吕欣泽#xff0c;南京大学计算机科学与技术系#xff0c;硕士研究生。论文连接#xff1a;https://arxiv.org/pdf/1810.13083.pdf发表会议#xff1a;NAACL 2019摘要大多数现代信息提取#xff08;IE#xff09;系统都是作为顺序标记器实现的#… 笔记整理吕欣泽南京大学计算机科学与技术系硕士研究生。论文连接https://arxiv.org/pdf/1810.13083.pdf发表会议NAACL 2019摘要大多数现代信息提取IE系统都是作为顺序标记器实现的并且只模拟本地依赖项。然而非顺序的上下文是改进预测效果的有价值的信息来源。本文介绍GraphIE一个在图上运行的信息抽取框架。该算法通过图形卷积网络在连接的节点之间传播信息利用来改进单词级别的预测从而生成更丰富的表示。本文评估了三个不同的任务文本社交媒体和视觉信息提取结果一致地显示GraphIE 优于最先进的信息抽取模型。模型介绍1. 概览最现代的信息提取IE系统通常被实现为顺序标记器。这样的模型有效地捕捉了在上下文中的本地关系它们利用非本地和非顺序依赖的能力有限。然而在许多应用程序中这种依赖性可以大大减少标记的模糊性从而提高整体提取性能。例如从文档中提取实体时各种类型的非本地情境信息如共同引用和相同的提及可能提供有价值的线索。参见下图其中非本地关系对于区分第二次提及的实体类型至关重要华盛顿即人组织或地点。本文提出了GraphIE这是一个通过自动学习输入空间中本地和非本地依赖关系之间的交互来改进预测的框架。它将图网络和编码器-解码器集成在一起构建了序列标记的体系结构。模型如下。2. 编码一个句子表示为每一个词被表示为一个向量编码公式为如下其中代表隐态0 代表初始隐态为 0 向量代表编码器的参数。图卷积网络过程为如下其中 是要学习的权重是节点 v_i 的度和组合得到第l层的表示。3. 解码解码时隐态的获得如下其中是图卷积网络的输出。标记时使用CRF:标记时使用CRF:实验结果分析1. 文本信息抽取使用CoNLL-2003 和CHEMDNER 数据集实验结果如下。2. 社交媒体信息抽取从Twitter语料库里构造了两个数据集EDUCATION和JOB。实验结果如下。3. 视觉信息抽取数据集来自病人病历由于隐私原因无法公开。实验结果如下 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。