做公司网站每年多少钱,宁波建设局网站,协同办公系统,国内app开发公司笔记整理#xff1a;张清恒#xff0c;南京大学计算机科学与技术系#xff0c;硕士研究生。论文链接#xff1a;https://people.eng.unimelb.edu.au/jianzhongq/papers/AAAI2019_EntityAlignment.pdf发表会议#xff1a;AAAI 2019摘要近来#xff0c;针对跨知识图谱… 笔记整理张清恒南京大学计算机科学与技术系硕士研究生。论文链接https://people.eng.unimelb.edu.au/jianzhongq/papers/AAAI2019_EntityAlignment.pdf发表会议AAAI 2019摘要近来针对跨知识图谱KGs的实体对齐任务研究者提出并改进了多种基于embedding的模型。这些模型充分利用实体与实体之间的关系以得到实体之间的语义相似度换言之这些模型更关注于关系三元组relationship triple。本文发现KG中存在着大量的属性三元组attribute triple本文提出的模型利用属性三元组生成 attributecharacter embeddings使其帮助不同KG中的实体映射到同一空间中。与此同时模型还使用传递规则进一步丰富三元组。实验结果表明相比于现有方法本文提出的模型在实体对齐任务上取得了较大的提升。模型介绍1. 概览如图1所示该模型由三个核心部分组成分别是谓词对齐predicate alignment、嵌入学习embedding learning和实体对齐entity alignment。2. Predicate Alignment该模块通过重命名潜在对齐的谓词将两个KG合并成一个KG。通过计算谓词的名称URI的最后一部分相似度发现潜在对齐的谓词对然后使用统一的命名格式将其重命名。例如将对其的谓词对“dbp:bornIn”和“yago:wasBornIn”重命名成“:bornIn”。3. Embedding Learning3.1 Structure EmbeddingStructureembedding模块采用TransE实现与TransE不同的是模型希望更关注已对齐的三元组也就是包含对齐谓词的三元组。模型通过添加权重来实现这一目的。Structure embedding的目标函数如下其中count(r) 是包含的三元组的数量表示合并之后的三元组集合。3.2 Attribute Character Embedding与 structure embedding 一样attribute character embedding 也借鉴了 TransE 的思想把谓词作为头实体与属性值之间的转换媒介。但与 structure embedding 不同的是对于相同含义的属性值在不同的KG中表现形式存在差别。因此本文提出了三种属性值组合函数。在组合函数编码属性值之后模型希望属性三元组满足 hr≈f_a(a)其中 f_a(a) 是组合函数表示属性值的字符串 a{c_1,c_2,c_3,…,c_t}。三种组合函数如下1. Sum compositional functionSUM2. LSTM-based compositional functionLSTM3. N-gram-based compositional functionN-gramAttribute character embedding 模块的目标函数如下3.3 Joint Learning of Structure Embedding and Attribute Character Embedding本文提出的模型旨在使用attribute character embedding h_ce 帮助structure embedding h_se 在同一向量空间中完成训练联合训练的目标函数如下本文提出的模型的整体目标函数如下4. Entity Alignment在经过上述训练过程之后来自不同KG的相似的实体将会有相似的向量表示因此可通过获得潜在的实体对齐对。此外模型设定相似度阈值来过滤潜在实体对齐对得到最终的对齐结果。5. Triple Enrichment via Transitivity Rule本文发现利用传递关系可以丰富三元组从而提升实体对齐效果。给定三元组 〈h_1,r_1,t〉 和三元组 〈t,r_2,t_2〉可将 作为头实体 h_1 和 h_2 尾实体的关系使其满足。实验分析1. 数据集本文从 DBpedia (DBP)、LinkedGeoData (LGD)、Geonames (GEO) 和 YAGO 四个 KG 中抽取构建了三个数据集分别是DBP-LGD、DBP-GEO和DBP-YAGO。具体的数据统计如下2. 实体对齐结果本文对比了三个相关的模型分别是 TransE、MTransE 和 JAPE。试验结果表明本文提出的模型在实体对齐任务上取得了全面的较大的提升在三种组合函数中N-gram函数的优势较为明显。此外基于传递规则的三元组丰富模型对结果也有一定的提升。具体结果如下3. 基于规则的实体对齐结果为了进一步衡量 attribute character embedding 捕获实体间相似信息的能力本文设计了基于规则的实体对齐模型。本实验对比了三种不同的模型以label的字符串相似度作为基础模型针对数据集特点在基础模型的基础之上增加了坐标属性以此作为第二个模型第三个模型是把本文提出的模型作为附加模型与基础模型相结合。具体结果如下4. KG补全结果本文还在KG补全任务上验证了模型的有效性。模型主要测试了链接预测和三元组分类两个标准任务在这两个任务中模型也取得了不错的效果。具体结果如下OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。