当前位置: 首页 > news >正文

学校网站制作软件做网站推广 需要ftp

学校网站制作软件,做网站推广 需要ftp,网站页面框架设计,岳阳网网有鱼论文笔记整理#xff1a;王中昊#xff0c;天津大学硕士#xff0c;方向#xff1a;自然语言处理。来源#xff1a;AAAI2019论文链接#xff1a; https://doi.org/10.1609/aaai.v33i01.3301297概述知识图谱之间的实体对齐的任务目标是去找到那些在两个不同的知识图谱上表… 论文笔记整理王中昊天津大学硕士方向自然语言处理。来源AAAI2019论文链接 https://doi.org/10.1609/aaai.v33i01.3301297 概述知识图谱之间的实体对齐的任务目标是去找到那些在两个不同的知识图谱上表示现实世界相同的实体。最近人们提出了基于嵌入的模型应用于实体对齐任务。这种模型建立在知识图谱嵌入模型的基础上该模型学习实体嵌入以捕获同一知识图谱中实体之间的语义相似性。而作者提议出一种能够学习嵌入进而捕捉不同知识图谱中实体间相似性的模型。这种模型有助于将不同知识图谱中的实体对齐从而实现多个知识图谱的集成。模型利用知识图谱中存在的大量属性三元组来生成attribute character embeddings。attribute character embeddings基于它们的属性将两个知识图谱上的实体嵌入通过计算实体之间的相似度进而转移到同一空间。与此同时模型也使用传递性规则来进一步丰富实体的属性数目以增强attribute character embeddings。  模型和方法 模型综述该模型框架使用基于嵌入的模型如上图所示。该框架由谓词对齐、嵌入学习和实体对齐三部分模块组成。由于基于嵌入的实体对齐要求两个知识图谱的嵌入关系和实体嵌入落在同一向量空间中。为了使关系嵌入有一个统一的向量空间我们基于谓词相似度即谓词对齐合并了两个知识图谱。谓词对齐模块后文将详细介绍将查找部分相似的谓词例如dbp:bornIn与yago:wasBornIn并使用统一的命名方案例如bornIn来重命名它们。基于这个统一的命名方案我们将G1和G2见上图合并成为G1_2中。然后将合并后的图G1_2分为一组关系三元组Tr和一组属性三元组Ta用于后续的嵌入学习。嵌入学习模块后文将详细介绍利用结构嵌入和属性嵌入共同学习两个知识图谱的实体嵌入。使用上文中生成的关系三元组Tr来进行结构嵌入的学习而使用属性三元组Ta来进行属性嵌入的学习。最初来自G1和G2的实体的结构嵌入由于两个知识图谱中的实体使用不同的命名方案表示因此落入不同的向量空间。相反的从属性三元组Ta中学习到的属性嵌入可以落在同一向量空间中。这是通过从属性字符串中学习字符嵌入来实现的即使属性来自不同的知识图谱我们称之为attribute character embeddings也可以是相似的。然后利用得到的attribute character embeddings将实体的结构嵌入到同一向量空间中使得实体嵌入能够从两个知识图谱中获取实体间的相似性。例如假设我们有三元组lgd:240111203countrylgd:51477和lgd:51477label Germany来自G1以及dbp:kromdorfcountrydbp:Germany和dbp:Germanylabel Germany来自G2。attribute character embeddings允许两个实体lgd:51477和dbp:Germany具有相似的向量表示因为这两个实体具有相似的属性值“Germany”。然后实体lgd:240111203和dbp:kromdorf的结构嵌入也将相似因为这两个实体共享相同的谓词并且有两个具有相似的向量表示的尾部实体lgd:51477和dbp:Germany。一旦我们获得了G1和G2中所有实体的嵌入实体对齐模块后文将详细介绍就会发现每一对h1,h2其中h1∈G1和h2∈G2的相似性得分都高于阈值β。为了进一步提高模型的性能作者所建立的模型使用关系传递性规则来丰富G1和G2中所有实体的属性进而帮助构建更健壮的属性嵌入以计算实体之间的相似性。 1.1 谓词对齐模块 谓词对齐模块通过使用统一的命名方案来重命名两个知识图谱中的谓词从而合并两个KG以便为关系嵌入提供统一的向量空间。事实上谓词有命名约定例如rdfs:label、geo:wgs84pos#lat和geo:wgs84 pos#long。除了命名c约定之外还有部分匹配的谓词例如dbp:diedIn vs.yago:diedIn和dbp:bornInvs.yago:wasBornIn。谓词对齐模块找到这些谓词并使用统一的命名方案例如diedIn和bornIn重命名它们。为了找到部分匹配的谓词作者通过计算谓词URI最后一部分的编辑距离例如bornIn与wasBornIn并将0.95设为相似度阈值。 1.2嵌入学习模块 结构嵌入 作者将嵌入学习更多地集中在对齐的三元组即具有对齐谓词的三元组上将TransE学习用于知识图谱之间实体对齐的结构嵌入。并且通过添加权重α来控制三元组上的嵌入学习。为了学习结构嵌入在作者的模型中最小化了以下目标函数JSE其中Tr是有效关系三元组的集合T′r是损坏关系三元组的集合γ是一个边距超参数countr是关系r的出现次数|T |是KG合并后G1_2中三元组的总数。通常对齐谓词的出现次数高于不对齐谓词因为对齐谓词同时出现在两个知识图谱中因此允许模型从对齐的三元组中学习更多内容。 属性嵌入 就像TransE一样对于属性字符嵌入我们将谓词r解释为从头实体h到属性a的翻译。但是同一个属性a可能以不同的形式出现在两个知识图谱中例如50.9989 vs.50.998888889作为实体的纬度“Barack Obama”vs.“Barack Hussein Obama”作为人名等等我们使用复合函数来编码属性值并将属性三元组中每个元素的关系定义为hr≈faa。这里faa是一个复合函数a是属性值a{c1c2c3…ct}的字符序列。合成函数将属性值编码为单个向量并将类似的属性值映射到类似的向量表示。我们定义了三个组合函数如下Sum compositional function (SUM)。第一个复合函数定义为属性值的所有字符嵌入的总和其中c1、c2、…、ct是属性值的字符嵌入。 LSTM-based compositional function (LSTM)。为了解决SUM问题作者提出了一种基于LSTM的组合函数。此函数使用LSTM网络将字符序列编码为单个矢量。并且使用LSTM网络的最终隐藏状态作为属性值的向量表示其中flstm是由Kimetal定义的LSTM网络2016年。 N-gram-based compositional function (N-gram)。作者进一步提出了一个基于N-gram的组合函数作为解决SUM问题的替代方法。这里作者使用属性值的n-gram组合求和。   其中N表示n-gram组合中使用的n的最大值在作者的实验中n10t是属性值的长度。 为了学习属性字符嵌入作者将以下目标函数JCE最小化其中Ta是来自训练数据集的有效属性三元组而T′a是损坏属性三元组的集合a是G中的属性集合。通过将头实体替换为随机实体或将属性替换为随机属性值将损坏的三元组用作负样本。要注意的是这里的fta是基于头部实体h的嵌入、关系r的嵌入和使用合成函数faa计算的属性值的向量表示的似然性得分。下面要进行结构嵌入与属性字符嵌入的联合学习作者使用attribute character embedding(hce) 通过最小化以下目标函数JSIM将结构嵌入(hse)转移到同一向量空间中这里coshsehce是向量hse和hce的余弦相似性。结构嵌入将基于实体关系捕获两个知识图谱之间实体的相似性而属性字符嵌入将基于属性值捕获实体的相似性。结构嵌入和属性字符嵌入联合学习的总体目标函数是               1.3实体对齐模块 由于结构嵌入和属性字符嵌入的联合学习使得G1和G2的相似实体具有相似的嵌入。因此生成的嵌入可用于实体对齐。我们计算下列实体对齐方程给定一个实体h1∈G1我们计算h1与所有实体h2∈G2之间的相似性。h1hmap是预期的对齐实体对。我们使用相似性阈值β来过滤太不相似而无法对齐的成对实体。  1.4通过传递性规则丰富三元组 尽管嵌入的结构隐式地学习了关系传递信息但是显式地包含这些信息会增加每个实体的属性和相关实体的数量这有助于识别实体之间的相似性。例如给定三元组dbp:EmporiumTowerlocatedIndbp:London和dbp:Londoncountrydbp:England,我们可以推断dbp:EmporiumTower与dbp:England有关系即“locatedInCountry”。实际上这些信息可以用来丰富相关实体dbp:Emporium Tower。作者将一跳传递关系处理如下给定传递三元组h1r1t和tr2t2我们将r1.r2解释为从头实体h1到尾实体t2的关系。因此这些传递三元组之间的关系被定义为h1r1.r2≈t2。通过用r1.r2代替关系向量r也增强了上文提到的嵌入模型的最小化目标函数。实验作者在四个真实的KG上评估了他们的模型包括DBpediaDBPLehmann等人。2015年LinkedGeoDataLGDStadler等人。2012年GeonamesGEO2和YAGOHoffart等人。2013年。作者使用提出的模型将DBP的实体分别与LGD、GEO和YAGO的实体对齐。将模型发现的对齐实体与三个地面真值数据集DBP-LGD、DBP-GEO和DBP-YAGO中的对齐实体进行比较这三个数据集分别包含了DBP和LGD、GEO和YAGO之间的对齐实体。作者使用hitskk110即正确对齐的实体在前k个预测中所占的比例和正确即匹配实体的排名的平均值来评估模型的性能。较高的hitsk和较低的MR表明该模型的性能更好。对于来自DBP的每个实体作者使用公式计算与来自另一个KGLGD/GEO/YAGO的实体的相似性得分。如表1所示作者提出的模型始终优于基线模型基于MR的t检验p0.01。同时MTransE和JAPE依赖于种子排列的数量作者使用黄金标准的30%作为原始文件中建议的种子排列。表1 在作者的attribute character embedding模型中使用N-gram复合函数比使用LSTM或和复合函数获得了更好的性能因为N-gram复合函数在将属性字符串映射到其向量表示时比其他函数更好地保持字符串的相似性。同时由于传递性规则丰富了实体的属性进而更好地提高了模型的性能。为了评估属性字符嵌入在捕获实体间相似性方面的能力作者进一步创建了基于规则的实体对齐模型其中只使用实体标签字符串之间的编辑距离以对齐实体。对于DBP-LGD和DBP-GEO数据集作者添加坐标相似性作为额外的度量因为这两个数据集只包含位置实体。从表2可以看出作者的模型的嵌入结果可以作为一个附加特性添加以增强基于规则的模型的性能。表2 总结针对知识图之间的实体对齐问题作者提出了一种实体结构嵌入与属性字符嵌入相结合的嵌入模型。模型使用属性字符嵌入将实体嵌入从不同的知识图谱转移到相同的向量空间。此外作者采用传递性规则来丰富实体的属性数目以帮助识别基于属性嵌入的实体之间的相似性。作者提出的模型在三对真实世界知识图谱之间的实体对齐方面的hits1始终超过基准50%。  OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。
http://www.pierceye.com/news/535646/

相关文章:

  • 中企动力做网站的优势做招聘网站经营范围
  • 重庆企业网站排名优化方法百度录入网站
  • 做薪酬调查有哪些网站校园二手交易网站设计的原则
  • 建设电子商务网站的方法有?网站架构图
  • 网站运营阶段wordpress首页没有显示文章图片
  • 2个小时学会网站建设手机兼职快递录单员
  • 以前有个自助建设网站东莞路桥投资建设公司招聘
  • 电子游艺网站开发常德seo技术
  • 河北邢台wap网站建设南昌网页制作
  • 山东建设人才网站高端母婴网站模板
  • 物业服务网站建设佛山做网站公司有哪些
  • 企业网站模板中文网站域名名字
  • 在服务器网站上做跳转网页设计代码动漫
  • 科协网站建设的意见合肥哪里有做网页的地方
  • 为企业做网站策划案永康网站推广
  • 做个企业网网站怎么做linux建网站
  • 专业建站公司主要做什么wordpress加入下载标签
  • 韩都衣舍网站建设方案美食网站怎么做dw
  • 电商网站开发 参考文献wordpress验证码注册
  • ic外贸网站建设wordpress和shopex
  • 网站技术制作流程图国内顶尖小程序开发公司
  • 免费网站建设下载优化关键词规则
  • 网站浮动窗口如何做自己怎么做淘宝客网站
  • 石材外贸在哪个网站做网页版 微信
  • 网站开发属于程序员吗sem 优化软件
  • 公司做网站是管理费用小程序官方文档
  • 公司网站推广技巧响水网站设计
  • 徐州本地网站wap页面是什么
  • 网站开发应用价值做套网站多少钱
  • asp.net网站模板免费下载怎么才能访问自己做的网站