网站优化网站建设,上海专业优化排名工具,网站代搭建维护,深圳住房和建设管理局官方网站链接#xff1a;http://anthology.aclweb.org/P/P17/P17-1149.pdf概述在知识库和文本的联合表示中#xff0c;歧义是个困扰的难题。同一个 mention 可能在不同的语境下表述不同实体#xff0c;同一个实体又有多种 mention 表示#xff0c;如下图。本文提出了一个新的表示方… 链接http://anthology.aclweb.org/P/P17/P17-1149.pdf 概述在知识库和文本的联合表示中歧义是个困扰的难题。同一个 mention 可能在不同的语境下表述不同实体同一个实体又有多种 mention 表示如下图。本文提出了一个新的表示方法可以在一个联合空间学习 mention 和实体的表示同时解决歧义问题。模型作者提出了一个 mention sense 的概念每一个 mention 对应一个 mention_sense以表示当前的mention的真正含义。可以看出mention_sense 是和实体一一对应的。作者从 wikipedia 的超链接里提取出 m_l, e_j 的组合即mention超链接到某一实体。对于每一个这种组合作者把它映射到一个 mention_sense 上这样同一实体的 mention 会共享 mention_sense而同一 mention 对应不同实体也会映射到不同的 mention_sense。作者把文本中的 mention 用 mention_sense 代替来进行联合训练。像大图的最右侧部分描述的一样mention_sense 可以看成是文本空间和实体空间的一个链接。联合训练的似然函数由三部分组成均采用 CBOW/skip-gram 的语言模型来得到向量1、实体空间这个方法让共享邻居实体的实体词尽可能相似。2、mention空间这个方法使得指向同一实体且共享上下文的mention_sense尽可能相似。3、文本空间共现的词之间应尽可能相似类似于 word2vec只不过用 mention_sense 代替 mention。 实体链接用上述学出的向量可以进行实体链接的工作。对于每一个实体对所有 mention_sense 做如上计算选出概率值最大的 mention_sense再连接到对应的实体。因为一个句子可能包含多个实体而全局优化代价过大为了方便作者假设实体和实体间独立提出了 L2R从左至右和 S2C从简至繁的逐实体预测的方法。 实验作者进行了自身对比可以看出多实体比单一实体的效果好很多。在实体相关预测和词语相关预测上实体和词语联合学习的方法也比单一学习提升了一些性能。最后是上述实体链接的尝试笔记整理王冠颖浙江大学硕士研究方向为关系抽取、知识图谱。OpenKG.CN中文开放知识图谱简称OpenKG.CN旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。转载须知转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题请注明原标题。点击阅读原文进入 OpenKG 博客。