建设电商网站哪个平台比较好,长沙网站设计哪家专业,字体怎么下载到wordpress,快抖霸屏乐云seo众包实体消解实体消解#xff08;Entity Resolution#xff0c;简称ER#xff09;旨在发现不同知识图谱中指称真实世界相同对象的实体。众包实体消解#xff08;Crowd ER#xff09;在使用机器的基础上#xff0c;还使用人来完成实体消解任务。众包实体消解的一个常见流程… 众包实体消解实体消解Entity Resolution简称ER旨在发现不同知识图谱中指称真实世界相同对象的实体。众包实体消解Crowd ER在使用机器的基础上还使用人来完成实体消解任务。众包实体消解的一个常见流程如下图所示Waldo: AnAdaptive Human Interface for Crowd Entity Resolution. SIGMOD 2017 在众包实体消解中存在一系列关键问题亟待解决包括1如何呈现一个实体消解任务2如何选择合适的人来完成任务3如何在给定预算限制下挑选任务等等。论文作者发现当前研究很少关注第1个问题即如何通过呈现一些关键信息例如实体的重要属性和取值来帮助单个人更高效和精准地完成一个实体消解任务。 一个例子论文作者关注多实体消解任务multi-entityresolution简称MER下图展示了一个包含3个实体的多实体消解任务它们拥有了相似的属性和取值有待人来完成消解。相关工作基于列表的多实体消解任务呈现方式类似于传统搜索引擎。基于成对的多实体消解任务呈现方式每次仅比较两个实体并对齐它们间的相似属性。考虑到属性和取值的数量可能很多上述两类方法常通过生成摘要来提高人的消解效率。然而这两类方法对于多实体消解任务而言也均存在一些不足。例如由于缺乏直接对比基于列表的方法需要人在心里记录并比较不同实体又如基于成对的方法虽然能使人更加专注两个实体的比较但是可伸缩性差。更为重要的是这两类方法在形成列表或成对的过程中会丢失实体消解结果间的传递性和聚类性等。 本文方法论文作者提出了一种基于对比表comparativetable的多实体消解任务呈现方法将实体和重要属性分别组成表的行和列头并将重要取值填入表单元中。拟解决的关键问题是实体的属性和取值的异构性及规模性与有限的表格呈现空间之间的矛盾。方法框架如下图所示包括3个主要步骤全体属性匹配包括属性间相似度计算和属性团生成两个子步骤。优良性评估考虑了属性团的判别性、丰富性、语义性和多样性4个特征。对比表生成包括属性团的选择和取值的选择两个子步骤。 下图展示了根据上述例子生成的一个多实体消解任务对比表。实验结果论文作者从10个流行领域各选取了25个DBpedia实体作为种子并通过维基百科消歧页面为每个种子实体随机选取2 ~ 4个Freebase、Wikidata和YAGO实体再从中随机选择出10个实体构成一个多实体消解任务。共计250个任务2500个实体指称804个真实世界对象。实验从3个方面检验了基于对比表的方法有效性包括1全体属性匹配的准确性2属性团排序的有效性3通过雇佣60位研究生进行实操从效率、精度和打分3个方面与基于列表和基于成对的两个代表性方法进行了比较。 [1] Jiacheng Huang, Wei Hu*, Haoxuan Li, Yuzhong Qu. Automated Comparative Table Generation for Facilitating Human Intervention in Multi-Entity Resolution. In: ACM SIGIR Conference on Research and Development in Information Retrieval. 585–594, 2018-- End --实验室介绍南京大学万维网软件Websoft研究组在瞿裕忠教授的带领下长期从事知识图谱语义网及相关技术的研发研究组成员包括胡伟副教授、程龚副教授以及30余位博士和和硕士研究生近期的研究方向主要包括智能问答、知识融合和语义搜索。联系方式胡伟whunju.edu.cn微信号whu1982网站http://ws.nju.edu.cnOpenKG.CN中文开放知识图谱简称OpenKG.CN旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。