当前位置: 首页 > news >正文

设计公司做网站价格图片网站收录

设计公司做网站价格,图片网站收录,电商设计外包,初中学校网站如何做本文转载自公众号#xff1a;南大Websoft。相关搜索#xff08;Relevance Search#xff09;是信息检索中的一个经典问题#xff0c;相关搜索是指给定一个查询实体#xff0c;返回与其相关度最高的实体#xff08;一个类似的问题Similarity Search#xff0c;一般来说指… 本文转载自公众号南大Websoft。相关搜索Relevance Search是信息检索中的一个经典问题相关搜索是指给定一个查询实体返回与其相关度最高的实体一个类似的问题Similarity Search一般来说指相关搜索的一个特例即只返回与查询实体同类型的相关实体。相关搜索面临的一个主要问题是搜索中的歧义性即不同的用户对于“相关性”有着不同的理解和偏好。当前的一些方法已经能够通过要求用户提供例子的方式在一些schema较为简单的图谱如DBLP, linkedMDB等上完成对相关搜索的消歧然而当处理一些更复杂的图谱时如DBpedia, YAGO等因为效率问题这些方法很难被直接应用。本文提出了一种基于启发式搜索的算法RelSUE能够有效地在schema-rich的知识图谱上进行搜索实验表明RelSUE在我们构建的benchmark数据集上能够比其他state-of-art的方法取得更好的效果。Background知识图谱是由实体和边实体间的二元关系构成的高度结构化的数据这样的数据中蕴含了大量可以被机器所“理解”的语义信息。两个实体间相关性的语义信息通常可以通过不同元路径meta path即顶点均为type边为property的路径的加权组合来刻画不同的组合即体现了不同的语义。例如下图中 连接实体Frank Oz以及Kevin Kline的元路径包括不同的元路径组合可以体现不同的偏好例如如果我们只以一条元路径iii作为相关性的语义那么上图中以Frank Oz作为查询实体符合这种相关性的目标实体只有Kevin Kline一个。可以预见不同的用户对于相关性都会有一定不同的理解或者某一特定场景下的偏好所以我们需要一种有效的方式来捕捉到不同用户或搜索用例的主观偏好目前一种主流的框架是要求用户除了输入查询实体以外再提供几个预期结果的例子然后系统根据这些例子自动地生成一种能够准确刻画例子与查询实体间相关性的加权的元路径组合。加权元路径组合通常有两步组成第一步首先定位出一些promising的元路径第二步基于某些统计或学习的方法自动地为这些路径赋予权重。RelSUE同样沿用了这一技术路线。Approach在过去的方法中第一步元路径的定位可以简单地通过穷举或者用户指定等方式完成然而这些方法往往只能应用于一些仅包含几种不同type以及几种不同property的schema-simple图谱中对于DBpedia645 property453 type或者YAGO37 property, 536,648 type这种包含大量type即property的图谱则不再适用——人工挑选元路径或者穷举连接实体间的所有元路径都是不现实的一方面本身元路径的数量是个问题另一方面进一步对所有选出来的元路径分配权重也是一个问题。所以我们需要一种更有效地方式来对元路径进行选择RelSUE正是为了解决如何在schema-rich的图谱中准确并快速地识别出能够刻画查询实体与例子实体间相关性的元路径。本文共提出了两种不同的算法RelSUE及RelSUE-e。RelSUE-e首先基于双向BFS穷举所有的连接查询实体与例子的元路径给定直径内然后根据我们设计的significance函数为每一个元路径进行打分排序选出打分最高的K条元路径作为目标元路径集合。可以发现RelSUE-e仍然需要先穷举所有元路径再进行选择虽然选择最优的K条元路径可以保证后续的权重分配能够有效进行但是穷举所有路径的代价仍然非常巨大且设定最大路径长度的方式也十分不灵活具有很大的局限性例如对于YAGO只能够做到穷举所有两步的元路径3步的速度就已经无法接受意味着所有3步即以上的相关性语义都会被忽视。为了应对以上这些缺陷本文进一步提出了基于启发式搜索的方法RelSUE。在RelSUE的启发式搜索框架中搜索从查询实体展开一步步扩展至所有例子实体都被某K条元路径连接。搜索空间树结构扩展的优先级基于两点考虑1当前结点所处的潜在的元路径的长度可以通过当前结点与查询实体的距离以及当前结点与例子实体间的距离来估算因为搜索是从查询实体出发所以当前结点与查询实体的距离是已知的而与例子实体的距离我们通过distance oracle来计算2当前结点的度数度数越大的点往往意味着包含的信息较少通过度数来作为衡量信息量的指标也是一种常见的做法此外为了避免启发式搜索找到一些过长的路径我们再对1中估计的路径长度加上一个衰减因子β∈[0,1]即在原有打分的基础上再乘上β^L其中L为估计的元路径长度。βL其中L为估计的元路径长度此外对于RelSUE即RelSUE-e本文的搜索都做了一些针对避免选出冗余元路径的优化如果两条元路径对应的具体路径相同则视为冗余。有了这些路径以后那么就可以进行到background中所介绍的算法的第二步了。两种不同版本的RelSUE都通过线性SVM学习各个元路径的权重每个元路径都对应一个特征至于为什么用SVM没什么特别的理由也不是本文的贡献所在。Benchmark为了进行对比实验本文在两个数据集上DBpedia, YAGO分别人工标注了4组查询基于对应语义的元路径数量、长度等纬度区分。Evaluation实验结果表明RelSUE在两个不同数据集上都显著好于现有的方法。RelSUE的源码及用到的查询可以访问 http://ws.nju.edu.cn/relevance/relsue/.OpenKG.CN中文开放知识图谱简称OpenKG.CN旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。
http://www.pierceye.com/news/311406/

相关文章:

  • 网站做315认证广州中医药资源门户网站
  • 线上营销网站设计网站着陆页有多少个
  • 天津通用网站建设方案聊城做网站的地方
  • 政务网站建设合同dw个人网站模板下载
  • 广州网站优化服务商企业网站建设一站式服务
  • 蓝海电商怎么做广州短视频seo哪家好
  • 泸州住房和城乡建设厅网站怎么自己做微网站吗
  • 做网站上传图片自己怎么建设网站首页
  • 西安空调销售网站建设wordpress 谷歌地图
  • 网站建设投标书范本wordpress防广告屏蔽
  • 设计个人网站的步骤建设工程合同无效的情形有哪些
  • 网站竞争对手的选定一般参考什么标准的建设网站长沙
  • 通州个人做网站营销型网站建设开发
  • 乌海市网站建设基于asp的网络课程网站开发
  • 关掉自己做的网站网页设计与制作服务公司
  • 视频相亲网站开发成本分类信息网站推广的意义
  • 域名和网站网站开发项目视频
  • 色流网站怎么做东营建筑信息网
  • 做能支付的网站贵吗网络安全工程师考证
  • 下载类网站开发条件环球资源网成立时间
  • 客户如何找到做网站宣传的律师免费虚拟主机空间
  • 点击网站出现微信二维码的链接怎么做网架制造厂
  • 服装网站建设环境分析一家专门做房产特卖的网站
  • 网站推广方式方法品牌建设的阶段和步骤是什么
  • 游戏开发平台seo的定义
  • 北京住房和城乡建设部网站官网可信赖的购物网站建设
  • 网站百度一直没有收录热狗网站关键词优化
  • 视频网站开发价格本地app开发公司电话
  • 网站设计风格介绍北京市建设工程信息网如何登录
  • 怎么创建一个属于自己的网站怎么制作做网站