江苏中盛建设集团网站,静态网站的短处,常州网站制作报价,杭州论坛网论文笔记整理#xff1a;谭亦鸣#xff0c;东南大学博士。来源#xff1a;Knowledge and Information Systems volume 62, pages611–637(2020)链接#xff1a;https://link.springer.com/article/10.1007/s10115-019-01363-0概要本文的核心工作是利用知识结构来衡量知识库… 论文笔记整理谭亦鸣东南大学博士。来源Knowledge and Information Systems volume 62, pages611–637(2020)链接https://link.springer.com/article/10.1007/s10115-019-01363-0概要本文的核心工作是利用知识结构来衡量知识库的不确定性。文章的内容涵盖了以下几个部分1.首先队知识库的知识结构进行介绍2.以包含度特征为基础提出知识结构与知识库之间的依赖以及独立性3.研究给定知识库的不确定性度量并证明该度量方法是以知识库的知识结构为基础4.最后通过实验验证了本文方法的有效性并从统计学的离散型和相关性两个方面做有效性分析。动机与思路作者用自问自答的形式对知识库不确定进行论述为何研究知识库不确定性的度量因为知识库本身具有不确定性。为何研究知识库的知识结构因为知识结构有助于从知识库中发现知识。为何使用知识结构衡量知识库的不确定性因为很难对比给定知识库的不确定性值原文是“This is because it is hard to compare the size of measure values of uncertainty for a given knowledge base.”这句话没看明白我的理解是由于不同知识库的实体/关系规模差异较大直接对知识库做不确定性衡量得到的量化结果不适合不能够反映出不同知识库之间的不确定性差异因此要使用一个高层特征知识结构来代表并对不确定性的量化衡量做一个类似归一化的效果。而且如果获取到两个知识结构之间的依赖关系可以利用这个关系参与比较知识库之间的不确定性差异。概念与定义首先作者使用矩阵M对于二元关系R进行了如下描述我们可以将矩阵中的x理解为知识库中的实体R表明实体之间的关系当R(xi, xj) 1时表明x1x2之间存在关系R.可以看到R在矩阵中可能构成三种关系场景令实体集合为Ux, y∈U1.xRx Reflexive2.xRy且yRxSymmetric3.xRyyRz且xRzTransitive当R满足上述三种情况时被称为“equivalence relation on U”,R∗(U)则代表所有equivalence relation on U”的集合的族我理解为子集的集合对于一个equivalence relation R通过以下公式可以抽取实体集U在R上对应的类别子集因此利用equivalence relation R可以对U进行类别划分即故作者在这里提出定义2.1当R是U的一个equivalence relation那么(U, R)被视作一个Pawlak近似空间这里需要对粗糙集的概念做一个初步了解在此基础上X∈2UU的所有子集的族的近似上下界可以通过以下公式定义2.2 当R∈2R*(U)时R*(U)指U上所有的equivalence relation的集合(U, R)可以表示一个知识库举个栗子来看可以看到这个知识库里有6个实体4种关系对应得到了四组矩阵。因此对应可以得到知识库对应的近似空间的上下界知识结构定义对于一个知识库(U, R)对于r∈R可以通过以下公式描述r的知识结构因此整个知识库的知识结构为对于两个知识库(U, P)与(U, Q)当则知识结构之间的依赖性与独立性参数在前文均已介绍过这里不再赘述Inclusion degree是一种衡量inclusion relationship质量的标准以下定义给出了两个集合向量之间的Inclusion degree3.9取值范围及定义3.10计算方式作者描述了一个计算inclusiondegree的例子1.首先给出两个知识库的知识结构2.计算inclusiondegree的过程为模型与算法知识库粒度检测首先给出粒度定义 粒度的量化值如以下公式得到作者在原文中对获取过程做了证明并提出定理作者认为知识粒化符合粒运算特征并且从不同的层次重新定义了知识和信息。粒度测量值随类别增加而递减。缺陷在于无法区分粒度相似但结构不同的知识库。知识库的熵检测也是先给出了定义及知识熵的计算方式可以看到这里的熵是完全基于知识结构的定理4.8并且知识结构的关系与熵的关联性如下原文附带了证明过程这里还给出知识结构对应的粗糙熵定义及计算过程知识库的知识量注意知识量是E上面的粗糙熵是Er一些属性实验与结果实验数据为了验证上述测量方式对于知识库不确定性的量化衡量能力作者在三个UCI数据集上进行了实验数据集的统计信息如下表实验结果首先对于三个数据集均获取到上一节介绍过的四种测量方式如下以Nursery为例|U|12960|A|8Piind({ai})(i 1,2,…,8), Pi{P1,P2,…,Pi}(i 1,2,…,8)图34描述了这三种不同知识库不同不确定性的测量结果从各个指标的散度来看知识量在衡量知识库不确定上表现出了更好的性能。 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。