当前位置：首页 > news >正文

wordpress阿里百秀5.2广州网站排名专业乐云seo

news 2025/12/20 12:46:26

wordpress阿里百秀5.2,广州网站排名专业乐云seo,网站搭建素材群,互联网全媒体广告代理文章目录北大基因本体论分子通路KEGGGO注释分子通路鉴定关于同源相似性 b站链接#xff1a;北大课程概述了当前生物信息学领域中几个重要的概念和工具#xff0c;介绍基因本体论#xff08;Gene Ontology, GO#xff09;、分子通路知识库KEGG#xff08;Kyoto Encyclo… 文章目录北大基因本体论分子通路KEGGGO注释分子通路鉴定关于同源相似性 b站链接北大课程概述了当前生物信息学领域中几个重要的概念和工具介绍基因本体论Gene Ontology, GO、分子通路知识库KEGGKyoto Encyclopedia of Genes and Genomes以及分子通路鉴定和GO注释的过程。首先从北京大学生物信息学团队的研究工作讲起解释了基因本体论的框架它是一套用于表示基因产品属性的控制词汇表。然深入探讨了KEGG数据库如何系统地整合了生物化学通路和分子交互网络的信息。此外还探讨了GO注释的重要性它是指将基因本体论的术语分配给基因产品以描述其特性的过程。文章解释了分子通路的鉴定如何帮助科学家理解复杂的生物学过程和疾病机理。北大基因本体论当时不同的生物测序同源基因对不上于是大家商讨着确定一套体系在信息科学中ontology 是对特定领域的概念和概念之间关系的一种规范描述。它通常使用共享词汇来定义领域内的概念类型、属性以及这些概念之间的关系。简单来说它是一种数据模型用于组织和整合信息使其可查询、可分析。在哲学中ontology 是研究存在本质、变化、实在性以及存在的基本类别及其相互关系的领域。它探讨了现实和存在的基础框架以及如何理解世界的本质。通信Communication 本体可以帮助确保不同团队或不同学科领域之间的无歧义沟通。举例来说在各种基因组项目中不同研究组对基因功能的注释可能各不相同。使用本体这些注释可以统一标准化确保所有人对同一术语有相同理解。计算Computation 本体使知识可以以计算机可处理的形式表示这意味着文献和数据可以结构化使得计算机程序能够自动执行分析。例如研究人员可以编写程序来查询和分析基因或蛋白质的功能这一过程由本体中定义的结构化知识支持。模式发现Discovery of Patterns 本体还可以用来发现更大规模的模式和关联。例如研究人员可以通过本体来识别涉及特定基因集的更广泛的功能分类或代谢途径从而提供一个从局部到整体的视角。这就像从鸟瞰视角看问题而不仅仅是从地面水平视角看问题。 Gene Ontology GO 从刚开始的三家到现在有二十多家机构参与三个部分这张幻灯片介绍了基因本体论Gene Ontology, GO中的三个主要类别分子功能Molecular Function指的是基因产品如蛋白质的基本活动或任务比如特定的生化活动。例如某个蛋白质可能具有碳水化合物结合的功能或ATP酶活性。生物过程Biological Process涉及多个分子功能的集合这些集合合作实现某个宽泛的生物目标或目的如细胞分裂有丝分裂或嘌呤代谢。细胞组分Cellular Component特定的细胞位置或复杂体如亚细胞结构、位置或大分子复合体。这可能包括核、端粒或RNA聚合酶II整体等。使用基因本体论Gene Ontology, GO来描述与色素形成pigmentation相关的生物过程的一个例子 GO提供了一个用于描述基因功能和相关生物学特性的标准化词汇。这个系统中生物过程、分子功能和细胞组分是通过有向无环图Directed Acyclic Graph, DAG的形式展现的其中节点表示GO术语而边表示这些术语之间的关系。在这个例子中每个方框代表一个GO术语这些术语描述了色素形成的不同方面例如色素形成过程发育期间的色素形成调控色素代谢过程箭头表示的是不同术语之间的关系比如某个过程是另一个过程的一部分或者一个过程是另一个过程的调控正调控或负调控。GO的这种层级结构和术语间的关系有助于研究人员精确地描述和理解基因产物的功能和它们在生物学中的作用。如何将像上面的图**有向无环图**存储进电脑几种存储格式 OBO File Format [Term]idnameNamespace(三大类)defsynonym 同义词简称Is_a 从属于哪些更大的类别 XML Go:term go:accessiongo:namego:synonymgo:definitiongo:isaGo:dbxref. 其他数据库如果也存在就给出其他数据库的链接三种relationship is apart ofregulates 这样的推断规则就让计算机比较方便的处理目前的GO的规模2018年可以在官网搜索分子通路KEGG Main types of biological pathways: Metabolic pathways添加原材料食物和氧气转化成产品能量、生长和维修所需的分子并分配到身体的各个部分。Gene regulation pathways根据外界/自身的情况调节哪些基因多表达一些哪些少表达一些。确定哪些工厂基因应当在什么时候开工生产多少商品蛋白质和RNA Signal transduction pathways信号转导帮助城市的各个部分细胞根据收到的消息信号分子做出反应调整各自的活动最完善的是代谢相关的通路每一个pathway也会链到其他的pathway 重要的就是interactions PPI 磷酸化Phosphorylation一个蛋白质酶向另一个蛋白质添加磷酸基团通常导致被磷酸化的蛋白质活性的增加或减少。去磷酸化Dephosphorylation磷酸基团从蛋白质上移除这个过程通常是由另一类酶执行的可以逆转磷酸化的效果。泛素化Ubiquitination将泛素一种小蛋白质附加到目标蛋白质上通常标记蛋白质进行降解。糖基化Glycosylation添加糖基团到蛋白质上这可以影响蛋白质的稳定性、位置和功能。甲基化Methylation添加甲基团到蛋白质上这种修改可以影响蛋白质的活性或相互作用。激活Activation使蛋白质变得活跃或增强其活性。抑制Inhibition降低蛋白质的活性或完全停止其功能。间接效应Indirect effect一个蛋白质对另一个蛋白质产生的非直接作用比如通过影响一个中间分子。状态变化State change蛋白质状态的改变例如从不活跃状态到活跃状态。结合/联合Binding/Association两个或多个蛋白质形成稳定的复合物。解离Dissociation蛋白质复合物的分离。复合物Complex两个或多个蛋白质通过结合形成的稳定结构。 Gene expression relations 酶之间的反应 KEGG Pathway File KGML格式 KEGG Orthology (KO) KEGG的一个数据库存储“KO”号主要是对于不同物种中具有相似功能基因的标识符更多的是针对基因KO 提供了一个标准化的方法来标识和分类这些基因和蛋白质并将它们与 KEGG Pathways 中描述的特定生物化学过程相关联。每个 KO 都是一个编码特定分子功能的基因或蛋白质的集合在不同物种中执行相同功能的基因或蛋白质会被分配相同的 KO 编号。在 KEGG Pathways 的上下文中可以使用 KO 来标识途径中涉及的特定基因或蛋白质这有助于跨物种比较途径成分。这种关联是双向的一个特定的 KO 可能参与多个不同的途径而一个途径可能涉及多个不同的 KO。 KO vs GO 基因本体论Gene Ontology, GOGO 为基因产品主要是蛋白质的功能提供了一个结构化的、动态更新的控制词汇。GO 将基因产品的功能描述为属于三个不同领域的属性生物过程biological process、分子功能molecular function和细胞组分cellular component。GO 更多关注单个基因产品的特定功能以及它们在细胞内外的位置。KEGGKEGG 关注的是基因产品参与的整体生物化学途径和网络。KEGG 提供了对这些网络的图形表示强调了不同基因和蛋白质如何协同工作影响生物学功能。KO 系统是 KEGG 用来标准化和整合这些信息的方式侧重于跨物种的功能比较。 GO注释通过实验证据并且人工review过的通过计算分析并通过人工review的 ISO (Inferred from Sequence Orthology) 这是当一个基因产品的功能被推断出与其他已知功能的基因产品有序列同源性时使用的。通常涉及比较进化上相关物种之间的基因。ISA (Inferred from Sequence Alignment) 通过序列比对的方法推断功能。如果一个未知功能的蛋白质与已知功能的蛋白质序列对齐那么未知蛋白质可能具有类似的功能。ISM (Inferred from Sequence Model) 通过比对特定的序列模式或序列特征如保守域或基序预测功能。ISS (Inferred from Sequence or Structural Similarity) 当一个基因产品由于序列或结构相似性被推断具有某种功能时使用。这可以基于序列比对或三维结构的比较。IGC (Inferred from Genomic Context) 根据基因在基因组中的位置来推断功能例如在同一操作单元中的基因或基因的邻近性可能参与相同的代谢途径或生物过程。IBA (Inferred from Biological aspect of Ancestor) 当一个功能从一个祖先物种中推断出来并且被认为在当前物种中仍然存在时使用。IBD (Inferred from Biological aspect of Descendant) 如果一个功能可以在下游的物种中观察到并且这种功能被推断在共有的祖先物种中存在就会使用这种方法。RCA (Inferred from Reviewed Computational Analysis) 功能推断是基于经过审查的计算分析可能涉及多种生物信息学工具和方法。IKR (Inferred from Key Residues) 相反的推断如果序列差不多但是缺少了关键的残基那么就排除该序列具有该功能IRD (Inferred from Rapid Divergence) 当一个基因或蛋白质与已知的功能相似但序列发生了快速演变使其在某些位置有显著差异可能指示功能上的差异化时使用。通过计算分析但没有人工review 其他奇怪的就是说一些没有足够的证据的注释比如作者在论文中提了一嘴这样这是一个关于不同物种注释类型的数据统计可以看出水果的话大部分都是实验得到的和经过人工review注释计算机推测的比较少而对于猪的话就是计算机推测的还没经过人工review的占比比较大分子通路鉴定当时老师课题组的一个工作给基因注释上通路有时候能注释到8 90% 有时候一半都不到 KO 存储了KEGG里pathway的表存储了KEGG里KO的表存储了KO对应pathway的表 Gene 存储了gene对应pathway的表推理出的存储了ko对应gene的表推理出的存储了genes的信息大概的思路是query的gene序列跟KEGG 里的genes做blast相似度高的进行一个mapping。就是query对应到KEGG里的gene的KO然后再从KO对应到pathway 哪些通路是sigificant的很多时候由于实验数据是带有噪声的即数据中存在由测量误差、实验条件或其他非相关生物学过程导致的变异因此需要统计方法来确定哪些结果是真正具有生物学意义的。 Most frequent pathway Most enriched pathway 通路富集对于某一个通路一个一个看研究的一个基因组中所有能注释到的基因称为“background”评估自己实验条件下的这些基因在通路中的概率跟background中所有基因落在通路中的概率比较这二者算p值其实就是一个抽样问题用超几何分布来算p值多假设检验矫正 FDR矫正因为前面是一个一个通路去做检测的所以每个通路判断的误差累计起来还是不容忽视的所以这里进行一个多假设检验的矫正如果这个期望小于0.05那么认为是比较有生物学意义的有三类分析方法这里只介绍了第一种并且给出了一些分析软件关于同源相似性 homology Ortholog直系同源不同物种的相同功能序列来自历史上同个祖先 paralog旁系同源同个物种发生复制同源性往往具有相似性所以我们常常会根据相似性去推断同源性相似性矩阵对于氨基酸 PAM矩阵BLOSUM矩阵

查看全文

http://www.pierceye.com/news/715326/