当前位置: 首页 > news >正文

用织梦做网站有什么公司会要北京seo网络优化师

用织梦做网站有什么公司会要,北京seo网络优化师,什么叫网站地图,广告加盟介绍 iPHoP#xff08;Integrated Phage HOst Prediction#xff09;是一种基于综合特征的细菌噬菌体宿主预测方法。它是通过整合基因组序列、蛋白质序列和宿主基因组信息来预测细菌噬菌体的宿主范围。 iPHoP的预测过程分为三个步骤#xff1a;特征提取、特征选择和宿主预…介绍 iPHoPIntegrated Phage HOst Prediction是一种基于综合特征的细菌噬菌体宿主预测方法。它是通过整合基因组序列、蛋白质序列和宿主基因组信息来预测细菌噬菌体的宿主范围。 iPHoP的预测过程分为三个步骤特征提取、特征选择和宿主预测。在特征提取阶段iPHoP会从噬菌体基因组和宿主基因组中提取一系列特征包括基因组特征、蛋白质特征和宿主基因组特征。 在特征选择阶段iPHoP使用机器学习算法从提取的特征中选择最具有预测能力的特征。常用的特征选择算法包括卡方检验、互信息和方差分析等。 在宿主预测阶段iPHoP使用选择的特征来构建预测模型通过对未知噬菌体进行预测确定它们可能的宿主范围。 iPHoP具有以下特点它是一种集成的预测方法可以同时使用多个特征进行预测它基于机器学习算法可以根据不同的数据集进行预测它能够预测细菌噬菌体的宿主范围并提供预测的可靠性评估。 iPHoP已经在一些实验证明了其预测的准确性和可靠性并且被广泛应用于细菌噬菌体宿主的研究中。 Overview iPHoP stands for integrated Phage Host Prediction. It is an automated command-line pipeline for predicting host genus of novel bacteriophages and archaeoviruses based on their genome sequences. The pipeline can be broken down into 6 main steps: 仓库srouxjgi / iphop — Bitbucket 文章iPHoP: An integrated machine learning framework to maximize host prediction for metagenome-derived viruses of archaea and bacteria | PLOS Biology  下载代码库 git clone https://bitbucket.org/srouxjgi/iphop.git 大致的使用流程 A: 第1步运行单个宿主预测工具 基于噬菌体的工具 RaFAHhttps://doi.org/10.1016/j.patter.2021.100274生成宿主属的预测结果及相应的评分保存以备后续步骤5使用 宿主基础工具 使用blastn对宿主基因组进行比对。所有匹配度≥80%、长度≥500bp的片段被考虑在内。若匹配片段覆盖了“宿主”contig长度的≥50%则忽略这些片段因为它们往往源自几乎完全为病毒的contigs可能源于基因组或MAGs中的污染因此对于宿主预测不可靠。使用blastn对CRISPR间隔序列数据库进行比对。所有最多允许4个错配的匹配结果都被考虑。WIsHhttps://doi.org/10.1093/bioinformatics/btx383基于病毒与宿主基因组k-mer组成相似性判断宿主关联VHM-s2* 相似性Alignment-free |$d_2^*$| oligonucleotide frequency dissimilarity measure improves prediction of hosts from metagenomically-derived viral sequences | Nucleic Acids Research | Oxford Academic / https://doi.org/10.1093/nargab/lqaa044基于病毒与宿主基因组k-mer组成相似性判断宿主关联PHPhttps://doi.org/10.1186/s12915-020-00938-6基于病毒与宿主基因组k-mer组成相似性判断宿主关联 B: 第2步收集所有得分和基于宿主工具的所有命中之间的距离 * 对于两个潜在宿主即给定工具和查询病毒的两个匹配结果距离是基于GTDB树https://doi.org/10.1093/nar/gkab776计算得出的。 C: 步骤3和4为每种病毒 - 工具 - 候选宿主组合编制组织有序的命中列表 * 对于每个命中结果将从同一病毒且使用相同工具获取的其他顶级命中结果进行汇总并根据基线宿主与其他命中宿主之间的距离进行排序参见步骤2。 * 这些系列命中的结果被用作自动化分类器的输入以推导出给定病毒 - 候选宿主对的评分。 * 这使得在评估每一个潜在宿主每个命中结果时能够考虑到该病毒所获得的顶级命中结果的上下文信息。 D: 第5步为每种病毒 - 候选宿主组合得出宿主基础工具的3个评分 * 仅基于blast或crispr匹配的顶级评分会被保留因为这些方法本身在宿主预测上就足够可靠。 * 第三个评分通过考虑来自所有单独分类器的所有得分参见步骤4得出即同时考虑所有5种宿主基础方法。 E: 第6步计算每种病毒 - 候选宿主属组合的综合评分整合宿主基础信号和噬菌体基础信号 * 将3个宿主基础评分参见步骤5与噬菌体基础评分RaFAH - https://doi.org/10.1016/j.patter.2021.100274结合为所有病毒 - 候选宿主属对获得一个单一的综合评分。 conda安装 conda create -c conda-forge -n iphop_env python3.8 conda activate iphop_env mamba install -c conda-forge -c bioconda iphop mamba没有的大家自己使用conda 安装一下就行怎么配置conda基础环境可以参考 轻快小miniconda3在linux下的安装配置-centos9stream-Miniconda3 Linux 64-bit_离线安装miniconde linux-CSDN博客 数据库下载 iphop download --db_dir path_to_iPHoP_db# 验证iphop download --db_dir path_to_iPHoP_db --full_verify 手动下载 wget https://portal.nersc.gov/cfs/m342/iphop/db/iPHoP.latest_rw.tar.gztar -zxvf iPHoP.latest_rw.tar.gz 开始使用 超级简单直接运行 iphop predict --fa_file my_input_phages.fasta --db_dir path/to/iphop_db/Sept_2021_pub/ --out_dir iphop_output/ 主要输出结果文件 Main output files Host_prediction_to_genus_mXX.csv, where XX is the minimum score cutoff selected (default: Host_prediction_to_genus_m90.csv) This contains integrated results from host-based and phage-based tools at the host genus level: VirusAAI to closest RaFAH referenceHost genusConfidence scoreList of methodsIMGVR_UViG_3300029435_00000248.49d__Bacteria;p__Bacteroidota;c__Bacteroidia;o__Bacteroidales;f__Bacteroidaceae;g__Prevotella98.50RaFAH;91.30 iPHoP-RF;89.50 CRISPR;70.20IMGVR_UViG_3300029435_00000353.00d__Bacteria;p__Firmicutes_A;c__Clostridia;o__Lachnospirales;f__Lachnospiraceae;g__Agathobacter92.20blast;94.40IMGVR_UViG_3300029435_00000353.00d__Bacteria;p__Firmicutes_A;c__Clostridia;o__Lachnospirales;f__Lachnospiraceae;g__Bacteroides_F90.90CRISPR;93.30 iPHoP-RF;51.70IMGVR_UViG_3300029435_00000542.95d__Bacteria;p__Firmicutes_A;c__Clostridia;o__Oscillospirales;f__Ruminococcaceae;g__Gemmiger95.30blast;96.70 CRISPR;92.70 iPHoP-RF;82.50IMGVR_UViG_3300029435_00000735.09d__Bacteria;p__Bacteroidota;c__Bacteroidia;o__Bacteroidales;f__Bacteroidaceae;g__Prevotella98.40CRISPR;98.80 iPHoP-RF;95.40 blast;93.60IMGVR_UViG_3300029435_00000999.62d__Bacteria;p__Firmicutes_A;c__Clostridia;o__Lachnospirales;f__Lachnospiraceae;g__Lachnospira99.00CRISPR;98.80 blast;92.60 iPHoP-RF;70.90 RaFAH;65.80IMGVR_UViG_3300029435_00000999.62d__Bacteria;p__Firmicutes_A;c__Clostridia;o__Lachnospirales;f__Lachnospiraceae;g__Roseburia95.70CRISPR;97.00 iPHoP-RF;56.80IMGVR_UViG_3300029435_00001022.47d__Bacteria;p__Proteobacteria;c__Gammaproteobacteria;o__Burkholderiales;f__Burkholderiaceae;g__Sutterella97.60blast;98.30 CRISPR;80.00 iPHoP-RF;78.30 This output file lists for each prediction the virus sequence ID, the level of amino-acid similarity (AAI) between the query and the genomes in the RaFAH phage database, the predicted host genus, the confidence score calculated from all tools, and the list of scores for individual classifiers obtained for this virus-host pair.For the detailed score by classifier, RaFAH represents the score derived from RaFAH (https://www.sciencedirect.com/science/article/pii/S2666389921001008), iPHoP-RF is the score derived from all host-based tools, CRISPR the score derived only from CRISPR hits, and blast the score derived only from blastn hitsAll virus-host pairs for which the confidence score is higher than the selected cutoff (default 90) are included, so each virus may be associated with multiple predictions (e.g. IMGVR_UViG_3300029435_000003 and IMGVR_UViG_3300029435_000009). 其他注意事项 注意事项我们建议所有用户首先使用标准数据库对相同的病毒序列运行iPHoP。同时强烈建议仔细筛查所有MAGs宏基因组组装基因组以剔除污染因为微生物MAGs中错误地归类的病毒contig可能导致高置信度的错误宿主预测。 注意事项对于版本小于1.2.0的iPHoP在添加自定义MAGs时需要的是GTDB-tk v1.5.0的输出结果目前与GTDB-tk v2的输出不兼容。但在1.2及更高版本中这一问题应该已经得到了修复。 用户可以将他们自己的MAGs添加到宿主数据库中例如从获取输入噬菌体的相同数据集或采样地点获得的MAGs。iPHoP中的add_to_db模块可用于此目的需要为每个MAG提供fasta文件以及应用在这些相同MAG上的gtdb-tk infer功能的结果。示例文件集可在https://bitbucket.org/srouxjgi/iphop/downloads/Data_test_add_to_db.tar.gz 获取基于Dalcin Martins等人发表的研究“Viral and metabolic controls on high rates of microbial sulfur and carbon cycling in wetland ecosystems”的数据。 要将MAGs添加到宿主数据库的完整过程如下 使用wget下载示例数据包 wget https://bitbucket.org/srouxjgi/iphop/downloads/Data_test_add_to_db.tar.gz 解压下载的数据包 tar -xvf Data_test_add_to_db.tar.gz 查看解压后的目录内容 ls Data_test_add_to_db 其中“Expected_results/”文件夹包含了使用Sept_2021_pub数据库或包含额外MAGs的新数据库时iPHoP的预期结果文件。“Input_viral_contigs.fasta”是输入文件。“Wetland_MAGs/”文件夹包含了所有MAGs的fasta文件。“Wetland_MAGs_GTDB-tk_results/”文件夹则包含了iPHoP将使用的gtdb-tk结果文件。 生成gtdb-tk结果文件 gtdbtk de_novo_wf --genome_dir Wetland_MAGs/ --bacteria --outgroup_taxon p__Patescibacteria --out_dir Wetland_MAGs_GTDB-tk_results/ --cpus 32 --force --extension fa gtdbtk de_novo_wf --genome_dir Wetland_MAGs/ --archaea --outgroup_taxon p__Altarchaeota --out_dir Wetland_MAGs_GTDB-tk_results/ --cpus 32 --force --extension fa 创建一个新的iPHoP数据库该数据库将包括GTDB基因组和用户提供的额外MAGs但不包括GEM或IMG基因组 cd Data_test_add_to_db iphop add_to_db --fna_dir Wetland_MAGs/ --gtdb_dir Wetland_MAGs_GTDB-tk_results/ --out_dir Sept_2021_pub_rw_w_Wetland_hosts --db_dir /path/to/iphop_db/Sept_2021_pub_rw/ 注意为了避免复制大量文件新数据库部分基于原始数据库的符号链接。这意味着如果原始数据库此处为 iphop_db/Sept_2021_pub/被修改或删除新的数据库也将无法正常工作。这也意味着应提供原始数据库的完整路径作为 db_dir 参数。 然后可以使用Sept_2021_pub_w_Wetland_hosts文件夹作为iPHoP数据库进行宿主预测操作例如 iphop predict --fa_file Input_viral_contigs.fasta --db_dir Sept_2021_pub_rw_w_Wetland_hosts/ --out_dir test_add_db -t 4 引用信息 article{roux_iphop_2023, abstract {The extraordinary diversity of viruses infecting bacteria and archaea is now primarily studied through metagenomics. While metagenomes enable high-throughput exploration of the viral sequence space, metagenome-derived sequences lack key information compared to isolated viruses, in particular host association. Different computational approaches are available to predict the host(s) of uncultivated viruses based on their genome sequences, but thus far individual approaches are limited either in precision or in recall, i.e., for a number of viruses they yield erroneous predictions or no prediction at all. Here, we describe iPHoP, a two-step framework that integrates multiple methods to reliably predict host taxonomy at the genus rank for a broad range of viruses infecting bacteria and archaea, while retaining a low false discovery rate. Based on a large dataset of metagenome-derived virus genomes from the IMG/VR database, we illustrate how iPHoP can provide extensive host prediction and guide further characterization of uncultivated viruses.}, author {Roux, Simon and Camargo, Antonio Pedro and Coutinho, Felipe H. and Dabdoub, Shareef M. and Dutilh, Bas E. and Nayfach, Stephen and Tritt, Andrew}, doi {10.1371/journal.pbio.3002083}, issn {1545-7885}, journal {PLOS Biology}, number {4}, title {{iPHoP}: {An} integrated machine learning framework to maximize host prediction for metagenome-derived viruses of archaea and bacteria}, volume {21}, year {2023}, }
http://www.pierceye.com/news/85820/

相关文章:

  • 工作 网站建设内容浙江省工程造价信息网
  • 宁波网站建设策划公司排名网站软文发多了会影响
  • 苏州高端网站设计定制seo短视频网页入口
  • 免费公司网站源码浙江网警
  • 江苏安宜建设工程有限公司网站温州网站建设有限公司
  • 杭州哪些做网站公司好建设银行 贷款 查询 网站
  • 机械设备上哪个网站做外贸推广wordpress 采集英文插件
  • 二级域名网站建设规范三个字简洁的公司名称
  • 美团网站建设总体需求与目标互联网 医疗网站建设有哪些城市
  • asp.net网站开发实例视频教程网站域名怎么申请
  • ip下的网站吗制作一个公司网页多少钱
  • 网站引导页下载网站积分规则设计
  • 祁东县建设局网站建一个平台网站需要多少钱
  • 做自媒体的网站注册一个网站的流程
  • 城乡与住房建设部网站首页网站百度屏蔽关键词
  • 做旅行网站的依据及意义wordpress模板制作兼职
  • 紫色网站模板wordpress 制作widget
  • 网站建设视频教程下载wordpress文章列表页
  • 网站如何推广方案策划网站建设归哪个部门
  • 义县网站建设wordpress 自动短链接
  • 企业网站服务器的选择上海建站资讯
  • 后台网站建设招聘怎么制作相册带音乐的
  • 网站建设与维护的试题卷判断题海口网站运营托管费用
  • 国家企业信用公示系统官方网站网站的基本功能
  • 试管婴儿网站建设wordpress词典模板
  • 网站建设价格对比单小说网站的里面的搜索是怎么做的
  • 十大免费游戏网站wordpress 事件插件
  • 科技网站公司做网站编辑需要学什么
  • 商业网站的基本构成记账代理公司
  • 专门做衬衣的网站怎样做电商网站的财务分析