自建网站软件,宝塔 wordpress ssl,wordpress免费教育模板,Centos建网站必须域名GWAS 分析模型 | FaST-LMM FaST-LMM (Factored Spectrally Transformed Linear Mixed Models) 是一个用于进行全基因组关联分析#xff08;GWAS#xff09;的模型。与标准混合线性模型相比#xff0c;FaST-LMM 通过对遗传相似性矩阵进行单次谱分解来减少计算资源消耗并提升运… GWAS 分析模型 | FaST-LMM FaST-LMM (Factored Spectrally Transformed Linear Mixed Models) 是一个用于进行全基因组关联分析GWAS的模型。与标准混合线性模型相比FaST-LMM 通过对遗传相似性矩阵进行单次谱分解来减少计算资源消耗并提升运行速度因此特别适用于超大型数据集的 GWAS 分析。 扫码关注微信公众号【生信F3】获取更多生物信息学最新知识。 ShengXinF3_QRcode 安装 FaST-LMM 提供了供直接运行的预编译版本FastLmmC v2.07.20140723下载后即可使用 https://www.microsoft.com/en-us/download/details.aspx?id52588 ./fastlmmc 用法 FaST-LMM 需要四个输入文件ASCII 编码包含 SNP 数据 用于计算个体间遗传相似性亲缘关系矩阵的 SNP 数据可以与1不同 表型数据 一组协变量可选 仅计算遗传相似性矩阵 ./fastlmmc -runGwasType NORUN \ -pheno Trait1.plink.txt -missingPhenotype NA \ -fileSim test \ -simOut test.sim -runGwasType 计算遗传相似矩阵的谱分解后运行 GWAS 或退出。使用 NORUN缓存谱分解。默认值RUN。 运行 GWAS ./fastlmmc-tfile test-pheno Trait1.plink.txt-tfileSim test-simOut out.sim-out test_fastlmm.out.txt-missingPhenotype NA -maxChromosomeValue 1000000 -maxThreads 5 常用选项 1. 基因型 输入文件 SNP 数据应该为 PLINK 格式ped/map, tped/tfam, bed/bim/fam, or fam/dat/map。使用依赖 SNP 排序的二进制格式可以获得最快的速度。这些文件中的表型条目必须被设置为虚值并将被忽略FaST-LMM 软件使用单独的表型文件。性别应该被编码为一个数字。缺失的 SNP 值将被按均值填补。 注意该软件只能接受整数或字符串形式X、Y、XY 或 MT的染色体编号因此对于非模式物种建议在 SNP 标识符中包含染色体 ID并将染色体 ID 列全部以数字 0 填充。 -file basefilename .map 和 .ped 格式的文件基名 -bfile basefilename 二进制 .bed, .fam 和 .bin 格式的文件基名 -tfile basefilename 转置后 .tfam 和 .tped 格式的文件基名 2. 亲缘关系 -tfileSim basefilename 用于构建遗传相似度亲缘关系的转置后 .tfam 和 .tped 格式的文件基名可与基因型数据保持一致 -simOut filename 指定将遗传相似度写入此文件 3. 表型 -pheno filename 表型文件名 -missingPhenotype 缺失值的标识符。如果一个个体的表型缺失那么该个体就会被忽略。如果一个个体的协变量值缺失则以平均值估算。默认值为 -9。 包含表型数据的文件使用 PLINK 的表型格式。其至少包含三列familyID、individualID 和任意数量的表型值。列间以制表符或空格分隔。默认仅测试第一列表型值缺失值默认以 -9 表示但一般建议以 -missingPhenotype 选项来指定缺失值。第一列 familyID 与第二列 individualID 相连接从而为个体创建唯一的标识符并与上述 PLINK 文件中的个体条目相匹配。例如 cid0P0 cid0P0 0.4853395139922632cid1P0 cid1P0 -0.2076984565752155cid2P0 cid2P0 1.4909084058931985cid3P0 cid3P0 -1.2128996652683697cid4P0 cid4P0 0.4293203431508744 4. 其它 -maxThreads int 该选项被传递给 MKL 数学库Intel以 建议 使用的并行程度。指定一个大于计算机上核心数的数字可能会导致程序运行得更慢。指定一个小于核心数的数字可能会使计算机在运行 FastLmmC 时不会在程序的不同阶段消耗所有的 CPU 资源。在使用 ACML 数学库AMD时MaxThreads 选项将被忽略。 -covar filename 包含协变量的可选文件 结果输出 -out filename 输出文件的名称。默认值是 [basefilename].out.txt。如果使用扩展名是 .csv输出文件将以逗号分隔。否则将以制表符分隔。 默认输出文件如下所示 每列含义如下 SNPSNP 标识符。 ChromosomeSNP 的染色体标识符取自 PLINK 文件。 Genetic DistanceSNP 的遗传距离未知则为 0。 PositionSNP 的物理位置。 Pvalue计算所得 P 值。 Qvalue使用 Benjamini-Hochberg 校正 p 值后所得的 q 值 N用于分析的个体数量 NullLogLike AltLogLike SNPWeight SNPWeightSE OddsRatio WaldStat NullLogDelta NullGeneticVar NullResidualVar NullBias 扫码关注微信公众号【生信F3】获取更多生物信息学最新知识。 ShengXinF3_QRcode 本文由 mdnice 多平台发布