网站套餐可以分摊吗吗,微信小商店分销系统,桂林网站建设培训班,网页游戏搬砖赚钱这几天#xff0c;我将单细胞测序在windows ubuntu子系统中跑了一遍#xff0c;将过程分享給大家。
单细胞测序conda create -n 10xdb #创建环境
conda activate 10xdbconda install -c bioconda cellranger -y #失败#xff0c;可能源中没有
wget -O cellranger-7.…这几天我将单细胞测序在windows ubuntu子系统中跑了一遍将过程分享給大家。
单细胞测序conda create -n 10xdb #创建环境
conda activate 10xdbconda install -c bioconda cellranger -y #失败可能源中没有
wget -O cellranger-7.2.0.tar.gz https://cf.10xgenomics.com/releases/cell-exp/cellranger-7.2.0.tar.gz?Expires1702235980Key-Pair-IdAPKAI7S6A5RYOXBWRPDASignaturec5ZVKLpCggvKE5O1o0pR7X-IfMXAkWZdQ9o-BipsD9PQJP31eIR2vpy2J2Ucd5faQyM0ZgjsO98qdF616z62D4SRvJDHeYkdQzGSmoZNzcWRLM1Getvend4HkSxPxjePb5MhvohRKsh9~wR2RVivMSZXpiy6zhH1efwcF4-PPmSwJshbhU3pI7InTt5qg92kasL3ekv~8D-scp3kAiFwm15d-ufvblrox8g4P9JQjFHHDjLuu0F~P8-Qc31lMdOe~5KoDCbkE~UI7sEUBJktD0MR~lZ620OcYKgvaqCB-wLgI3VI0rH8RPxYvbgUXryBHnB0wEmqjaessFlNvhql1Q__#下载成功
tar -xzvf cellranger-7.2.0.tar.gz #tar 解压缩vim ~/.bashrc export PATH/mnt/h/softwore/cellranger-7.2.0/bin/:$PATH ,source ~/.bashrc,#成功
#下载人源比对基因组wget https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2020-A.tar.gz #这里下载太慢 在windows环境中下载md5sum refdata-gex-GRCh38-2020-A.tar.gz tar -xzvf refdata-gex-GRCh38-2020-A.tar.gz
mkdir 1.sra 2.raw_fastq 3.cellrangercd 1.sratouch download_file, #创建目录创建文件。
vim download_file #编辑文件文件名。 SRR7722941 SRR7722942
cat download_file |while read id;do (prefetch $id );done #NCBI下载单细胞数据。下载方法和软件可见,最好早上下载。
3.windows下Ubuntusratoolkit软件从ncbi的sra数据库下载数据。_sratools下载数据-CSDN博客
下载完数据后将SRR数据转为fastq格式。
ls SRR* | while read id;do ( nohup fasterq-dump -O ./ --split-files -e 6 ./$id --include-technical );done
#使用ls SRR*查找以SRR开头的文件然后使用while read id逐行读取这些文件名对每个文件执行以下操作使用fasterq-dump命令下载SRA文件将其转换成FASTQ格式并将结果保存在当前目录下。使用--split-files选项将每个样本的双端序列拆分成两个文件。使用-e 6选项指定最大重试次数为6。使用--include-technical选项包括技术序列。使用符号将每个命令放入后台执行以便同时处理多个文件加快处理速度。 #对10X的fq文件运行CellRangerd的counts流程我们只做一个文件首先我们先改名。
mv SRR7722937_1.fastq.gz SRR7722937_S1_L001_I1_001.fastq.gz
mv SRR7722937_2.fastq.gz SRR7722937_S1_L001_R1_001.fastq.gz
mv SRR7722937_3.fastq.gz SRR7722937_S1_L001_R2_001.fastq.gZ
#每个SRR分出三个fastq文件查阅资料是
SRR7722941_S1_L001_I1_001.fastq这是Index序列文件包含了每个序列的索引信息。SRR7722941_S1_L001_R1_001.fastq这是Read 1序列文件包含了每个序列的第一部分。SRR7722941_S1_L001_R2_001.fastq这是Read 2序列文件包含了每个序列的第二部分。
#接下来运行Cellranger count流程
ref/mnt/h/db/cellranger.db/refdata-gex-GRCh38-2020-A idSRR7722941
cellranger count --id$id \ --transcriptome$ref \ --fastqs/mnt/h/sxfx/2023.1210.db/2.raw_fastq \ --sample$id \ --nosecondary \ --localmem15 \ --localcores15 cellranger count这是Cell Ranger软件的一个子命令用于对单细胞RNA测序数据进行计数。 --id$id指定输出结果的唯一标识符通常是分析的样本名称或编号指定输出文件夹的名字。 --transcriptome$ref指定参考转录组的路径或者名称。这个参数告诉Cell Ranger在分析中使用哪个转录组参考序列。 --fastqs/mnt/h/sxfx/2023.1210.db/2.raw_fastq指定原始FASTQ文件的路径。这个参数告诉Cell Ranger去哪里查找原始的测序数据。 --sample$id指定样本名称或编号。这个参数用于告诉Cell Ranger如何标识分析中的每个样本。 --nosecondary这个参数告诉Cell Ranger在对数据进行比对和计数时不考虑次要的比对结果。次要比对结果是指在一个位置有多个可能的比对结果时除了最佳的比对结果外的其他比对结果。 --localmem15指定本地内存的使用量单位为GB。这个参数告诉Cell Ranger在运行过程中最多可以使用多少内存。 --localcores15指定本地CPU核心数。这个参数告诉Cell Ranger在运行过程中最多可以使用多少CPU核心。
#最终结果在outs中 结果解读参考生信技能树Jimmy的帖子 web_summary.html必看官方说明 summary HTML file 包括许多QC指标预估细胞数比对率等 metrics_summary.csvCSV格式数据摘要可以不看 possorted_genome_bam.bam比对文件用于可视化比对的reads和重新创建FASTQ文件可以不看 possorted_genome_bam.bam.bai索引文件 filtered_gene_bc_matrices是重要的一个目录下面又包含了 barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz是下游Seurat、Scater、Monocle等分析的输入文件是经过Cell Ranger过滤后构建矩阵所需要的所有文件 filtered_feature_bc_matrix.h5过滤掉的barcode信息HDF5 format可以不看 raw_feature_bc_matrix原始barcode信息未过滤的可以用于构建矩阵的文件可以不看 raw_feature_bc_matrix.h5原始barcode信息HDF5 format可以不看 analysis数据分析目录下面又包含聚类clustering有graph-based k-means、差异分析diffexp、主成分线性降维分析pca、非线性降维tsne因为我们自己会走Seurat流程所以不用看 molecule_info.h5可用于整合多样本使用cellranger aggr函数 cloupe.cloupe官方可视化工具Loupe Cell Browser 输入文件无代码分析的情况下使用会代码的同学通常用不到。
这是我最近跑的一个流程说实在的博大精深以后我会看一些文献分享一下流程好跑背景知识很难啊。