网站制作信息,餐饮 网站模板,360的网站怎么做,免费网站是如何盈利的Galaxy平台上的文件称为数据集#xff08;Dataset#xff09;#xff0c;如果将多个文件组合在一起#xff0c;则形成数据集合#xff08;Dataset collection#xff09;。 上传文件后#xff0c;可以通过工具将文件构建成数据集合。具体操作可以参考前面介绍转录组流程… Galaxy平台上的文件称为数据集Dataset如果将多个文件组合在一起则形成数据集合Dataset collection。 上传文件后可以通过工具将文件构建成数据集合。具体操作可以参考前面介绍转录组流程的文章 上传数据轻松分析 | 云上转录组标准分析流程使用指南 构建数据集合的工具有下图所示的4种 Build Dataset List将多个文件组合成一个列表每行一个数据集。Build Dataset Pair将一对双端测序数据组合成一个数据集对。Build List of Dataset Pairs将多个样本的双端测序数据构建成数据集对列表每行一个数据集对。Build Collection from Rules在一个表格工具中通过各种规则将数据构建成数据集合。 有了数据集合之后还有许多工具对数据集合进行操作以下是这些工具的简要介绍。 Apply rules 这个工具允许用户将现有的 Galaxy 数据集合的元数据处理为表格数据应用一系列规则并生成一个新的集合。 Build list 从单个数据集或集合构建一个新的列表集合。 Collapse Collection into single dataset in order of the collection 将列表集合合并为一个单一文件数据集可以选择包含数据集名称或合并共同的标题行。 Duplicate file to collection 通过将输入数据集重复N次其中N是用户指定的整数创建一个任意大小的集合。 Extract dataset 根据位置或标识符从集合中提取数据集。 Extract element identifiers of a list collection 该工具接受一个列表类型的集合并生成一个文本数据集作为输出其中包含集合中所有数据集的元素标识符。 Filter collection 使用文件中提供的列表从集合中过滤元素。 Filter empty datasets 从集合中移除空元素。 该工具接受一个数据集合并过滤移除空数据集。这对于继续多样本分析很有用因为下游工具要求数据集具有内容。 Filter failed datasets 从集合中移除错误红色的数据集。 该工具接受一个数据集合并过滤移除处于失败红色状态的数据集。这对于在多个样本分析中继续进行时当一个或多个样本在某个时刻失败时非常有用。 Flatten collection 将嵌套集合展平为简单列表。 该工具接受嵌套集合例如列表的列表或数据集对的列表并从输入生成一个扁平化的列表。它有效地“展平”了层次结构。集合标识符被合并在一起默认使用“_”以创建扁平化结果中的新集合标识符。 Merge collections 接受两个或更多集合并从它们创建一个单一的集合。 Relabel identifiers 使用提供的文件中的标识符更改集合中数据集的标识符。 Sort collection 按字母顺序、数字顺序或使用提供的文件中预定的顺序对数据集合进行排序。 Split by group 给定单个输入数据集该工具根据指定列中的唯一值将文件拆分。 Split file to dataset collection 该工具将由记录组成的数据集拆分为集合中的多个数据集。记录可以是一行、一个FASTA序列标题序列、一个FASTQ序列标题序列质量值等。重要的属性是记录要么具有特定的长度例如FASTQ有4行要么可以通过正则表达式指定新记录的开始/结束例如对于行可以使用 .对于FASTA可以使用.。 Tag elements 向集合元素添加标签包括名称name:和组group:标签。 Unzip Unzip a file 解压包含各种类型文件的文件夹。如果要求保留多个文件则输出将是一个包含压缩文件或tar存档中的所有文件的集合。 Unzip collection 将配对集合“解压缩”为两个简单的数据集集合数据集的列表。 给定一个包含正向和反向读取的配对集合该工具将把它“解压缩”成两个分别包含正向和反向读取的集合。 Zip collections 接受两个集合并将它们构建成一个配对集合。 如果您有一个仅包含正向读取的集合和一个仅包含反向读取的集合这个工具将把它们“压缩”到一起形成一个简单的配对集合。例如给定两个包含正向和反向读取的集合它们可以被“压缩”成一个单一的配对集合 关于简说基因 生信平台Galaxy中国UseGalaxy.cn致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装用完即走。活跃的用户社区随时交流使用心得。生信分析我们能够承接所有 NGS 组学数据分析业务包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释以及各种重测序业务都可以与简说基因合作。生信培训简说基因的生信培训班荣获学员的一致好评。如果你也对生物信息学感兴趣欢迎来跟简说基因学真生信。联系方式QQ交流群免费925694514微信交流群免费加微信好友邀请入群客服微信usegalaxy