如何使用cell ranger拆分10X单细胞转录组原始数据


如何使用cell ranger拆分10X单细胞转录组原始数据,相信很多没有经验的人对此束手无策,为此本 香港云主机文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。cell ranger是10X genomics公司提供的,专门用于分析10X 单细胞转录组数据的pipeline, 包含了原始数据拆分,表达定量,聚类分析等多个功能,本文主要介绍如何使用该软件来拆分原始数据。直接从官网下载最新版的软件即可,网址如下https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest该软件由多个子命令构成,通过mkfastq命令拆分数据,流程示意如下有以下两种使用方式id参数指定输出目录的名字,run参数指定下机的原始bcl文件所在的目录,该命令其实是对illumina提供的拆分数据的bcl2fastq命令的一个封装,需要样本名称,index等信息,支持两种格式,一种就是illlumina常规的samplesheet.csv文件,格式如下另外一种是10X genomics定制的一种简化版的csv格式,内容如下只有3列,第一列指定lane ID, 第二列指定样本名称,第三列指定index的名称,10X genomics的每个index代表4条具体的oligo序列,示意如下在根据index确定样本时,允许1到2个碱基的错配。在实际拆分数据时,更加推荐使用三列的CSV文件,因为samplesheet文件中需要根据不同版本的试剂盒修改对应的Reads信息。V2试剂盒产生的文库结构如下所示V3试剂盒产生的文库结构如下所示和V2相比,V3试剂盒中所用的UMIPolyT的长度都发生了变化,从而导致测序得到的R1和R2端的序列长度也不一致,V2试剂盒的R1端长度为26bp, 包含16bp的barcode和10bp的UMI序列,V3试剂盒的R1端长度为28bp, 包含16bp的barcode和12bp的UMI序列;V2试剂盒的R2端为98bp, V3试剂盒的R2端为91bp。如果使用samplesheet文件,需要调整[Reads]中的序列长度,而使用简化版的csv文件,cell ranger可以识别所用试剂盒版本,然后自动化的调整reads长度。
拆分好之后的目录结构如下所示对于每个样本,除了常见的R1R2端序列,还多出来一个I1序列文件,该文件中保存的是index序列,示意如下后续的子命令也是通过这种特定的目录结构来进行分析,如果你有从其他地方下载的原始数据,也可以整理成这种目录结构,方便后续使用cell ranger进行分析。看完上述内容,你们掌握如何使用cell ranger拆分10X单细胞转录组原始数据的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注开发云行业资讯频道,感谢各位的阅读!

相关推荐: 如何解决win7系统计算机图标消失问题

这篇文章给大家分享的是有关如何解决win7系统计算机图标消失问题的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1.右击桌面空白处,选中“个性化”选项。2.点击“个性化”左框中的“更改桌面图标”。3.在“桌面图标设置”,当看到桌面图标…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 08/14 16:40
下一篇 08/14 16:40

相关推荐