如何通过GDC Legacy Archive下载TCGA原始数据


本篇内容主要讲解“如何通过GDC Legacy Archive下载TCGA原始数据”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何通过GDC Legacy Archive下载TCGA原始数据”吧!在2016年之前,TCGA项目的相关结果文件存放在CGhub和TCGA Data Coordinating Center简称DCC提供的TCGA Data Portal中,当时的结果是以hg19或者hg18为参考得到的。在DCC中,将数据划分为了3个等级。lev 香港云主机el 1代笔原始的,未经处理的数据的,比如芯片下机数据;level2 代表处理的中间结果,比如测序深度对应的wig文件;level 3 代表处理完成后的最终结果,比如基因的定量结果。2016年之后,CGhub和DCC相继关闭,所有的数据统一迁移到现在用的GDC数据库,而且通过GDC的pipeline将原有的结果转换为hg38参考基因组版本。目前在GDC中检索到的结果都是经过了GDC pipeline处理过后的,从这里也可以看出,迁移到hg38是一个大的趋势。当然目前使用hg19的还是挺多的,如果你需要基于hg19版本的TCGA数据,在GDC中也可以找到。其实GDC中的数据可以分为以下两个部分GDC harmonized dataGDC legacy archive
在R包TCGAbiolinks中,介绍了二者的区别,如下图所示第一部分就是默认使用的基于hg38版本的数据,第二部分则是对原始的TCGA结果的一个存储,通过GDC首页的GDC APPs, 可以找到CDC Legacy Archive的入口,链接如下https://portal.gdc.cancer.gov/legacy-archive在左侧的面板可以根据相关属性对Cases和Files进行筛选,Cases相关的属性如下Files相关的属性如下数据的下载方式和前面文章中介绍的相同,这里不赘述,从文件名称可以看到对应的level, 不同level的文件示意如下通过Data TypeRaw intensitites进行筛选,得到芯片的原始数据, 示意如下通过Data TypeCoverage WIG进行筛选,得到比对的测序深度数据, 示意如下通过Data TypemiRNA gene quantification进行筛选,得到miRNA表达定量数据, 示意如下通过GDC Legacy Archive, 可以找到基于hg19的数据结果文件,但是由于相关的网站已经关闭,无法确认该数据分析的pipieline等细节信息,所以需要谨慎使用。
到此,相信大家对“如何通过GDC Legacy Archive下载TCGA原始数据”有了更深的了解,不妨来实际操作一番吧!这里是开发云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

相关推荐: win10系统cpu占用率高怎么办

小编给大家分享一下win10系统cpu占用率高怎么办,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!方法一:按Win按钮,输入regedit回车打开注册表编辑器,展开以下位置:HKEY…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 08/05 10:51
下一篇 08/05 10:51

相关推荐