如何使用MISO进行可变剪切的分析


如何使用MISO进行可变剪切的分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。MISO是一款经典的可变剪切分析工具,和rmats类似,该软件也支持对可变剪切事件进行定量和差异分析。这个软件支持exon和transcript两种水平的可变剪切分析,在rmats的文章中,我们也提到了rmats是从exon水平给出的可变剪切结果,因为二代测序读长短的特点,无法有效得到转录本全长,从exon水平得到的结果更加的准确,而且阳性结果更容易通过RT-PCR验证出来,但是无法详细的探究某个基因不同isoform之间的变化;transcript水平直接给出不同isoform间的定量和差异,能有效的探究基因不同isofrm的变化情况,但是结果准确性较差。该软件是一个python包,直接通过pip就可以安装,分析的pipeline如下对于transcript水平的分析而言,只需要提供转录本的GFF文件,可以从Ensembl等数据库下载参考基因组的gtf文件,然后自己转换成GFF3格式;对于exon水平而言,需要提供已知的可变剪切事件的GFF格式文件,示意如下第二列表示可变剪切的类型,以外显子跳跃为例,ID的格式如下包含了用@符号隔开的3个外显子,中间的exon的跳过的外显子,第一个为上游的外显子,第二个为下游的外显子,对应如下示意图中的3个exontranscript水平的GFF文件从数据库中下载即可,而exon水平的GFF文件是需要自己先识别可变剪切的不同isoform,然后整理得到的,对于人和小鼠等常见物种,官网提供了exon水平的GFF文件,链接如下https://miso.readthedocs.io/en/fastmiso/annotation.html准备好GFF文件之后,就可以建立索引了,命令如下index_db为索引保存的目录。运行miso需要第一步建好的索引以及样本对应的bam文件,该bam文件必须是经过排序处理的,而且有对应的bai索引,对于双端数据,用法如下read-len是reads的平均长度,paired-end代表插入片段长度的平均值和方差,miso_settings.txt是配置文件,内容如下配置文件中的参数很多,就不一一解释了,每个参数的意义请参考官方文档。
通过上述方式得到的结果可以直接用于后续的差异分析,但是这个结果不利于我们查看,所以官方提供了汇总程序,用法如下进行样本间差异分析的代码如下在输出目录,会生成一个后缀为bf的文件。用法如下用法如下sa 香港云主机shimi_plot_settings.txt是配置文件,其中设置了样本的bam文件和可变剪切的输出结果,示例如下最终会产生如下所示的结果这种图称之为sashimi plot , 是一种专用于可变剪切可视化的图表,上述示意图表示的是一个外显子跳跃事件在不同样本中的表达情况,左下方是GFF文件中共的exon结构,左上方是每个样本中比对上exon的reads的可视化,采用了RPKM表示,不同剪切方式用曲线链接,曲线上标记的是比对上该区域的reads数目,不同分组的样本用不同颜色表示,右侧的图片是样本中对应的可变剪切的表达量值。从这种图中,可以直观的看到两组样本间的可变剪切表达有无差异,上图中heartWT组中的表达量高于heartKO组。实际分析时,由于需要手动整理可变剪切isofrom对应的gff文件,所以使用的难度较大,但是其提供的可视化功能是非常值得借鉴的。看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注开发云行业资讯频道,感谢您对开发云的支持。

相关推荐: Pyqt5界面的基本写法和基础的类封装代码

本篇内容介绍了“Pyqt5界面的基本写法和基础的类封装代码”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、Pyqt5界面基本写法目标效果点击按钮,出现消息选择…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 08/14 16:40
下一篇 08/14 16:40

相关推荐