fasta索引文件、序列提取的示例分析


这篇文章主要介绍了fasta索引文件、序列提取的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。fasta是常用的序列存储格式,很多软件(如GATK、IGV等)在导入序列以及进行快速查找时通常需要建立索引文件。下面就来介绍如何使用samtools 便捷的建立fasta文件的索引以及快速进行序列提取。1建立索引建立索引只需在Linux下输入命令:samtools faidx input.fa
这里序列文件为 input.fa,生成的索引文件以 .fai 结尾。需要注意的是,输入的fasta文件的每条序列除最后一行外,其余行的长度必须相同,否则会报错哦!最后生成的.fai文件如下, 共5列,以制表符分隔;第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容;第二列 LENGTH : 序列的长度,单位为bp;第三列 OFFSET : 第一个碱基的偏移量,从0开始计数,换行符也统计进行;第四列 免费云主机域名LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度,包括换行符,在windows系统中换行符为rn,要在序列长度的基础上加2。2提取序列除建立索引外,还可以利用samtools方便的提取序列,例如:samtools faidx input.fa chr2 > chr2.fa,会得到含chr2这条序列的fasta格式的文件,如果是多条序列,只需在文件后罗列需提取的序列ID即可,使用空格分隔,如samtools faidx input.fa chr1 chr2chr3 > chr.fa。再如:samtools faidx input.fa chr2:1-1000 > chr2.fa,能得到chr2序列的第1到第1000个碱基的fasta格式的文件,同样可以提取多条序列。samtools 安装1. 下载,地址如下:http://www.htslib.org/doc/samtools.html。2. 安装,使用命令tar -jxvf samtools-1.6.tar.bz2解压下载的压缩包,最后使用make命令就可以了。感谢你能够认真阅读完这篇文章,希望小编分享的“fasta索引文件、序列提取的示例分析”这篇文章对大家有帮助,同时也希望大家多多支持百云主机,关注百云主机行业资讯频道,更多相关知识等着你来学习!

相关推荐: SpringMvc异常处理器怎么实现

这篇文章主要讲解了“SpringMvc异常处理器怎么实现”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“SpringMvc异常处理器怎么实现”吧!   SpringMvc 在处理请求过程中出现异常信息由异常处理器…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 08/19 11:10
下一篇 08/19 11:10

相关推荐