KEGG Genome数据库的原理是什么


这期内容当中小编将会给大家带来有关KEGG Genome数据库的原理是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。kegg Genome 由organisms,selected viruses 和 Metagenomes 3个数据库构成。kegg Organisms 数据库收录了有完整基因组序列的物种信息,对于每个物种,有两种表示方法:三个字母或者四个字母的物种代码, 叫做org code, 比如human对应的org code 为hsa, mouse对应的org code为mmu;T Number, 对于organisms 中的所有物种来说,开头都是T0, 比如 human 对应的T Number 为T01001;
human为例,链接为http://www.kegg.jp/kegg-bin/show_organism?org=hsaorganisms 数据库记录了如下的信息:
除了 T number 和 Org code 等基本信息外,还包括了taxonomy 等其他信息。在这些详细信息中,Data source 代表基因组序列的来源数据库,通常是 Refseq 或者 Genebank; Original DB 是物种特异性的其他数据库,点击蓝色的字可以跳转到对应的数据库中去。其实这就是综合性数据库的价值,你只需要在综合性数据库中浏览,就可以知道这个物种相关的数据库有哪些,而且可以很方便的跳转到感兴趣的数据库中。selected viruses 数据库收录了与人类或者植物病理性相关的病毒信息,对于不同的病毒,用T Number 进行区分。所有的病毒的T Number 都是以 T4 开头的,比如T40218 http://www.kegg.jp/dbget-bin/www_bget?gn:T40218
viruses 数据库中还会提供病毒的宿主,相关疾病等详细信息。Metagenomes 数据库收录了一些环境微生物的相关信息,主要包括口腔,肠道,空气,皮肤, 泌尿生殖系统5大,大部分是口腔和肠道微生物。对于环境微生物,每个物种的T number 都是 T3 开头。kegg官网提供的Genome 数据库的构成示意图如下:

对于organisms 数据库中的物种,kegg 提供了一个简单的taxonomy 分类体系,和 NCBI 的taxonomy 数据库还是有区别的。kegg genome 数据库存储物种信息,由organisms , viruses, metagenomes 三个数据库构成。每个物种用T Number 唯一标识,organisms 中的物种都以T0 开头, viruses 中的物种以 T4 开头,metagenomes 中的物种以 T4 开头。kegg有一套较为简单的物种分类体系,叫做kegg taxonomy, 和 ncbi taxonomy 还是有区别的。上述就是小编为大家分享的KEGG Genome数据库的原理是什么了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注开发云行业 香港云主机资讯频道。

相关推荐: windows下如何把搭建redis cluster集群及配置springboot2.3.x

本篇文章为大家展示了windows下如何把搭建redis cluster集群及配置springboot2.3.x,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1.软件环境Redis-x64-3.2.100.zipRed…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 09/01 10:46
下一篇 09/01 11:35

相关推荐