GenBank数据库格式的详细说明由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“数据库格式及说明”。
GenBank数据库格式的详细说明
Posted on 19 四月 2009 by 柳城,阅读 609 简洁版GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注 释的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发生学划分,另外一些则按照生成这 些序列数据的技术方法划分。目前GenBank中所有的记录均来自于最初作者向DNA序 列数据库的直接提交。这些作者将序列数据作为论文的一部分来发表,或将数据直接公开。GenBank由位于马里兰州Bethesda的 美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库(DDBJ)以及欧洲生物信 息研究院的欧洲分子生物学实验室核苷酸数据库(EMBL)一起,都是国际核苷酸序列数据库合作的成员。所有这三个中心都可以独 立地接受数据提交,而三个中心之间则逐日交换信息,并制作相同的充分详细的数据库向公众开放(虽然格式上有细微的差别,并且所使用的信息系统也略有不 同)。GenBank数据库格式的详细说明
EMBL和GenBank数据库格式的对比
EMBL
ID
DE
AC
SV
KW
OS
OC
RN
RA
RT
RL
RX
RC
RP
CC
DR
FH
FT
SQ
空格
GenBank LOCUS DEFINITION ACCESSION VERSION KEYWORDS SOURCE ORGANISM REFERENCE AUTHORS TITLE JOURNAL MEDLINE REMARKCOMMENTFEATURESBASE COUNT ORIGIN 含义 序列名称 序列简单说明 序列编号 序列版本号 与序列相关的关键词 序列来源的物种名 序列来源的物种学名 和分类学位置 相关文献编号,或递 交序列的注册信息 相关文献作者,或递 交序列的作者 相关文献题目 相关文献刊物杂志 名,或递交序列的作者单位 相关文献 Medline引文代码 相关文献注释 相关文献其它注释 关于序列的注释信息 相关数据库交叉引用 号 序列特征表起始 序列特征表子项 碱基种类统计数 序列