GenBank

基因銀行GenBank)是一个开放获取序列数据库,对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释。

GenBank
内容
有機體所有
相關信息
研究中心NCBI
发布日期1982年
访问入口
数据格式
网站NCBI
下載地址ncbi ftp
網絡服務地址
工具
WebBLAST
StandaloneBLAST
其他
许可Public domain-US Government

此数据库是国际协作核酸序列数据库(INSDC)的一部分,由美国国家生物技术信息中心(NCBI)主管,NCBI为美国国立卫生研究院的下属机构。GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据。

成立三十年来,GenBank数据库成为了最重要的也是最有影响力的生物全领域数据库,其数据正被全球数以百万计的研究人员获取与引用。GenBank中的数据量正以每18个月翻一番的速度持续指數增長[1][2],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[3]

历史

1979年,洛斯阿拉莫斯国家实验室(LANL)理论生物学和生物物理学小组 页面存档备份,存于Walter Goad等人建立了洛斯阿拉莫斯序列数据库,最终成为了公共的 GenBank数据库的前身[4]。1982年,由美国国立卫生研究院、美国国家科学基金会、美国能源部和国防部共同出资,LANL与BBN科技公司合作,成立了GenBank。到1983年底,已有超过2,000个序列被存储在GenBank。

在20世纪80年代中期,斯坦福大学的Intelligenetics bioinformatics公司与LANL合作经营着GenBank项目[5]。作为最早的互联网生物信息学社区项目,GenBank计划为生物学家打造一个开放获取BIOSCI/Bionet消息社群。1989到1992年,GenBank被转移到新成立的美国国家生物技术信息中心[6]

Genbank和EMBL在1986/1987年出版的《核苷酸序列》I到VII卷
Genbank v100版本的CDRom

发展

在GenBank的版本162.0(2007年8月)的发行说明中道出:“从1982年到现在,GenBank中的碱基数每隔18个月翻一番。”[7]

截至2013年7月8日 (2013-07-08),GenBank的版本196.0已有165,740,164个基因座,152,599,230,112个碱基,165,740,164个报导序列[3]。 GenBank数据库还包括一些额外的数据集,不包括在这个统计内。

GenBank中碱基对数目的增长,1982到2007,半对数图
GenBank中碱基数前二十的物种(版本 191)[8]
物种 碱基对
智人 Homo sapiens 16,310,774,187
小家鼠 Mus musculus 9,974,977,889
褐鼠 Rattus norvegicus 6,521,253,272
家牛 Bos taurus 5,386,258,455
玉米 Zea mays 5,062,731,057
野豬 Sus scrofa 4,887,861,860
斑馬魚 Danio rerio 3,120,857,462
紫色球海胆 Strongylocentrotus purpuratus 1,435,236,534
普通獼猴 Macaca mulatta 1,256,203,101
水稻 Oryza sativa Japonica Group 1,255,686,573
红花烟草 Nicotiana tabacum 1,197,357,811
非洲爪蟾 Xenopus (Silurana) tropicalis 1,249,938,611
黑腹果蝇 Drosophila melanogaster 1,119,965,220
黑猩猩 Pan troglodytes 1,008,323,292
拟南芥 Arabidopsis thaliana 1,144,226,616
家犬 Canis lupus familiaris 951,238,343
酿酒葡萄 Vitis vinifera 999,010,073
原雞 Gallus gallus 899,631,338
大豆 Glycine max 906,638,854
普通小麦 Triticum aestivum 898,689,329

另见

参考文献

  1. Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; 等. . Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942. PMID 18073190. doi:10.1093/nar/gkm929.
  2. Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; 等. . Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462. PMID 18940867. doi:10.1093/nar/gkn723.
  3. . NCBI. [2013-12-02]. (原始内容存档于2016-12-22).
  4. Hanson, Todd. . Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始内容存档于2008-11-07).
  5. . [2013-12-02]. (原始内容存档于2016-03-03).
  6. Benton D. . Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520. PMID 2326192. doi:10.1093/nar/18.6.1517.
  7. Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. . Nucleic Acids Research. 2013-1, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190. PMID 23193287. doi:10.1093/nar/gks1195. (原始内容存档于2020-05-14).
  8. Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. . Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681. PMID 21071399. doi:10.1093/nar/gkq1079.

外部链接

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.