蛋白质数据库(Protein Data Bank,简称PDB)是一个专门收录蛋白质及核酸的三维结构资料的数据库。由Worldwide Protein Data Bank监管。PDB可以经由网络免费访问,是结构生物学研究中的重要资源。为了确保PDB资料的完备与权威,各个主要的科学杂志、基金组织会要求科学家将自己的研究成果提交给PDB。在PDB的基础上,还发展出来若干依据不同原则对PDB结构数据进行分类的数据库,例如GO将PDB中的数据按基因进行了分类。这些资料和数据一般是世界各地的结构生物学家经由X射线晶体学或NMR光谱学实验所得,并释放到公有领域供公众免费使用。
PDB的历史可以追溯到1971年,当时布鲁克黑文国家实验室的Walter Hamilton决定在Brookhaven建立这个数据库。1973年Hamilton去世后,Tom Koeztle接管了PDB。1994年1月,以色列魏茨曼科学研究学院的Joel Sussman被任命为PDB负责人。在1998年10月,PDB被移交给了Research Collaboratory for Structural Bioinformatics(RCSB),并与1999年6月移交完毕,新的负责人是罗格斯大学(Rutgers大学)(RCSB成员)的Helen M. Berman。2003年,PDB作为wwPDB的核心,成为了一个国际性组织。同时,wwPDB的其他成员,包括PDBe(欧洲)、RCSB(美国)、PDBj(日本)也为PDB提供了数据积累、处理和发布的中心。BMRB(英语:Biological Magnetic Resonance Data Bank) 于2006年加入。值得一提的是,虽然PDB的数据是由世界各地的科学家提交的,但每条提交的数据都会经过wwPDB工作人员的审核与注解,并检验数据是否合理。PDB及其提供的软件现在对公众免费开放。
PDB数据库每周更新(UTC+0 星期三)。 同样,PDB馆藏列表也每周更新一次。 截至截至2017年3月14日 (2017-03-14),现有统计信息如下:
这些数据表明大多数结构是由X射线衍射确定的,但是现在约10%的结构由蛋白质NMR确定。 当使用X射线衍射时,获得蛋白质原子坐标的近似值,而通过NMR实验发现蛋白质原子对之间距离的估计值。 因此,在后一种情况下,通过求解距离几何问题(英语:Distance geometry problem)来获得蛋白质的最终构象。 一些蛋白质由低温电子显微镜确定。 (单击原始表中的数字将显示由该方法确定的结构示例。)
上述结构因子文件的意义在于,对于具有结构文件的由X射线衍射确定的PDB结构,可以查看电子密度图。 这些结构的数据存储在“电子密度服务器”上。
过去,PDB的结构数量以近似指数的速度增长,通过了1982年的100个注册结构里程碑,1993年的1,000个,1999年的10,000个,以及2014年的100,000个。然而,自2007年以来,新蛋白质结构的积累速率似乎已经趋于稳定。