Protein Data Bank (Protein Data Bank)

Перейти к навигации Перейти к поиску

Protein Data Bank, PDB — банк данных трёхмерных структур белков и нуклеиновых кислот. Информация, полученная методами рентгеновской кристаллографии или ЯМР-спектроскопии, и, всё чаще, методом криоэлектронной микроскопии вносится в базу данных биологами и биохимиками со всего мира, и доступна бесплатно через интернет сайты организаций-членов (PDBe[1], PDBj[2], RCSB[3]).

PDB является одним из важнейших ресурсов для учёных, работающих в области структурной биологии. Большинство научных журналов и некоторые фонды финансирования исследований, например, NIH в США требуют от авторов статей и получателей грантов, чтобы все структурные данные были размещены в PDB. Protein Data Bank содержит в основном первичные данные о структуре биологических молекул, в то время как существуют сотни других банков данных, категоризирующих первичные данные или выявляющие закономерности между строением молекул и эволюционным родством.[4]

История[править | править код]

Protein Data Bank был создан обычными учёными[4]. В 1971 году Уолтер Хэмилтон (англ. Walter Hamilton) в Национальной лаборатории Брукхавена создал банк данных для Брукхавена. После смерти Хэмилтона в 1973 году PDB управлял Том Кэцтл (англ. Tom Koeztle). В январе 1994 года главой Protein Data Bank стал Джол Суссман (англ. Joel Sussman).

В октябре 1998 года[5] Protein Data Bank был перенесён в Research Collaboratory for Structural Bioinformatics (RCSB); перенос информации был закончен в июне 1999 года. Новым директором стала Хелен Берман (англ. Helen M. Berman) из Университета Рутгерса.[6] В 2003 году, после образования wwPDB (англ. Worldwide Protein Data Bank), Protein Data Bank стал международной организацией. Помимо RCSB, основателями wwPDB являются Protein Data Bank in Europe (PDBe), Protein Data Bank in Japan (PDBj) и Bilogical Margnetic Resonance Bank (BMRB).

База данных[править | править код]

База данных Protein Data Bank обновляется еженедельно (в 0:00 часов по всемирному координированному времени, UTC, по средам). По состоянию на 14 марта 2017 года база данных содержит[7]:

Метод
исследования
Белки Нуклеиновые кислоты Комплексы белков
и нуклеиновых кислот
Другое Всего
Дифракция рентгеновских лучей 106595 1820 5471 4 113890
ЯМР 10296 1190 241 8 11735
Электронная микроскопия 1021 30 367 0 1418
Смешанный 99 3 2 1 105
Другое 181 4 6 13 204
Всего: 118192 3047 6087 26 127352
103 514 структуры в PDB содержат файл со структурным фактором
9057 структуры имеют файл ЯМР с геометрическими ограничениями
2826 структур имеют файл ЯМР, содержащий экспериментально определённые химические сдвиги
1403 структур имеют файл с 3DEM-картой

Преобладающая часть структур получена при помощи метода диффракции рентгеновских лучей, около 15 % — при помощи ЯМР белков, и лишь малая часть — при помощи крио-электронной микроскопии.

Некоторое время количество структур в PDB росло экспоненциально, но с 2007 года прирост несколько пригас.

Каждая структура, опубликованная в PDB получает четырёхзначный идентификатор (комбинация цифр и букв латинского алфавита). Данный шифр не может служить идентификатором биомолекул, так как часто разные структуры одной и той же молекулы, например, в различной среде, могут иметь различные PDB ID.

Программное обеспечение[править | править код]

Структуры могут быть просмотрены при помощи нескольких компьютерных программ (как бесплатных и распространяющихся по лицензии open source, так и платных, распространяющихся не с открытым кодом) и плагинов к веб-браузерам.

  • Программа QuteMol позволяет открывать и просматривать файлы с расширением *.pdb и *.vdb
  • Xscreensaver[en] Molecule позволяет отобразить молекулы из базы данных pdb, как скринсейвер.

Примечания[править | править код]

  1. PDBe — Европейский Protein Data Bank. Дата обращения: 2 июня 2019. Архивировано 18 сентября 2019 года.
  2. PDBj — японский Protein Data Bank. Дата обращения: 25 декабря 2009. Архивировано 18 сентября 2020 года.
  3. Research Collaboratory for Structural Bioinformatics ([[Ратгерский университет|Rutgers]] и [[Суперкомпьютерный центр университета Сан Диего|UCSD/SDSC]][[:en:San Diego Supercomputer Center|[en]]]). Дата обращения: 25 декабря 2009. Архивировано 3 марта 2016 года.
  4. 1 2 Berman, H. M. The Protein Data Bank: a historical perspective (англ.) // Acta Crystallographica Section A: Foundations of Crystallography  (англ.) : journal. — International Union of Crystallography, 2008. — January (vol. A64, no. 1). — P. 88—95. — doi:10.1107/S0108767307035623. Архивировано 5 февраля 2009 года.
  5. Berman, H. M.; et al. The Protein Data Bank (англ.) // Nucleic Acids Res.  (англ.) : journal. — 2000. — January (vol. 28, no. 1). — P. 235—242. — doi:10.1093/nar/28.1.235. — PMID 10592235. — PMC 102472. Архивировано 13 мая 2008 года.
  6. RCSB PDB Newsletter Archive. RCSB Protein Data Bank. Архивировано 13 апреля 2012 года.
  7. RCSB PDB — Holdings Report. Дата обращения: 25 декабря 2009. Архивировано из оригинала 4 июля 2007 года.

Ссылки[править | править код]