Protein Data Bankのサイト

PDBの全てのデータには固有のPDB IDがつけられています。PDB IDは英数4文字からなっています。PDB IDが分かれば、目的の立体構造を検索できます。PDBデータを引用した論文には、使用したPDBデータのPDB IDが記載されています。

個々のPDBデータの情報

PDB IDについて

Protein Data Bank (PDB)には、実験による立体構造 (Experimentally-determined 3D structures) が約21万件、計算によるモデル構造 (Computed Structure Models, CSM) が約106万件登録されています(2024年5月現在)。ここでは、RCSB(USA) PDBのサイトをご紹介します。

それぞれのPDBデータのサマリーページには、著者、文献、分子(タンパク質名)、生物種、リガンドの化合物など、そのPDBファイルに登録されている分子の情報が記載されています。このページから、各種フォーマットのファイルをダウンロードしたり、立体構造を表示することができます。

PDBファイルフォーマットとは

Waalsで使用するタンパク質の立体構造データは、Protein Data Bank (PDB)ファイルフォーマットです。

右は、PDBファイルの一部です。アミノ酸残基を構成する各原子のX, Y, Z座標が記載されています。

          Altif        >         Waals    >          Q&A, 関連情報        >   Protein Data Bankのサイトについて

Structureをクリックすると立体構造を表示できます。

クリックしてダウンロードします。

原子

左からX, Y, Z座標

例えば、左の図の一行目は、

チェインAの10番目のAspの窒素の原子の座標が

35.563, 22.330, -0.508)である

という記載です。

Advanced Searchでは、テキスト検索に加え、分子名、各種のID、アミノ酸配列の一致度、複合体の状態、モチーフ、化合物等を複数指定して検索できます。

テキスト入力で、分子名、ID(PDB, UniProt, AlphaFold ID)、著者名、アミノ酸配列等を検索できます。

計算によるモデル構造を含む場合は、トグルをONにします。