スレッディングの詳細
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/30 09:38 UTC 版)
「スレッディング (タンパク質)」の記事における「スレッディングの詳細」の解説
フォールド認識方法は、大きく2つのタイプに分けられる。1つは、フォールドライブラリの各構造について1次元プロファイル(特性)を導出し、これらのプロファイルにターゲット配列を整列する方法で、もう1つは、タンパク質テンプレートの完全な3次元構造を考慮するものである。プロファイル表現の簡単な例として、構造内の各アミノ酸を取りあげ、それがタンパク質のコア内に埋まっているか、表面に露出しているかによって単純にラベル付けすることがあげられる。より精巧なプロファイルでは、局所的な二次構造(たとえば、アミノ酸がαヘリックスの一部であるか否か)や、進化的情報(アミノ酸がどのように保存されているか)を考慮に入れることも考えられる。3次元表現では、構造は原子間距離の集合としてモデル化される。つまり、構造内の一部またはすべての原子ペアの間の距離が計算される。これは、構造のはるかに豊富で柔軟な記述であるが、アライメントの計算に使用するのは非常に困難である。プロファイルベースのフォールド認識アプローチは、1991年にBowie、Lüthy、David Eisenberg(英語版)によって最初に説明された。スレッディングという用語は、1992年にDavid Jones(英語版)、William R. Taylor、Janet Thornton(英語版)によって最初に作られたもので、当初は、フォールド認識におけるタンパク質テンプレートで完全な3次元構造の原子表現の使用を特に指していた。現在では「スレッディング」と「フォールド認識」という用語は(やや間違ってはいるが)同じ意味で使われることが多い。 フォールド認識法が広く利用され効果を発揮しているのは、自然界には厳密に限られた数のさまざまなタンパク質フォールドが存在すると考えられているからである。これは主に進化の結果であるが、ポリペプチド鎖の基本的な物理学的および化学的な制約にも起因するものである。そのため、ターゲットタンパク質と類似のフォールドを持つタンパク質が、X線結晶構造解析や核磁気共鳴分光法(NMR)などですでに研究され、PDBに登録されている可能性が高い(現在は70~80%)。現在、約1300種類のタンパク質フォールドが知られており、進行中の構造ゲノミクスプロジェクトの重要な活動により、毎年新規フォールドが発見されている。 配列を構造に正しくスレッディングさせるためのアルゴリズムは数多く提案されているが、その多くは何らかの形で動的計画法を利用している。完全な3次元スレッディングの場合、最適なアライメントを特定する問題は非常に困難である(スレッディングのいくつかのモデルではNP困難な問題となる)。研究者たちは、条件付き確率場、シミュレーテッド・アニーリング、分枝限定法、線型計画法など、多くの組み合わせ最適化手法を用いて、ヒューリスティックな解決策を目指してきた。スレッディング法を、2つのタンパク質構造を整列させようとする手法(タンパク質構造アライメント(英語版))と比較するのは興味深いことであり、実際、同じアルゴリズムの多くが両方の問題に適用されている。
※この「スレッディングの詳細」の解説は、「スレッディング (タンパク質)」の解説の一部です。
「スレッディングの詳細」を含む「スレッディング (タンパク質)」の記事については、「スレッディング (タンパク質)」の概要を参照ください。
- スレッディングの詳細のページへのリンク