最適化問題として
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/02 00:52 UTC 版)
タンパク質設計の目的は、ターゲット構造に折りたたまれるタンパク質の配列を見つけることである。したがって、タンパク質設計アルゴリズムは、ターゲットフォールドに対する各配列のすべての立体配座を探索し、タンパク質設計エネルギー関数によって決定される各配列の最低エネルギー立体配座に応じて配列をランク付けする必要がある。このように、タンパク質設計アルゴリズムへの典型的な入力は、ターゲットフォールド、配列空間、構造の柔軟性、およびエネルギー関数であり、出力はターゲット構造に安定して折りたまれると予測される1つ(または複数の)配列である。 しかし、候補タンパク質配列の数は、タンパク質残基の数とともに指数関数的に増加する。たとえば、長さ100のタンパク質配列が20100個あるとする。さらに、アミノ酸側鎖の立体配座が少数の回転異性体に限定されるとしても(「構造の柔軟性」参照)、これにより、各配列の立体配座数は指数関数的に増加する。したがって、100残基のタンパク質において、各アミノ酸がちょうど10個の回転異性体を持つと仮定すると、この空間を探索する探索アルゴリズムは、200100以上のタンパク質の立体配座を探索しなければならない。 最も一般的なエネルギー関数は、回転異性体とアミノ酸タイプの間のペアワイズ項に分解できるため、問題を組み合わせ問題として計算し、強力な最適化アルゴリズムを用いて解決することができる。このような場合、各配列に属する各立体配座の総エネルギーは、残基位置間の個別項とペアワイズ項の和として定式化できる。設計者が最良の配列のみに関心がある場合、タンパク質設計アルゴリズムは、最低エネルギー配列の最低エネルギー配座のみを必要とする。このような場合には、各回転異性体のアミノ酸の同一性を無視し、異なるアミノ酸に属するすべての回転異性体を同じように扱うことができる。タンパク質鎖の残基位置 i にある回転異性体を ri とし、回転異性体の内部原子間の位置エネルギーを E(ri) とする。E(ri, rj) を、残基位置 j における ri と回転異性体 rj の間の位置エネルギーとする。そして、最適化問題を最小エネルギー (ET) の立体配座を見つけることの1つと定義する。 min E T = ∑ i [ E i ( r i ) + ∑ i ≠ j E i j ( r i , r j ) ] {\displaystyle \min E_{T}=\sum _{i}{\Big [}E_{i}(r_{i})+\sum _{i\neq j}E_{ij}(r_{i},r_{j}){\Big ]}\,} (1) ET を最小化する問題は、NP困難な問題である。問題のクラスがNP困難であるにもかかわらず、実際には、タンパク質設計の多くの事例は、ヒューリスティックな方法によって正確に解決したり、十分に最適化することができる。
※この「最適化問題として」の解説は、「タンパク質設計」の解説の一部です。
「最適化問題として」を含む「タンパク質設計」の記事については、「タンパク質設計」の概要を参照ください。
- 最適化問題としてのページへのリンク