歴史的展望
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/05/04 06:25 UTC 版)
現在までに20種類以上の二次構造予測法が開発されている。最初のアルゴリズムの1つはChou-Fasman法(英語版)で、これは主に二次構造の種類ごとに各アミノ酸が出現する相対的な頻度から決定される確率パラメータに依存している。1970年代半ばに解析された構造の小さなサンプルから決定されたオリジナルのChou-Fasmanパラメータは、最初の発表からパラメータが更新されたものの、現代の手法と比較して不十分な結果となっている。Chou-Fasman法は、二次構造の予測において、およそ50~60%の精度である。 次に注目すべきは、情報理論に基づいたGOR法(英語版)というプログラムである。これは、より強力な確率的手法であるベイズ推定を使用する。GOR法では、各アミノ酸が特定の二次構造を持つ確率だけでなく、隣接するアミノ酸の寄与を考慮した上で、各構造を持つアミノ酸の条件付き確率も考慮する(隣接するアミノ酸が同じ構造を持つことは想定されていない)。アミノ酸の構造的傾向は、プロリンやグリシンなどの少数のアミノ酸に対してのみ強く現れるため、このアプローチはChou-Fasmanのアプローチよりも感度が高く、精度も高い。多くの隣接アミノ酸のそれぞれからの弱い寄与が、全体として強い効果をもたらす可能性がある。オリジナルのGOR法の精度は約65%で、βシートよりもαヘリックスの予測で劇的な成功をおさめたが、βシートはループや無秩序な領域としばしば誤認された。 もう一つの大きな進歩は、機械学習の手法を用いたことである。最初に人工ニューラルネットワークの手法が使われた。トレーニングセットとして解明された構造を使用し、二次構造の特定の配置に関連する共通の配列モチーフを識別する。これらの手法は70%以上の精度で予測することができるが、完全なβシートの配置に必要な拡張コンフォメーション形成を助ける水素結合パターンを評価するための三次元構造情報がないため、βストランドの予測が不十分になることが多い。ニューラルネットワークを用いたタンパク質の二次構造予測プログラムとしては、PSIPRED(英語版)やJPRED(英語版)などが知られている。次に、サポートベクターマシン(SVM)は、統計的手法では特定が困難なターンの位置を予測するのに特に有効であることがわかっている。 機械学習技術を拡張して、未割り当て領域の主鎖の二面角など、タンパク質のよりきめ細かい局所的特性の予測が試みられている。この問題には、SVMとニューラルネットワークの両方が適用されている。最近では、SPINE-Xを使って実数値のねじれ角を正確に予測し、ab initio構造予測に用いることに成功している。
※この「歴史的展望」の解説は、「タンパク質構造予測」の解説の一部です。
「歴史的展望」を含む「タンパク質構造予測」の記事については、「タンパク質構造予測」の概要を参照ください。
- 歴史的展望のページへのリンク