SCOPの後継
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/05/04 05:57 UTC 版)
「タンパク質立体構造分類データベース」の記事における「SCOPの後継」の解説
2009年までに、オリジナルのSCOPデータベースは38,000件のPDBエントリを手動で厳密な階層構造に分類した。タンパク質構造の報告が加速している中、分類の限定された自動化では追いつかず、包括的なデータセットに繋がらなかった。2012年にリリースされた拡張タンパク質構造分類(Structural Classification of Proteins extended、SCOPe)データベースは、同じ階層システムのはるかに優れた自動化を備えたもので、SCOPバージョン1.75と完全な後方下位互換性がある。2014年には、正確な構造の割り当てを維持するために、SCOPeに手動キュレーションが再導入された。2015年2月現在、SCOPe 2.05はPDBエントリー(合計110,000件)のうち71,000件を分類した。 SCOP2プロトタイプは、タンパク質構造分類のベータ版で、タンパク質構造の進化に内在する進化的複雑性をより高めることを目的としている。したがって、これは単純な階層構造ではなく、タンパク質スーパーファミリーを接続する有向非巡回グラフネットワークであり、循環置換(英語版)、ドメイン融合(英語版)、ドメイン崩壊などの構造的および進化的関係を表している。そのため、ドメインは厳密に固定された境界線で区切られるのではなく、最も類似した他の構造との関係によって定義される。このプロトタイプは、SCOPバージョン2データベースの開発に使用された。2020年1月にリリースされたSCOPバージョン2には、SCOPバージョン1.75での3,902ファミリーと1,962スーパーファミリーと比較して、5,134ファミリーと2,485スーパーファミリーが含まれている。その分類レベルは、504,000以上のタンパク質構造を表す41,000以上の非冗長ドメインを編成している。 2014年に公開されたタンパク質ドメイン進化的分類(英語版)(Evolutionary Classification of Protein Domains、ECOD)データベースは、SCOPバージョン1.75のSCOPe拡張版に類似している。互換性のあるSCOPeとは異なり、「クラス - フォールド - スーパーファミリー - ファミリー」階層を「アーキテクチャ - X - ホモロジー - トポロジー - ファミリー」(architecture-X-homology-topology-family、A-XHTF)分類に変更し、最後のレベルは主にPfam(英語版)によって定義され、また未分類の配列についてはHHsearch(英語版)クラスタリングによって補完される。ECODは、3つの後継システムの中で最も広くPDBを網羅している。つまり、すべてのPDB構造を網羅し、隔週で更新されている。Pfamへの直接マッピングは、Pfamのキュレーターが「クラン」(clan)分類を補足するために、ホモロジーレベルのカテゴリーを使用する際に有用である。
※この「SCOPの後継」の解説は、「タンパク質立体構造分類データベース」の解説の一部です。
「SCOPの後継」を含む「タンパク質立体構造分類データベース」の記事については、「タンパク質立体構造分類データベース」の概要を参照ください。
- SCOPの後継のページへのリンク