階層的な構成
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/05/01 07:31 UTC 版)
「CATHデータベース」の記事における「階層的な構成」の解説
実験的に決定されたタンパク質の立体構造を蛋白質構造データバンク(PDB)から取得され、必要に応じて連続するポリペプチド鎖に分割する。これらの鎖の中にあるタンパク質のドメインは、自動化された方法と手作業によるキュレーションを組み合わせて識別される。 次に、それらのドメインはCATHの構造階層の中で分類される。クラス(C)レベルでは、二次構造の内容に応じてドメインが割り当てられる。すなわち、すべてがαヘリックス、すべてがβシート、αとβの混合、または二次構造がほとんどないなどである。アーキテクチャ(A)レベルでは、三次元空間における二次構造の配置に関する情報を用いて割り当てを行う。トポロジー/フォールド(T)レベルでは、二次構造の要素がどのように接続され、配置されているかの情報が用いられる。相同スーパーファミリー(H)レベルでは、ドメインが進化によって関連していること、すなわちそれらが相同であることを示す十分な証拠がある場合に割り当てられる。 CATH階層の4つの主要レベル#レベル説明1 クラス(Class) ドメインの全体的な二次構造の内容。(SCOP(英語版)の「クラス(英語版)」に相当) 2 アーキテクチャ(Architecture) 高い構造的類似性を持つが、ホモロジーの証拠はない。(SCOPの「フォールド」レベルに相当) 3 トポロジー/フォールド(Topology/fold) 特定の構造的特徴を共有するトポロジーの大規模なグループ。 4 相同スーパーファミリー(Homologous superfamily) 実証可能な進化的関係を示す。(SCOPのスーパーファミリーに相当) 構造が実験的に決定されていないドメインの追加の配列データは、CATHの姉妹リソースであるGene3Dから提供されており、相同スーパーファミリーの作成に使用されている。UniProtKBおよびEnsemblのタンパク質配列をCATH HMMと照合して、ドメイン配列の境界を予測し、相同スーパーファミリーの割り当てを行う。
※この「階層的な構成」の解説は、「CATHデータベース」の解説の一部です。
「階層的な構成」を含む「CATHデータベース」の記事については、「CATHデータベース」の概要を参照ください。
- 階層的な構成のページへのリンク