比較メタゲノム解析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/18 15:26 UTC 版)
「メタゲノミクス」の記事における「比較メタゲノム解析」の解説
複雑な微生物群集が持つ生理学的な機能やその生息環境との関連を調べる上で、さまざまな異なるメタゲノムデータと比較的に解析することは有用である。メタゲノムデータ間の比較は、配列構成(例えばGC含有量やゲノムサイズの比較)、分類学的多様性(どのような系統の細菌がどのような割合でいるのか)、そして遺伝子機能(どのような機能遺伝子がどのような割合で存在するのか)、といったレベルで行うことができる。群集構造や系統的多様性の比較では、例えば16S rRNAやその他の系統マーカー遺伝子に基づいて行ったり、または多様性の低いコミュニティの場合であればゲノム再構築を経て行うことができる。メタゲノムデータ間の遺伝子機能の比較解析では、例えばCOGやKEGGといった機能遺伝子のリファレンスデータベースを対象に配列類似性検索にかけ、カテゴリ別に相対存在量を集計して統計的に検証することで、データセット間の違いを評価することができる。系統分類類的な解析とは異なり、このような遺伝子ベースの解析では、コミュニティ全体の遺伝子機能の特徴が明らかになる。そして一般には、たとえ別の環境であっても類似した環境条件下であれば、同じような遺伝子機能が分布していることが多い(例えば外洋の海洋表層で取られたサンプルであれば、太平洋でも大西洋でも概ね同じような遺伝子機能の分布を示す)。同時にこのことは、メタゲノムサンプルに付随している環境条件に関するメタデータは、コミュニティの構造と機能に対する生息地の影響を研究する上で、非常に重要である。 さらにいくつかの他の研究では、オリゴヌクレオチドの出現パターンを利用して、微生物群集全体の差を比較している。そのような方法論の例には、Willnerらが提唱したジヌクレオチド相対存在量によるアプローチや、Ghoshらが提唱したHabiSignアプローチがある。後者の研究では、特定のサンプリングサイトを特徴づけるような遺伝子配列(またはメタゲノムリード)を特定するために、テトラヌクレオチドの使用パターンの違いも使用できることを示している。さらにTriageToolsやCompareadsなどの手法では、2つのデータセット間で類似したリードを検出する。この際に使われる類似性の尺度としては、リードのペア間で共有される長さkの配列の数に基づいている。 比較メタゲノム解析の重要な目標の一つは、特定の環境において特定の特性を付与するような、主要な微生物群を特定することである。ただし、これを行う上で、metagenomeSeqというツールで実装されているように、異なるシーケンステクノロジを利用した際のデータバイアスを考慮する必要がある。またいくつかの研究においては、微生物群間の微生物間相互作用を解析している。例えば、Community-Analyzerと呼ばれるGUIベースの比較メタゲノム解析アプリケーションが、Kuntalらによって開発されている。このツールでは相関ベースのグラフアルゴリズムを実装し、系統分類学的な微生物群集構造の違いを視覚化し、さらにそのサンプル固有の微生物間相互作用を推測できる。
※この「比較メタゲノム解析」の解説は、「メタゲノミクス」の解説の一部です。
「比較メタゲノム解析」を含む「メタゲノミクス」の記事については、「メタゲノミクス」の概要を参照ください。
- 比較メタゲノム解析のページへのリンク