配列の系統推定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/18 15:26 UTC 版)
遺伝子アノテーションにより「それが何なのか(どういう機能を持つ遺伝子なのか)」という情報がわかる一方で、配列の由来系統の推定により「それが誰なのか(どういう微生物系統群に由来した配列なのか)」という情報を得ることも重要になる。すなわち、メタゲノム解析で菌叢の構成と生理学的機能を結び付けるためには、アセンブリされる前のショットガンリードあるいはアセンブリ後に得られるコンティグ配列が、元々どのような生物系統に由来していたのかを推定する、配列の由来系統推定を行う必要がある。配列類似性に基づく方法としては、BLASTなどのツールと既存の公共データベースを利用して、各系統に特異的なマーカー配列や類似したゲノム上の配列を検索することで、その配列やコンティグがどのような系統に由来していたのかを推定する方法がある。このアプローチはMEGANで実装されている。異なる手法としては補間マルコフモデルを使用した方法があり、PhymmBLなどで実装されている。MetaPhlAnおよびAMPHORA(英語版)では、より高速に生物の相対存在量を推定するための、マーカー遺伝子をベースとした手法が実装されている。mOTUやMetaPhylerなどのツールでは、ユニバーサルなマーカー遺伝子を使用して原核生物種のプロファイルを作成する。mOTUs profilerを使用すると、参照ゲノムなしで系統をプロファイリングでき、微生物群集の多様性の推定ができる。SLIMMなどの手法では、個々のリファレンスゲノムにおけるリードカバレッジの分布を調べることで、偽陽性を最小限に抑えて信頼性のある相対存在量を計算する。一方、組成に基づく系統推定の手法では、オリゴヌクレオチドの頻度やコドン使用頻度のバイアスなどの情報を利用する。配列の由来系統が推定できることで、はじめて菌叢の系統的多様性が比較分析できるようになる。
※この「配列の系統推定」の解説は、「メタゲノミクス」の解説の一部です。
「配列の系統推定」を含む「メタゲノミクス」の記事については、「メタゲノミクス」の概要を参照ください。
- 配列の系統推定のページへのリンク