配列からの遺伝子予測
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/18 15:26 UTC 版)
「メタゲノミクス」の記事における「配列からの遺伝子予測」の解説
詳細は「遺伝子予測(英語版)」を参照 アセンブルされたコンセンサス配列(コンティグ)から遺伝子配列(コーディング領域)をアノテーションする方法としては、大きく分けて2つのアプローチが取られる。1つ目は、BLAST等のツールを用いた配列類似性検索により、配列データベース上で公開されている遺伝子との配列類似性に基づいて遺伝子を識別する方法である。この方法は、例えばMEGAN 4で実装されている。2番目の方法としては、関連する生物種(すなわち、原核生物か真核生物か)に由来した既知の配列情報から、遺伝子配列に関する特徴量を学習し、コンティグ配列から直接遺伝子領域を予測する方法である。例えばGeneMark(英語版)やGLIMMER(英語版)といったプログラムで採用されている。このab initioな予測方法では、配列データベースに類似したものがない新規性のあるコーディング領域も検出できることができる。その後、予測された遺伝子配列を元に、公共の遺伝子データベースを用いた配列類似性検索をかけることで、その遺伝子が持つ機能を推定することが一般に行われる。
※この「配列からの遺伝子予測」の解説は、「メタゲノミクス」の解説の一部です。
「配列からの遺伝子予測」を含む「メタゲノミクス」の記事については、「メタゲノミクス」の概要を参照ください。
- 配列からの遺伝子予測のページへのリンク