multiple sequence alignmentとは何？わかりやすく解説 Weblio辞書

索引トップ用語の索引ランキングカテゴリー

多重配列アラインメント

同義/類義語：配列アラインメント, 多重配列アライメント, 配列アライメント
英訳・(英)同義/類義語：multiple sequence alignment, sequence alignment

異なるDNA配列やアミノ酸配列を比較するための手法の一つで、多数の配列を並置し、ヌクレオチドやアミノ酸の置換や欠失・挿入を部位ごとに比較できる様にしたもの。分子系統樹作成や系統分類、進化距離の推定などを行う際の基礎となる。また、ゲノムDNAの構造解析、特にショットガン法で複数の配列断片を結合する際にも利用する。

「生物学用語辞典」の他の用語

実験方法装置単位など：

固定液基本数塩化セシウム平衡密度勾配遠心多重配列アラインメント好気的培養好気的培養装置学名

ウィキペディア

索引トップ用語の索引ランキングカテゴリー

多重整列

(multiple sequence alignment から転送)

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2014/10/19 20:24 UTC 版)

ナビゲーションに移動検索に移動

多重整列(たじゅうせいれつ、英: multiple sequence alignment)とは、DNAの塩基配列やタンパク質のアミノ酸配列について、3つ以上の配列間で対応する部分が並ぶように整列したもの、また整列すること。通常、整列する配列群は進化的類縁性を持っていることが仮定される。多重整列の結果に基づいて分子系統樹を推定することができる。

各種生物のacidic ribosomal protein P0 (L10E)のアミノ酸配列の多重整列。Clustal Xで作成したN末端側90座位を示す。

アルゴリズム

多重整列を手作業で行うことも不可能ではないが、通常はコンピューターに計算させる。配列を1対1で整列させるペアワイズアラインメント(pairwise alignment)よりも計算複雑性が高く、より洗練されたアルゴリズムが必要となる。最適な多重整列を求めるには非現実的な計算量が要求されるため、一般に用いられているプログラムはヒューリスティクスを用いている。

動的計画法

大局的に最適な多重整列を求めるためには動的計画法を用いる。アミノ酸配列の場合は、ギャップペナルティと、あるアミノ酸から他のアミノ酸への置換の起こりやすさを示す置換行列をパラメータとして与える。核酸配列の場合にもギャップペナルティと置換行列を用いるが、置換行列は置換が起きるか否かのみを考慮した単純なものを使う場合が多い。

独立したn個の配列を整列するために、単純にはペアワイズアラインメントをn次元に拡張すれば良い。しかしnの増加に伴って計算量が指数的に増加し（配列の長さをLとしてO(Lⁿ)）、NP完全であることが示されている。^[1]^[2]^[3]

累進法

計算量を抑えるためによく使われているヒューリスティクスが、累進法とよばれる階層的に多重整列を求める方法である。まず総当たりのペアワイズアラインメントを行って「ガイドツリー」と呼ばれる近似的な系統樹を作り、最もよく似たペアから始めて段階的に配列を付け加えていく。ガイドツリーは近隣結合法ないし非加重結合法による階層型クラスタリングによって作られる。^[4]

累進法で求める多重整列は大域的に最適であることを保証されない。配列を付け加えていく過程で局所最適な整列が行われると、それが以降最後まで維持されてしまう。また最初に作られるペアワイズアラインメントに依存しているため、類似性が低い配列に対して実施するとうまく機能しないという問題もある。比較的新しいアルゴリズムでは多重整列の評価関数に非線形的な補正を加えることで精度を上げているものが多い。^[4]

しかし累進法は、比較的多量の配列（数百から数千）に対して現実的な時間で計算を終えることができる。頻用されているのはClustalシリーズ^[5]^[6]で、様々な機関がwebサーバー上で多重整列を計算できるように提供している。T-Coffee^[7]はClustalよりも時間がかかるが、類似性が低い配列に対しても一般的により良いアラインメントを求めることができる。

反復法

累進法の欠点を克服するため、新たな配列を付け加える際にそれまで出来ている部分も整列し直すアプローチがあり、総じて「反復法」と呼ばれている。累進法では、一度多重整列に組み込まれた配列は、それ以後再検討されることなく最終結果に反映されてしまう。これは正確性を犠牲にして効率を取ったためである。対照的に反復法では、一度得た多重整列を繰り返し再構築することで精度を高めようとする。^[4]

参考文献

^ Wang L, Jiang T (1994). “On the complexity of multiple sequence alignment”. J Comput Biol 1 (4): 337–348. doi:10.1089/cmb.1994.1.337. PMID 8790475.
^ Just W (2001). “Computational complexity of multiple sequence alignment with SP-score”. J Comput Biol 8 (6): 615–23. doi:10.1089/106652701753307511. PMID 11747615.
^ Elias, Isaac (2006). “Settling the intractability of multiple alignment”. J Comput Biol 13 (7): 1323–1339. doi:10.1089/cmb.2006.13.1323. PMID 17037961.
^ ^a ^b ^c Mount DM. (2004). Bioinformatics: Sequence and Genome Analysis 2nd ed. Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY.
^ Higgins DG, Sharp PM (1988). “CLUSTAL: a package for performing multiple sequence alignment on a microcomputer”. Gene 73 (1): 237–244. doi:10.1016/0378-1119(88)90330-7. PMID 3243435.
^ Thompson JD, Higgins DG, Gibson TJ (1994). “CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice”. Nucleic Acids Res 22 (22): 4673–4680. doi:10.1093/nar/22.22.4673. PMC: 308517. PMID 7984417.
^ Notredame C, Higgins DG, Heringa J (2000). “T-Coffee: A novel method for fast and accurate multiple sequence alignment”. J Mol Biol 302 (1): 205–217. doi:10.1006/jmbi.2000.4042. PMID 10964570.

multiple sequence alignmentとは？わかりやすく解説

多重配列アラインメント

多重整列

目次

アルゴリズム

動的計画法

累進法

反復法

参考文献

関連項目

「multiple sequence alignment」の関連用語


	Copyright (C) 2025 NII,NIG,TUS. All Rights Reserved.
	All text is available under the terms of the GNU Free Documentation License. この記事は、ウィキペディアの多重整列 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

multiple sequence alignmentとは？ わかりやすく解説

多重配列アラインメント

多重整列

アルゴリズム

動的計画法

累進法

反復法

参考文献

関連項目

「multiple sequence alignment」の関連用語

multiple sequence alignmentとは？わかりやすく解説