BLASTプログラム
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 08:28 UTC 版)
BLASTプログラムを利用するには、プログラムをダウンロードして blastall コマンドラインユーティリティとして実行する方法と、ウェブからアクセスする方法とがある。 NCBI (GenBank) やDDBJのウェブサイトでは、これらの機関が共同で構築している塩基配列(およびアミノ酸配列)の公共シーケンスデータベースに対して、ウェブブラウザでBLASTによる類似性検索を行うことができる。 この公共シーケンスデータベースは定期的に更新され、新たに配列決定が行われた生物のシーケンスのほとんどは、このデータベースに登録される。 BLASTには実際には複数のプログラムが含まれている。blastall 実行ファイルには、blastp、blastn、blastx、tblastn、tblastx のプログラムが含まれている。blastall をコマンドライン環境で実行する際は、-p オプションで実行するプログラムを指定する(例: blastall -p blastn)。BLASTプログラムを実行する際、クエリシーケンスはFASTAフォーマットでプログラムに渡す。次にBLASTに含まれているプログラムのうち主なものを示す。 blastp アミノ酸配列(タンパク質のシーケンス)をクエリとして、ユーザが指定したアミノ酸配列データベースから類似するシーケンスを検索する。 blastn 塩基配列(ヌクレオチドのシーケンス)をクエリシーケンスとして、ユーザが指定した塩基配列データベースから類似するシーケンスを検索する。 blastx 塩基配列のクエリシーケンスを、6フレームで翻訳して、アミノ酸配列データベースから類似するシーケンスを検索する。 tblastn アミノ酸配列をクエリとして、塩基配列データベースを6フレームで翻訳しながら、類似するシーケンスを検索する。 tblastx 塩基配列のクエリシーケンスを、6フレームで翻訳して、アミノ酸配列に翻訳された塩基配列データベースから類似するシーケンスを検索する。このプログラムはBLASTのプログラムの中で最も処理速度が遅い。このプログラムの使用目的は、塩基配列のシーケンス間の非常に遠い関連性を発見することである。 PSI-BLAST アミノ酸配列をクエリとして、ユーザが指定したアミノ酸配列データベースから類似するシーケンスを検索する。最近開発されたBLASTプログラムの一つ。このプログラムはタンパク質の遠い系統的関連性を発見するために使われる。まず、クエリのアミノ酸配列と近い関連性をもつタンパク質の一覧を作成する。そしてこの一群のタンパク質を統合して「プロファイル」(平均化したシーケンスのようなもの)を作る。このプロファイルを使ってアミノ酸配列データベースに対する検索を行い、プロファイルのもととなったアミノ酸配列より多い件数のアミノ酸配列を見つける。見つかったアミノ酸配列でさらにプロファイルを作成する。この一連の処理を繰り返し行う。検索を行う際に関連するタンパク質を考慮するため、遠い系統的関連性を発見する場合に、PSI-BLAST は blastp よりもはるかに正確な処理を行う。 megablast megablastは大量のクエリシーケンスで高速な検索を行うプログラムである。BLAST でコマンドラインから逐次に検索を行う場合より、はるかに高速に実行することができる。megablastはクエリとして指定された複数のシーケンスを連結して長いシーケンスを作成して、シーケンスデータベースを検索し、処理結果として個別のアライメントと統計値を返す。
※この「BLASTプログラム」の解説は、「BLAST」の解説の一部です。
「BLASTプログラム」を含む「BLAST」の記事については、「BLAST」の概要を参照ください。
- BLASTプログラムのページへのリンク