モチーフ検索
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/06/08 02:55 UTC 版)
「シーケンスアラインメント」の記事における「モチーフ検索」の解説
モチーフ検索(プロファイル解析とも)はクエリセット内のシーケンスから短い保護モチーフ配列を配置することを試みるような全域的な多重配列アラインメントを構成する。これはだいたいまず一般の多重配列アラインメント全体を構成し、その後高次の保存配列が分離され、プロファイル行列セットを組み立てることで行われる。保存領域のプロファイル配列はスコアリング行列のように配置されるが、大量のアミノ酸やヌクレオチドそれぞれの位置は保存された領域の文字分布というよりももっと一般的な経験的な分布に由来する。プロファイル行列はそれらを文字列化するモチーフの発生のためのその他のシーケンスの検索にも用いられる。元のデータセットが少数のシーケンスを含んでいるまたは高次の関係シーケンスのみであった場合、擬似カウント(英語版)はモチーフを表す正規化された文字列分布が追加される。
※この「モチーフ検索」の解説は、「シーケンスアラインメント」の解説の一部です。
「モチーフ検索」を含む「シーケンスアラインメント」の記事については、「シーケンスアラインメント」の概要を参照ください。
- モチーフ検索のページへのリンク