大量に配列が登録され続けていることによる不整合の問題
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/05/02 23:37 UTC 版)
「配列データベース」の記事における「大量に配列が登録され続けていることによる不整合の問題」の解説
遺伝子の配列データを蓄積している大規模な配列データベースが直面している大きな問題は、個人研究者から大規模ゲノムシーケンシングセンターまで、さまざまな登録者から配列データが登録されていることである。このことはデータベースに高い網羅性をもたらしたが、一方で、配列のデータおよび配列に付された生物学的なアノテーション(注釈)のデータの品質のばらつきが非常に大きい(品質の高いデータと品質の低いデータが混在する)という問題が出てきている。 さらに冗長性の問題がある。複数の研究機関が、既に配列データベースに登録されている配列と完全に同一な配列や、ほとんど同一な配列を、重複して登録してしまうということが、しばしば起きている。このことに気がつかずに複数の情報源からの情報を不用意にまとめてしまうと、結果として整合性に欠ける解析をしてしまうことになり、非常に問題である。
※この「大量に配列が登録され続けていることによる不整合の問題」の解説は、「配列データベース」の解説の一部です。
「大量に配列が登録され続けていることによる不整合の問題」を含む「配列データベース」の記事については、「配列データベース」の概要を参照ください。
- 大量に配列が登録され続けていることによる不整合の問題のページへのリンク