組織情報
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/04/13 14:29 UTC 版)
ESTのハイスループット解析は類似したデータ管理上の課題に多く直面する。最初の課題は、ESTライブラリの組織情報がdbESTでは英語のプレーンテキストで記載されていることであった。そのため、2つのライブラリが同じ組織のシーケンシングによって得られたものであるかを明確に決定するプログラムを書くことが困難であった。同様に、組織の疾患状況も計算機処理にに適した方法でのアノテーションが行われておらず、がん由来のライブラリであるという情報が組織名に混在していることも多かった(例えば、組織名が"glioblastoma"(膠芽腫)とある場合、ESTライブラリが脳組織由来であること、そして疾患状況ががんであることを意味している)。また、がんのような例外を除けば、dbESTのエントリに疾患状況が記載されていないことも多かった。TissueInfoプロジェクトはこうした課題に対する手助けとなるよう2000年に開始された。プロジェクトは組織と疾患状況(がん/非がん)の曖昧さを解消するキュレーションされたデータ(毎日更新)、組織と器官を包含関係で結びつける組織オントロジー(視床下部は脳の一部であり、脳は中枢神経系の一部であるというような知識の定式化)を提供し、配列決定されたゲノムからの転写アノテーションとdbESTのデータを用いて計算された組織発現プロファイルとを関連付けるオープンソースのソフトウェアを配布している。
※この「組織情報」の解説は、「発現配列タグ」の解説の一部です。
「組織情報」を含む「発現配列タグ」の記事については、「発現配列タグ」の概要を参照ください。
- 組織・情報のページへのリンク