バイオインフォマティクスのための単語ベクトル:BioVectors
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/03 09:24 UTC 版)
「Word2vec」の記事における「バイオインフォマティクスのための単語ベクトル:BioVectors」の解説
バイオインフォマティクスでの利用のために、生物学的配列(例:DNA、RNA、およびタンパク質)におけるn-gramのための単語ベクトルの拡張が、AsgariとMofradによって提案された。 バイオベクター(BioVec)はタンパク質(アミノ酸配列)に対するタンパク質ベクター(ProtVec)、遺伝子配列に対する遺伝子ベクター(GeneVec)といった生物学的配列の総称であり、プロテオミクスおよびゲノミクスにおける機械学習の実装において幅広く用いられている。BioVectorsが生化学的および生物物理学的解釈に基づいて生物学的配列を分類できることが示唆されている。 同様の変法であるdna2vecは、Needleman-Wunsch類似度スコアとdna2vecにおける単語ベクトルのコサイン類似度との間に相関があることが示されている。
※この「バイオインフォマティクスのための単語ベクトル:BioVectors」の解説は、「Word2vec」の解説の一部です。
「バイオインフォマティクスのための単語ベクトル:BioVectors」を含む「Word2vec」の記事については、「Word2vec」の概要を参照ください。
- バイオインフォマティクスのための単語ベクトル:BioVectorsのページへのリンク