放射線学の単語ベクトル:インテリジェントな単語埋め込み(IWE)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/03 09:24 UTC 版)
「Word2vec」の記事における「放射線学の単語ベクトル:インテリジェントな単語埋め込み(IWE)」の解説
構造化されていない放射線医学レポートの密なベクトル表現を作成するための単語ベクトルの拡張は、Banerjeeらによって提案された。 大規模コーパスではあまり使用されていなかった単語も含め、放射線科医の好みのスタイルに応じて同義語や関連語を使用できる。未知の単語や語彙外(OOV)の単語、形態学的に類似した単語をどのように処理するかは、Word2vecモデルの最大の課題の一つであり、Word2vecモデルでは初見の単語に対してランダムなベクトルを割り当ててしまう。 Intelligent Word Embedding (IWE) は、Word2vecにセマンティックディクショナリマッピングテクニックを組み合わせて、臨床テキストからの情報抽出に取り組む。臨床テキストには、口語表現の曖昧さ、語彙のバリエーション、フリーテキストのナラティブスタイルのあいまいさ、語彙のバリエーション、非文法的かつ簡潔な語句の使用、単語の順序に恣意性、および略語と頭字語の頻出などがみられる。 特に興味深いことに、単一機関で訓練されたIWEモデルが他の機関のデータセットに上手く変換されており、施設に依存しない一般性が示された。
※この「放射線学の単語ベクトル:インテリジェントな単語埋め込み(IWE)」の解説は、「Word2vec」の解説の一部です。
「放射線学の単語ベクトル:インテリジェントな単語埋め込み(IWE)」を含む「Word2vec」の記事については、「Word2vec」の概要を参照ください。
- 放射線学の単語ベクトル:インテリジェントな単語埋め込みのページへのリンク