潜在クラスモデル
(Latent class model から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2026/03/31 03:48 UTC 版)
潜在クラスモデル(せんざいクラスモデル、英:Latent class model、略:LCM)は、統計学において、多変量の離散データをクラスタリングするためのモデルである。データは複数の離散分布の混合から生じ、それぞれの分布内では変数が独立していると仮定する。各データポイントが属するクラスが観測されない(つまり潜在している)ため、潜在クラスモデルと呼ばれる。
潜在クラス分析(せんざいクラスぶんせき、英:Latent class analysis、略:LCA)は、多変量のカテゴリデータからケースのグループまたはサブタイプを見つけるために使用される、構造方程式モデリングのサブセットである。これらのケースのグループまたはサブタイプは「潜在クラス」と呼ばれる[1][2]。
次のような状況に直面したとき、研究者はデータをよりよく理解するためにLCAの使用を選択することがある。例えば、疾患X、Y、Zと診断された様々な患者において、症状a、b、c、dが記録されているとする。疾患Xは症状a、b、cに関連しており、疾患Yは症状b、c、dに関連付けられ、疾患Zは症状a、c、dに関連している。この文脈において、LCAは潜在クラス(すなわち疾患の実体)の存在を検出し、それによって症状の関連パターンを作成しようと試みる。因子分析と同様に、LCAは最尤法によるクラス所属確率に従ってケースを分類するためにも使用できる[1][3]。
LCAで最も重要な役割は、観察された症状の関連性が事実上無効になるような潜在クラスを特定することである。これは、各クラス内で、症状の原因となる疾患が依存関係の構造を作り出すからである。その結果、症状は条件付き独立となる。つまり、ケースが属するクラスが与えられれば、症状はもはや互いに関連を持たなくなるのである[1]。
モデル
各潜在クラス内において、観測された変数は統計的に独立している。これは潜在クラスモデリングの不可欠な側面である。通常、観測された変数は統計的に依存関係にある。潜在変数を導入することで、クラス内では変数が独立しているという事実において独立性が回復する(局所独立)。したがって、観測された変数間の関連性は、潜在変数のクラスによって説明される(McCutcheon, 1987)。
ある形式において、LCMは次のように記述される。
ここで、は潜在クラスの数であり、はいわゆるリクルートメント確率(または無条件確率)であり、合計すると1になる。は周辺確率または条件付き確率である。
2元潜在クラスモデルの場合、形式は次のようになる。
この2元モデルは、確率的潜在意味解析および非負値行列因子分解と関連している。
LCAで使用される確率モデルは、単純ベイズ分類器と密接に関連している。主な違いは、LCAでは個人のクラス所属が潜在変数であるのに対し、単純ベイズ分類器ではクラス所属が観測されたラベルであるという点である。
関連手法
異なる名前と用途を持ちながら、共通の関連性を共有する手法がいくつか存在する。
- クラスター分析はLCAと同様に、データの中から分類群(タクソン)に似たケースのグループを発見するために使用される。
- 多変量混合推定(MME)は連続データに適用でき、男女の混合から生じる身長のデータのように、データが複数の分布の混合から生じると仮定する。多変量混合推定が、各分布内で測定値が無相関でなければならないという制約を受ける場合、それは潜在プロファイル分析と呼ばれる。この制約付き分析を離散データを処理できるように修正したものがLCAとして知られている。
- 離散潜在特性モデルはさらに、単一の次元のセグメントからクラスが形成されるように制約し、その次元に基づいてメンバーをクラスに割り当てる。その例として、能力や実力に基づいてケースを社会階級に割り当てることなどが挙げられる。
実際の事例において、変数は政治的なアンケートの多肢選択式の項目となることがある。この場合、データは多くの回答者による項目への回答を含むN元の分割表で構成される。この例において、潜在変数は政治的意見を指し、潜在クラスは政治グループを指す。グループへの所属が与えられた場合、条件付き確率は特定の回答が選択される確率を指定する。
応用
LCAは、協調フィルタリング[4]、『行動遺伝学』[5]、診断テストの評価[6]など、多くの分野で使用される可能性がある。
脚注
- ^ a b c Lazarsfeld, P.F.; Henry, N.W. (1968) (英語). Latent structure analysis. Boston: Houghton Mifflin
- ^ Formann, Anton K. (1984) (ドイツ語). Latent Class Analyse: Einführung in die Theorie und Anwendung. Weinheim: Beltz
- ^ Teichert, Thorsten (2000). “Das Latent-Ciass Verfahren zur Segmentierung von wahlbasierten Conjoint-Daten. Befunde einer empirischen Anwendung”. Marketing ZFP 22 (3): 227-240. doi:10.15358/0344-1369-2000-3-227. ISSN 0344-1369 2026年3月31日閲覧。.
- ^ Cheung, Kwok-Wai; Tsui, Kwok-Ching; Liu, Jiming (2004). “Extended latent class models for collaborative recommendation”. IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans 34 (1): 143-148. doi:10.1109/TSMCA.2003.818877.
- ^ Eaves, L. J., Silberg, J. L., Hewitt, J. K., Rutter, M., Meyer, J. M., Neale, M. C., & Pickles, A (1993). “Analyzing twin resemblance in multisymptom data: genetic applications of a latent class model for symptoms of conduct disorder in juvenile boys”. Behavior Genetics 23 (1): 5-19. doi:10.1007/bf01067550. PMID 8476390.
- ^ Bermingham, M. L., Handel, I. G., Glass, E. J., Woolliams, J. A., de Clare Bronsvoort, B. M., McBride, S. H., Skuce, R. A., Allen, A . R., McDowell, S. W. J., & Bishop, S. C. (2015). “Hui and Walter's latent-class model extended to estimate diagnostic test properties from surveillance data: a latent model for latent data”. Scientific Reports 5. Bibcode: 2015NatSR...511861B. doi:10.1038/srep11861. PMC 4493568. PMID 26148538 2026年3月31日閲覧。.
参考文献
- Linda M. Collins; Stephanie T. Lanza (2010). Latent class and latent transition analysis for the social, behavioral, and health sciences. New York: Wiley. ISBN 978-0-470-22839-5
- Allan L. McCutcheon (1987). Latent class analysis. Quantitative Applications in the Social Sciences Series No. 64.. Thousand Oaks, California: SAGE Publications. ISBN 978-0-521-59451-6
- Leo A. Goodman (1974). “Exploratory latent structure analysis using both identifiable and unidentifiable models”. Biometrika 61 (2): 215-231. doi:10.1093/biomet/61.2.215.
- Paul F. Lazarsfeld, Neil W. Henry (1968). Latent Structure Analysis
外部リンク
- Statistical Innovations, Home Page, 2016. 潜在クラスソフトウェア(Latent GOLD 5.1)、無料デモ、チュートリアル、ユーザーガイド、ダウンロード可能な出版物を提供するWebサイト。オンラインコース、FAQ、その他の関連ソフトウェアも含まれている。
- The Methodology Center, Latent Class Analysis, ペンシルベニア州立大学の研究センター、無料ソフトウェア、FAQ。
- John Uebersax, Latent Class Analysis, 2006. 潜在クラス分析のための参考文献、ソフトウェア、リンク、FAQを提供するWebサイト。
- 潜在クラスモデルのページへのリンク