集計データの弱点
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/13 09:44 UTC 版)
横断研究には、個人レベルのデータ(国民健康調査などでは、個人ごとに1つの記録)を含める事が出来る。しかし、現代の疫学では、対象となる集団全体を調査することが不可能な場合がある為、横断研究では、別の目的で収集したデータの二次分析を行う事が多い。このような場合、研究者は個人の記録を入手する事が出来ず、集団レベルの情報を使用しなければならないことが多くある。このようなデータの主な入手先は、国勢調査局や疾病予防管理センターのような大規模な機関であることが多い。最近の国勢調査では、個人のデータは提供されず、例えば英国では個人の国勢調査データは100年後にしか公開されない。その代わり、データは通常、行政区域毎に集計される。集計されたデータに基づく個人に関する推測は、生態学的誤謬(英語版)によって弱められる。また、個人レベルのデータの集計に基づいて、集計された数に関する仮定がなされる「原子論的誤謬」を犯す可能性についても考慮すべきである(国勢調査区を平均して郡の平均値を算出するなど)。例えば、都市レベルでは乳幼児死亡率と世帯収入の間に相関関係がないが、個人レベルでは乳幼児死亡率と世帯収入の間に強い相関関係があるというのは事実かも知れない。集計データを用いる全ての統計は見掛けの相関(compositional effect)の影響を受ける為、重要なのは個人レベルでの所得と乳幼児死亡率の関係だけでなく、各都市における低所得者、中所得者、高所得者の割合である。症例対照研究は通常、個人レベルのデータに基づいている為、この問題はない。
※この「集計データの弱点」の解説は、「横断研究」の解説の一部です。
「集計データの弱点」を含む「横断研究」の記事については、「横断研究」の概要を参照ください。
- 集計データの弱点のページへのリンク