データの処理について
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/17 06:31 UTC 版)
論文に掲載されるデータは、必ずしも生データである必要はなく、適切な処理が施されたものがほとんどである。例えば、「ここ何十年の小学生の身長の変化について」というテーマを考える場合には、生データには何十年にわたって蓄積された膨大な数の小学生一人一人の「測定日、測定者、氏名、年齢、学年、所属する学校、性別、身長、その他の身体的特徴(体重、胸囲等)」のデータが下敷きになければならない(仮になければ捏造であり、ほとんどの場合において科学における不正行為である)。しかし、その全部を開示したとしたら読むものはウンザリするだろうが、それ以前に個人情報の漏洩である。また、このようなケースにおいては余程信じがたい結果が得られた場合を除き、生のデータを開示しなければ論文の内容自体を認めないというものもいないだろう。さらに言えば、「ここ何十年の小学生の身長の変化について」を論じるものが自分でその生データ全てに目を通している(データの取得、処理の過程全てに主体的にかかわっている)必要性もないだろう。「ここ何十年の小学生の身長の変化について」というテーマに照らして必要な統計処理が施された二次的なデータがあれば充分である(妥当性は出典の明記をもってかえられる)。 別の例としては、「周期ノイズ」などのように明らかにノイズと分かるようなものをフィルターでカットするケースがある。意図的にフィルターをかけなかったとしても、(例えばMP3のように)装置の特性から特定の周波数成分がカットオフされるなどのことは多々ある。それらのカットオフは必ずしも問題とならず、問題にならない場合には一々そういうカットオフがなされていることを書かないことがほとんどである(言い換えれば、カットオフのない計測機器など世の中に存在しない)。 そのほかにキャリブレーションの問題がある。通常の計測機器は、キャリブレーションが必要である。例えば、液柱温度計における一次情報は、厳密には温度そのものではなく液柱の高さであるが、「水の沸点の温度」(標準の専門家が世界最高レベルの精度を競うようなケースを除く)を調べるときに誰もそこまで開示しろとは言うまい。特にことわりもなく「キャリブレーション後」のデータを掲載すればよい。もちろん、キャリブレーション方法や統計処理などの方法の妥当性が自明でない場合には、Methodの欄で明確にその手法を述べておく必要はある。学生実験のレベルでは、キャリブレーションは考察に該当する場合もある。 また、小数点の切り上げや、単位の表記などについて、いろいろな約束事が存在する。これらについては、第一義には投稿規定に従い、投稿規定に明記がない場合には、国際規格に従うべきだが、国際規格内でもいくつかの混乱が見られるため、例えば単位の換算や、上本等に解説をゆだねる。また、曲線回帰等、「考察」的な要素の多いものについては、"Discussion"の役割と構成にて後述する。
※この「データの処理について」の解説は、「IMRAD」の解説の一部です。
「データの処理について」を含む「IMRAD」の記事については、「IMRAD」の概要を参照ください。
- データの処理についてのページへのリンク