「気づき」や「傾向」の発見
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/17 06:31 UTC 版)
「IMRAD」の記事における「「気づき」や「傾向」の発見」の解説
本節ではデータの解釈、即ち、データの解析/可視化から、傾向の把握や定式化、理由,メカニズムの推定に至るまでの流れに着目するが、「解析/可視化」とはここでは、 データの特徴や傾向の把握 異なるデータ間での比較 対象やサンプルの識別,区別,分類,同定 自分のデータと先行研究との比較 等といったことが出来るよう、必要に応じ、規画化、指標化(エンゲル係数だとかGDPだとかBMIのようなもの)をして統計図表等にまとめていくことを意味する。例えば「ある国のCMの主人公の男女比は女性のほうがやや多いのに対し、別の国だと男性が女性の5倍にのぼる」といった対照性に気が付けば、様々な意味での国民性の違いに至るであろう論点が抽出される。「何かの部品が破断するといった不具合が生じた際、同種の未破断の部品を観察すると、ある特定の箇所に多数のクラックがあり、使用年数に応じてクラックの大きさが大きくなっていったといった特徴が見いだせた」といった場合には、破断のメカニズムや対策手段に繋がり得る論点が抽出される。このように、「解析/可視化」の部分は、「気づき」の部分であり、論文の論点を充実させる上で非常に大きな意味を持つ。 「解析/可視化」について、類型化して例解する。尚、例には架空の研究(架空の研究と明示)が含まれる。また、出典のある研究も、類型の説明をするうえでわかりやすくなるよう、デフォルメを加えてある場合がある。 データの顕著な特徴や傾向を指摘し、簡単な説明を与える。 「細胞や組織等の画像を撮像する」、「ある量A(説明変数)と別の量B(目的変数)の関係を評価する」、あるいはある量A(条件)を振って別の量Bの値の変化(応答)を見るといったことをすると、興味深い特徴に気づくことがある。前者の例としては、「1週間ごとに靴底の写真を撮ると、ある特定の部分が他の部分に比べ早く擦り減っていってる」、後者の例としては「この地域では100年に一度大きな地震が来ている(周期性)」だとか、「ある動物に毎日1定のカロリーのエサを与えたとき、カロリー数を1000kcalとすると最も寿命が長かった(グラフの概形、ピーク)」等がある。このように変化の傾向や特徴、周期性、グラフにした時の概形(変曲点、ピーク等)に着目することで論点や気づきが得られることがある。[例]お茶の細菌抑制効果をA、B,C,Dの4種類のお茶で調べたところA>B>C>Dだった。A、B,C,Dは、この順に酸化処理(緑茶を酸化させると紅茶になるとかいった話)の時間が短い。従って、お茶の抗菌効果の原因物質は、酸化処理の過程で壊れるのであろう。(京都大学学生シンポジウムに学生が寄稿した論文、及びプレゼン資料 から。) [例]吹き矢をストローを使って作ってみた。半径rのストローを同じ圧力で吹いたときのグラフを書いてみた。これから、直径と飛距離の間の関係式がかくかく云々のように推定される。(架空の研究) [例]ある爬虫類の卵をインキュベータで温めながら孵化させたところ、インキュベータの温度がX度以上とY度以下では死滅。オス(メス)の比率の温度依存性のグラフを書いてみたところ図XXのようになった。従ってこの爬虫類では、発生時の温度に依存して性が決まるのであろう。(温度依存性決定) [例]胞胚期のイモリの胚から、動物極を取り出して、アクチビン環境下で培養したところ、アクチビン濃度に依存して予定運命が変わることが判った 。具体的には、 低濃度では血球細胞、間充織組織に分化し、 中濃度では、筋肉、神経管に、 高濃度では脊索が、 というように濃度依存的に組織分化が行われることを見出した。より詳細な業績も併せ、日本学士院賞受賞理由 を参照のこと。(浅島誠の実験。(分化誘導因子の発見)) 複数の種類(系列)からなるデータ同士を、いくつかの論点から比較し、際立った特徴や関係等を指摘する。 同じ条件/同じ尺度で複数のデータを比較してみると「2つ(以上)のデータは同じであるのか、違うのか?違うとしたら何が違うのか?」、例えば複数の系列をもつグラフを書いてみると 「系列1と系列2はほぼ同じである/異なる」 「系列1と系列2はほぼ同じ形をしているが、立ち上がりの位置,ピークの位置がずれている」 「系列1のほうが系列2よりも急峻に変化する」 「系列1が増加するにつれ、系列2が増加している」 「系列1と系列2の和が系列3と概ね一致している」 「系列1と系列2の比が常に一定である」 「ある前提に立つと系列1+系列2が系列3と概ね一致するはずだが実のところはそうなっていない」 のように、興味深い関係が見えてくることがある。特に比較をすることによって、はじめて関係や大小が見えてくる。[例]細胞Aと細胞Bの遺伝子の発現パタンをヒートマップを用いて表現すると強い類似性が認められた。 [例]「各年度に生まれた女子の名前のうち、語尾が「子」である名前の子供の率」の時系列を表すグラフ(系列1)と、テレビの普及率を表すグラフ(系列2)を並べてみたら、テレビの普及率が増加時期と「語尾が「子」である名前の子供の率」の増加時期がよく一致することが分かった。これから、かくかく云々のことがわかる。(京都大学学生シンポジウムに学生が寄稿した論文から) [例]某国おける人口(系列1)と、失業率(系列2)を重ねてみたところ、人口が増えるにつれ緩やかに失業率が増えていることが分かった。(架空の研究) [例]某声優9人からなるユニットμ(2010年結成)のCDの売り上げ(系列1)は今のところ学習曲線(時系列)に従っている。ユニットμを構成するメンバのうち、Nさん(系列2),Mさん(系列3;2013年ソロデビューのため2013年以前の数字はない)は、現時点で単独で、1万枚以上のCDを販売出来、Nさんはユニット結成以前の2009年から単独で1万枚以上のCDを販売出来たが、それ以外は単独名義でのCDの販売実績は皆無。ユニットμのCDの売り上げは毎回5万枚を超える。ユニットμの人気は、NさんMさんの人気だけでは説明がつかない上、メンバーそれぞれの人気の単純和でも説明がつかない。(架空の研究) [例]ウサギに獲得免疫がまだ成立していないウイルスに対する(精製度の悪い)ワクチンを接種したの場合の、免疫応答の強さを時系列のグラフに表した(系列1)ところ、免疫応答のピークは2回ある(日本学士院賞授賞理由を記載した書面の の第一図点線グラフの1日目と10日目を参照)。同じワクチンの遠心上澄のみを接種した場合には(系列2)、免疫応答のピークは、1日目のみであった(同出典の図1、黒の実線グラフ参照)。第二番目は、獲得免疫で、第一番目おそらく新しい種類の免疫だろう。さらに、新しい免疫の“素”(現在の言葉でいうとインターフェロン)は、液性の分画(遠心上澄)に含まれる因子なのであろう。(長野泰一-小島保彦の実験(インターフェロンの発見)) 測定値のヒストグラムや多次元ヒストグラムから、測定対象を分類/区別する。 「優秀な人とそうでない人」のように曖昧な概念はどこかで閾値を設けて区別せねばならない。「合格と不合格」もどこかで境界を作らねばならない。このような場合、理想的には何らかの評価の得点分布を表すヒストグラムが2つのピークを持ち、その間に度数が0の階級が複数連続してあるといったようにヒストグラムが綺麗にスプリットしていれば、ある集団を2つのグループに分類することが出来る。ただ、もし「優秀な人とそうでない人」を区別しても面白くない。だから、例えば「入学試験の成績が優秀だった群とそうでなかった群が入学から年数がたつにつれどのように入れ替わっていくか」だとか、「優秀でなかった群を、特訓を加えた群とそうでない群にさらにわけ、その後どうなっていったか」、「本来均質だったハズの群が介入の相違によってどのような集団に変化するのか」といった介入の評価や追跡評価といった項目組み合わさることが多い。[例]入学試験の上位半分をA群、下位半分をB群とした。卒業試験において上位2割の内訳を評価したところA群出身が7割、B群出身が3割であった。 [例]学生に試験1を受けさせ、激励を与えた後、試験2を受けさせたところ、得点が顕著に上がった群(A)と下がった群(C)と、どちらともいえない群(B)の3種類に分かれた。プレッシャーに対する応答には3種類の人が判った。これらの群それぞれから無作為に抽出した5名ずつそれぞれに、練習なしでスピーチをさせた場合に、読み間違いが起こった頻度は、B群が最も低く、A群とC群は同程度であった。(架空の研究) [例]フローサイトメトリーのサイトグラムから、iPS細胞をある方法で分化誘導した際に少なくとも2種類の細胞が混ざることが判った。(架空の研究) [例]ある病気のスクリーニング検査で、閾値をどこにすると偽陽性、偽陰性、感度、特異度を適切となるか?(よくある設定)
※この「「気づき」や「傾向」の発見」の解説は、「IMRAD」の解説の一部です。
「「気づき」や「傾向」の発見」を含む「IMRAD」の記事については、「IMRAD」の概要を参照ください。
- 「気づき」や「傾向」の発見のページへのリンク