統計学
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/01/31 15:08 UTC 版)
教育
統計学は「実学」に端を発しており、近代社会以降世界に普及した「市場経済社会」を牽引した原動力とも言える学問である。そのため、自然科学・社会科学・人文科学の各分野の垣根を越えて分化かつ拡大を続ける中、基礎において汎用性が高い学問の構造を有している[要出典]。
社会生活の至る所で統計技術の適用が貢献できる場面がある以上、統計学とその適用方法を学習する上では社会の実態に即して頻繁に技法を適用してみることが重要であり、そのように出来るためには何よりまず統計処理を身近で制限無く実施できるような「統計処理環境」の備えが必要である。
PC・ソフトウェア・インターネット環境などのIT環境が急速に進化低廉化して普及したことで身近に統計処理環境を持ちうるようになり、なおかつ莫大な統計情報がインターネットを通じて公開されているため、研究・調査・学習の処理材料にも不自由しない。
実際21世紀に入って以降は、それまでの確率論と数理統計学を重点に置いたカリキュラムに加え、データを処理して求める答えに近づく「データ解析」のスキルが教育されるようになっている(データサイエンス論)。
元来コンピュータを使った数値計算に際してはまず、IEEE 754規格にあるように丸め誤差が暗黙のうちに生じることや、有効数字の概念の認識が重要で、子供のころ算数で学んだような計算結果にはならないことがあることを知っておかねばならない。さらに、統計計算では殊に重要な乱数についても、コンピュータ上で用いるのは疑似乱数であることや、良質な疑似乱数生成方式「メルセンヌ・ツイスタ」を計算ソフトウェアや開発用言語の全てが必ず備えているわけではないこと、暗号論的乱数はさらにまた別の乱数概念であること、なども実は大切な基礎知識である。
人が得意とするパターン認識の力を積極的に用いるため、統計データの「グラフ化」が古来常套手段として用いられているが、ITの支援を得ることで大量のデータを様々な形に、しかも瞬時にグラフ化(あるいは『可視化』)することが可能となった。そのためのグラフ作成ソフトも多数存在するが、その他の数値解析ソフトウェアや数式処理システム、そして殊に下記のような統計アプリケーションではグラフ化するための機能が充実している。
一方、近年オフィスソフト機能等で極端なグラフ装飾を施すことが横行している。この結果として、例えば3Dグラフなどを安易に用いると遠近感や区間面積などから表示すべき真の数量とは異なった認識を受け手に与える事がある。本来3Dグラフ表示は人の空間認識力を活かし得る優れた表現手法であるが、意味なく勢い付け等で用いるのは本来的な視覚化からは退行するばかりか、意図して受け手の誤認識を誘導する事も可能となる。「グラフは直感的に分かるから全て善である」と一般に認識されていることや、前出「統計の困難さ」にある内容をふまえると、統計の視覚化とその解釈に関するリテラシ教育は初等段階から特に注意を要する。
上記のように、用いる統計処理環境ごとに適用分野・目的・方法論・使用者との相性などは異なる。そういった統計処理環境固有の特性なども含めて、いかなる道具もそうであるように、数多く体験の機会を作るほかに理解の早道は無い。
広く普及した表計算ソフトウェアが統計処理・グラフ表現機能を持っているので、誰でも手軽に統計処理入門体験は出来る。しかしあくまでビジネスソフトであり、科学技術ソフトではないExcelの計算の信頼性については常に批判が絶えない[55][56][57][58](Excelに限らず普及している表計算ソフトウェアはどれも信頼に足る統計計算はできないとの報告もある[59])。
近年では研究・教育機関が公開するオープンソースなフリーソフトの中からきわめて優秀な計算ソフトウェアが育っており、プロプライエタリソフトの問題点顕在化により関心の高まった統計技術資産の持続可能性という観点からも、統計教育にあたってはこれらオープンソースソフトウェアの積極的な活用が推奨される。
統計の研究・教育に適した代表的なフリーソフトウェア
- アプリケーション
- R言語 - GNU GPL・フリーウェアの統計用数値解析ソフトウェア[60]。確率分布や統計モデルを簡潔に記述でき、無限大・非数・欠損値定数を持つベクトル処理言語。アメリカ食品医薬品局公認。
- GNU Octave - GNU GPL・フリーウェアの数値解析ソフトウェア。理工学分野でのデファクトスタンダードとも言えるMATLABと互換の命令体系を持つベクトル処理言語[61]。
- Scilab - Scilab License・フリーウェアの数値解析ソフトウェア[62][63][64][65]。MATLAB類似の文法をもったベクトル処理言語。付属するソフトウェアScicosを用いてダイアグラム操作で視覚的にシステムフロー図を描いてシステムダイナミクスシミュレーションが可能。INRIAが開発。
- Ox言語 - 行列計算のために作られたベクトル処理言語。フリーウェア。オックスフォード大学が開発。
- Maxima - 数式処理システム[66]。MITのMacsyma直系のGNU GPL・フリーウェア版。
- Risa/Asir - 数式処理システム[67][68]。マルチプラットホーム。OpenXMを実装。フリーウェア。富士通が開発。
- ライブラリ
- GNU Scientific Library
- Apache Commons Math
- SAMMIF
- DLLSA
- ISMLIB
- Incanter(Clojure用ライブラリ)
- NumPy(Python用ライブラリ)
- SciPy(Python用ライブラリ[69][70][71])
統計計算に関連するソフトウェアのカテゴリ
日本
日本においては統計学がそれぞれの分野へ分化された形で組み込まれているため「統計学科」を置く大学がなかったが、2017年度に滋賀大学が日本で初めて統計学を研究の核とするデータサイエンス学部を新設。一橋大学がソーシャル・データサイエンス研究科・学部を2023年度に新設予定である。
国立の統計学研究・教育機関としては、1944年に設立された統計数理研究所があり、AIC、数量化理論、確率微分方程式などの顕著な成果を生み出し、統計学研究を牽引している[注釈 4]。
平成21年(2009年)11月に公示された[72]新学習指導要領において、中学・高校数学における統計単元の拡充がなされた。
中学校では、中学数学においては「統計」を扱う単元が新設された(従来は確率を扱う単元はあったが統計処理を扱う単元はなかった)。
高校では、それまで高校数学Bにおいて選択履修とされていた「統計の基礎的概念」(代表値・相関係数ほか)を扱う単元が数学Iに移され「データの分析」として必修化された。また、それまで数学Cにおいて理系生のみが履修していた「確率分布と統計的な推測」が数学Bに移されて、文系生でも履修可能になった。
これらの変更は2012年(平成24年)度入学生から適用されている。(詳細は、「 数学 (教科) 」を参照)
「データの分析」はデータの散らばりと相関について教え、その目的は「統計の基本的な考えを理解するとともに,それを用いてデータを整理・分析し傾向を把握できるようにする。」ことである。総務省統計局では「学校における統計教育の位置づけ」[73][74]を解説し、指導者の支援にあたっている。
注釈
出典
- ^ “「統計学が最強」の西内啓氏「パチンコには二度と行かない」”. NEWSポストセブン (2013年5月3日). 2017年12月23日閲覧。
- ^ Wonnacott, T. H., & Wonnacott, R. J. (1990). Introductory statistics for business and economics (Vol. 4). New York: Wiley.
- ^ Newbold, P., Carlson, W. L., & Thorne, B. (2013). Statistics for business and economics. Boston, MA: Pearson.
- ^ Aron, A., & Aron, E. N. (1999). Statistics for psychology. Prentice-Hall, Inc.
- ^ Lang, T. A., Lang, T., & Secic, M. (2006). How to report statistics in medicine: annotated guidelines for authors, editors, and reviewers. ACP Press.
- ^ 竹内啓 2018, p. 82.
- ^ a b 竹内啓 2018, p. 85.
- ^ 「統計」という言葉の起源(2022年10月22日閲覧)
- ^ a b c Masahiko Asano (2018) 記述統計学. 拓殖大学 - ウェイバックマシン(2020年1月30日アーカイブ分)
- ^ 英: Garbage in, garbage out.
- ^ モルテン・イェルウェン 2015, p. 192.
- ^ 竹内啓 2018, p. 4.
- ^ 竹内啓 2018, pp. 58–59.
- ^ 竹内啓 2018, p. 72.
- ^ 竹内啓 2018, pp. 75–26.
- ^ 竹内啓 2018, p. 79.
- ^ 竹内啓 2018, pp. 166–167.
- ^ 竹内啓 2018, p. 128.
- ^ 岩沢宏和 2014, p. 164.
- ^ 竹内啓 2018, p. 193.
- ^ 竹内啓 2018, pp. 211–212.
- ^ 竹内啓 2018, pp. 207–208.
- ^ 竹内啓 2018, pp. 215–216.
- ^ 「人間と社会を変えた9つの確率・統計学物語」p.162 松原望 SBクリエイティブ 2015年4月24日初版発行
- ^ 「生体認証国家 グローバルな監視政治と南アフリカの近現代」p.32 キース・ブレッケンリッジ 堀内隆行訳 2017年8月24日第1刷 岩波書店
- ^ 竹内啓 2018, pp. 234–235.
- ^ 竹内啓 2018, pp. 238–239.
- ^ 岩沢宏和 2014, p. 205.
- ^ 竹内啓 2018, p. 258.
- ^ 竹内啓 2018, pp. 291–292.
- ^ 竹内啓 2018, p. 456.
- ^ Tolman, R. C. (1979). The principles of statistical mechanics. Courier Corporation.
- ^ Ruelle, D. (1999). Statistical mechanics: Rigorous results. World Scientific.
- ^ Thompson, C. J. (2015). Mathematical statistical mechanics. Princeton University Press.
- ^ 岩沢宏和 2014, pp. 263–264.
- ^ 第3節 数 学 < 高等学校学習指導要領(昭和57年4月施行)
- ^ 詳しくは「確率・統計」も参照のこと。
- ^ Chow, Y. S., & Teicher, H. (2003). Probability theory: independence, interchangeability, martingales. Springer Science & Business Media.
- ^ Feller, W. (2008). An introduction to probability theory and its applications (Vol. 2). John Wiley & Sons.
- ^ Durrett, R. (2019). Probability: theory and examples (Vol. 49). Cambridge University Press.
- ^ Jaynes, E. T. (2003). Probability theory: The logic of science. Cambridge University Press.
- ^ Chung, K. L., & Zhong, K. (2001). A course in probability theory. Academic Press.
- ^ 赤摂也. (2014). 確率論入門. 筑摩書房.
- ^ 池田信行, 小倉幸雄, 高橋陽一郎, & 眞鍋昭治郎共著. (2006). 確率論入門.
- ^ Alpaydin, E. (2020). Introduction to machine learning. MIT Press.
- ^ Marsland, S. (2015). Machine learning: an algorithmic perspective. CRC Press.
- ^ 大関真之. (2016). 機械学習入門 ボルツマン機械学習から深層学習まで. 株式会社 オーム社.
- ^ Murphy, K. P. (2012). Machine learning: a probabilistic perspective. MIT Press.
- ^ 竹内啓 2018, p. 34.
- ^ 竹内啓 2018, p. 15.
- ^ 竹内啓 2018, p. 177.
- ^ モルテン・イェルウェン 2015, pp. 28–31.
- ^ a b ジョエル・ベスト 2002.
- ^ パオロ・マッツァリーノ 『反社会学講座』イースト・プレス、2004年。ISBN 4-87257-460-5。
- ^ Excel使うな Okumura's Blog 三重大学高等教育創造開発センター教授・教育情報システム部門長 奥村晴彦のブログ
- ^ McCullough, B. D., ed (2008-06-15). “Special Section on Microsoft Excel 2007” (英語). Computational Statistics & Data Analysis 52 (10): 4567-4878. doi:10.1016/j.csda.2008.03.009.
- ^ Excel は,コンピュータ・ソフトウェアの三種の神器のようになっていますが,とんでもないこともあるというお話。 群馬大学社会情報学部教授 青木繁伸のサイト
- ^ 間違いだらけのExcel関数ヘルプ「財務・統計関数編」市販解説本で孫引きしている点も警告
- ^ On the Numerical Accuracy of Spreadsheets : the Journal of Statistical Software Vol.34, Issue4, Apr2010
- ^ Ihaka, R., & Gentleman, R. (1996). R: a language for data analysis and graphics. Journal of computational and graphical statistics, 5(3), 299-314.
- ^ Octaveの精義 - フリーの高機能数値計算ツールを使いこなす, 松田七美男(2011)
- ^ Bunks, C., Chancelier, J. P., Delebecque, F., Goursat, M., Nikoukhah, R., & Steer, S. (2012). Engineering and scientific computing with Scilab. Springer Science & Business Media.
- ^ 大野修一. (2009). Scilab 入門: フリーソフトで始める数値シミュレーション. CQ出版.
- ^ 上坂吉則. (2010). Scilab プログラミング入門. 牧野書店.
- ^ Thanki, R. M., & Kothari, A. M. (2019). Digital image processing using SCILAB. Springer International Publishing.
- ^ 岩城秀樹:「Maximaで学ぶ経済・ファイナンス基礎数学」、共立出版、ISBN 978-4320110311(2012年12月8日)
- ^ Noro, M., & Takeshima, T. (1992, August). Risa/Asir-a computer algebra system. In Papers from the international symposium on Symbolic and algebraic computation (pp. 387-396).
- ^ Noro, M. (2003). A computer algebra system: Risa/Asir. In Algebra, Geometry and Software Systems (pp. 147-162). Springer, Berlin, Heidelberg.
- ^ Jones, E., Oliphant, T., & Peterson, P. (2001). SciPy: Open source scientific tools for Python.
- ^ Bressert, E. (2012). SciPy and NumPy: an overview for developers. " O'Reilly Media, Inc.".
- ^ Blanco-Silva, F. J. (2013). Learning SciPy for numerical and scientific computing. Packt Publishing Ltd.
- ^ 高等学校学習指導要領解説・数学編 - 文部科学省
- ^ 学校における統計教育の位置づけ|統計学習の指導のために(先生向け)
- ^ 学校における統計教育の位置づけ < 統計学習の指導のために 先生向け < 統計局ホームページ
- ^ 渡部洋. (1999). ベイズ統計学入門. 福村出版.
- ^ 中妻照雄. (2007). 入門ベイズ統計学.
- ^ 豊田秀樹. (2015). 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門. Asakura Shoten.
- ^ 松原望. (2010). ベイズ統計学概説: フィッシャーからベイズへ. 培風館.
- ^ 樋口知之. (2011). 予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで. 講談社.
統計学と同じ種類の言葉
「統計学」に関係したコラム
-
FXやCFDの線形回帰とは、価格の散らばりを1つの線にまとめて表したテクニカル指標のことです。線形回帰は統計学などで用いられます。線形回帰の求め方はいくつかありますが、一般的にはある期間の価格と線との...
- 統計学のページへのリンク