きかい‐がくしゅう〔‐ガクシフ〕【機械学習】
機械学習
【英】Machine learning
機械学習とは、言語やゲームなどをはじめとした人間の様々な知的活動の中で、人間が自然と行っているパターン認識や経験則を導き出したりするような活動を、コンピュータを使って実現するための技術や理論、またはソフトウェアなどの総称である。
通常、機械学習では一定数以上の訓練データを下にして、ナイーブベイズをはじめとした様々なアルゴリズムを用いて規則性や法則性などを学習させる。その後、テストコレクションに含まれるあらかじめ人間によって付与された正解と、機械学習の結果として出来上がったソフトウェアが導きだす正解とを比較して、精度や汎用性などを評価する。
機械学習に用いられる主なアルゴリズムとしては、最も単純で汎用的な「ナイーブ・ベイズ」、複数のルールなどに基づいた基準を構築する際などに用いられる「決定木」、クラスタリングなどで用いられることが多い「K-平均法」、サポート・ベクター・マシンなどに代表されるカーネル法、などがある。
機械学習
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/09/12 09:38 UTC 版)
機械学習(きかいがくしゅう、英: machine learning、ML)とは、コンピュータプログラムに ある分野のデータを繰り返し与えることで そこに内在する規則性など[注釈 1]を学習させ、未知のデータが与えられた際に学習結果に当てはめて予測・判断・分類などを行えるようにする仕組み[1]。「経験」(と研究者が呼ぶデータ)から学習することで自動で改善するコンピューターアルゴリズム[2][3]。およびそれの研究領域[2][3]。英語を音写して日本語でもマシンラーニングと呼ぶことがある。
注釈
出典
- ^ 厳密な " 規則性 " でなければ学習できないわけではなく、機械学習はむしろ基本的には、相関関係の相対的な 強さ/弱さ の程度を学習する。
- ^ 2006年のことだが、ネットフリックスは、同社のレコメンダシステムより10%以上高性能な(つまりユーザーの好みをより正確に予測する)プログラムを捜す競技会 Netflix Prize を開催した。この競技会は数年かけて行われ、AT&T Labs のチームが「プラグマティック・ケイオス」(英: Pragmatic Chaos)という機械学習プログラムで10.06%の性能向上を実現して2009年に優勝し優勝賞金100万ドルを獲得した。[27]。
- ^ IT用語辞典 e-words【機械学習】
- ^ a b “Machine Learning textbook”. www.cs.cmu.edu. 2020年5月28日閲覧。
- ^ a b Harnad, Stevan (2008), “The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence”, in Epstein, Robert; Peters, Grace, The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer, Kluwer, pp. 23–66, ISBN 9781402067082
- ^ Samuel, Arthur (1959). “Some Studies in Machine Learning Using the Game of Checkers”. IBM Journal of Research and Development 3 (3): 210–229. doi:10.1147/rd.33.0210.
- ^ Mitchell, T. (1997). Machine Learning. McGraw Hill. pp. 2. ISBN 978-0-07-042807-2
- ^ a b #瀧 p.20.
- ^ a b c d e f #ESL p11-12
- ^ a b c d e f g h i j k l m n o p q r s t u v w x y EMERITAS, What are Machine Learning Applications?
- ^ [1]
- ^ #bishop2006
- ^ Friedman, Jerome H. (1998). “Data Mining and Statistics: What's the connection?”. Computing Science and Statistics 29 (1): 3–9.
- ^ a b #GBC 5.1.3節
- ^ #金森 p.3.
- ^ #瀧 p.8.
- ^ a b #瀧 p.36.
- ^ #瀧 p.30.
- ^ “Lecture 12: Bias-Variance Tradeoff”. CS4780/CS5780: Machine Learning for Intelligent Systems [FALL 2018]. コーネル大学. 2020年11月10日閲覧。
- ^ #金森 p.13.
- ^ #金森 p.9.
- ^ a b #ESL p22-23
- ^ a b c d e f #ESL p559-561
- ^ Bishop, C. M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN 978-0-387-31073-2
- ^ 統計的学習理論, 金森敬文, 機械学習プロフェッショナルシリーズ, 講談社, 2015, ISBN 9784061529052
- ^ "統計的機械学習理論と ボルツマン機械学習" 安田 宗樹. 山形大学
- ^ 上田. "統計的機械学習入門" NII. https://www.youtube.com/watch?v=wqb3k22toFY&t=478
- ^ Yoshua Bengio (2009). Learning Deep Architectures for AI. Now Publishers Inc.. p. 1–3. ISBN 978-1-60198-294-0
- ^ "BelKor Home Page" research.att.com
- ^ a b c #本橋2018 1.3章「人工知能の利用用途」「人工知能の3つの役割」の冒頭付近。
- ^ a b c d e #本橋2018 1.4章「認識の具体例」図1-4「画像認識の具体例」
- ^ a b c #本橋2018 1.4章「認識の具体例」図1-5「音声入力の具体例」
- ^ a b c #本橋2018 1.4章「認識の具体例」図1-6「文章解析・文章認識の具体例」
- ^ a b c #本橋2018 1.4章「認識の具体例」図1-7「異常検知の具体例」
- ^ #本橋2018 1.5章 「分析とは?」冒頭
- ^ a b c d e #本橋2018 1.5章「分析の具体例」図1-8「数値の予測の具体例」
- ^ a b c d #本橋2018 1.5章「分析の具体例」図1-9「イベントの発生の予測の具体例」
- ^ a b c d e #本橋2018 1.6章「対処の具体例」図1-10「行動の最適化の具体例」
- ^ a b c #本橋2018 1.6章「対処の具体例」図1-12「作業の具体化の具体例」
- ^ a b c #本橋2018 1.6章「対処の具体例」図1-13「表現の生成の具体例」
- ^ 英: DataRobot
- ^ DataRobot: https://www.datarobot.com
機械学習
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/26 00:11 UTC 版)
「機械学習」も参照 機械学習と圧縮の間には密接な関係がある。ある系列の完全な履歴を入力として事後確率を予測するシステムは(出力分布に対して算術符号を使用することで)最適なデータ圧縮に利用でき、一方最適な圧縮器は(履歴から最もうまく圧縮するシンボルを見つけることで)予測に利用できる。この等価性を利用して、データ圧縮は「一般知能」(general intelligence) を評価するベンチマークとして使われてきた。
※この「機械学習」の解説は、「データ圧縮」の解説の一部です。
「機械学習」を含む「データ圧縮」の記事については、「データ圧縮」の概要を参照ください。
機械学習
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/05 03:22 UTC 版)
かつては、手作業で評価関数が作られていたが、Bonanzaの開発者保木邦仁は、機械学習によって評価関数を作成した。これによりこれまでの他のソフトが見落としていた(あるいは開発者が軽視していた)指し手に高い評価を与えることが可能となった。この「評価関数のパラメータの自動生成」は「ボナンザ・メソッド」と呼ばれ、コンピュータ将棋史上最大のブレイクスルーの一つと見なされている。 2009年に開催された第19回世界コンピュータ将棋選手権では、決勝に進出した8ソフトの内、シードの激指とYSSを除く6ソフトが「ボナンザ・メソッド」を採用した。この結果、激指は2勝5敗、YSSは1勝6敗と惨敗し、翌年の選手権では「ボナンザ・メソッド」を採用した。 機械学習には、過去のプロ棋士の対戦棋譜からの教師あり学習と自己対戦による強化学習がありえるが、2015年頃まではプロ棋士の棋譜を用いた教師あり学習が主流であった。教師あり学習の場合、プロ棋士の手を再現するというのが機械学習のテーマとなる。ミスの少なさ、読み手数の長さでプロ棋士を超えようとしている。教師あり学習の欠点として、入玉模様など過去のプロ棋士の対戦棋譜にあまり出てこないパターンが弱くなる問題がある。 かつてはプロ棋士の対戦棋譜が学習用教材として用いられていたが、自己対戦棋譜による強化に成功したNineDayFeverの登場以降、コンピュータ同士の対戦棋譜が重視されるようになっている。2016年以降はプロ棋士の棋譜を使わず、自ら棋譜を生成し数億~数十億局面から浅い探索での評価値を深い探索での評価値に近づけるように学習するNineDayFeverの強化学習が一般的になり、入玉の評価も大幅に改善された。
※この「機械学習」の解説は、「コンピュータ将棋」の解説の一部です。
「機械学習」を含む「コンピュータ将棋」の記事については、「コンピュータ将棋」の概要を参照ください。
機械学習
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/09/18 06:54 UTC 版)
indiexpoはプレイヤーの評価やコメントなどの活動に基づいて、個人に合わせたゲームをおすすめする機能があります。 インディーパッド 2017年にはindiepadというタイトルのAndroidアプリがリリースされ、スマートフォンをゲームパッドとして使って、indiexpoで公開されているゲームをプレーできるようになりました。これにより、Constructコミュニティーで多くの支持を得ました。 このシステムの特徴は、開発者にとっての実装の単純さです。実際にはゲームを修正する必要はありません。ゲームをサイトにアップロードするときにこの機能を有効に設定するだけです。 ローカルのマルチプレイヤーセッションに表示され、最大4人の同時プレーが楽しめます。
※この「機械学習」の解説は、「indiexpo」の解説の一部です。
「機械学習」を含む「indiexpo」の記事については、「indiexpo」の概要を参照ください。
機械学習
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/16 10:21 UTC 版)
「ニワトリのヒナの雌雄鑑別」の記事における「機械学習」の解説
機械学習によって鑑別する手法が開発中だが、まだ精度が不十分で実用化には至っていない。
※この「機械学習」の解説は、「ニワトリのヒナの雌雄鑑別」の解説の一部です。
「機械学習」を含む「ニワトリのヒナの雌雄鑑別」の記事については、「ニワトリのヒナの雌雄鑑別」の概要を参照ください。
機械学習
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/01 22:34 UTC 版)
機械学習の分野では過学習(overtraining)とも呼ばれる。過剰適合の概念は機械学習でも重要である。通常、学習アルゴリズムは一連の訓練データを使って訓練される。つまり、典型的な入力データとその際の既知の出力結果を与える。学習者はそれによって、訓練データでは示されなかった他の例についても正しい出力を返すことができるようになると期待される。しかし、学習期間が長すぎたり、訓練データが典型的なものでなかった場合、学習者は訓練データの特定のランダムな(本来学習させたい特徴とは無関係な)特徴にまで適合してしまう。このような過剰適合の過程では、訓練データについての性能は向上するが、それ以外のデータでは逆に結果が悪くなる。
※この「機械学習」の解説は、「過剰適合」の解説の一部です。
「機械学習」を含む「過剰適合」の記事については、「過剰適合」の概要を参照ください。
機械学習と同じ種類の言葉
- 機械学習のページへのリンク