特徴選択
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/10/01 09:16 UTC 版)
正則化
L1 正則化、L0 正則化を用いても特徴選択できる。詳細は正則化の項目を参照。
特徴選択が埋め込まれている手法
- L1正則化:Lasso、エラスティックネット
- 決定木やランダムフォレスト
- 多変量適応的回帰スプライン
- Random multinomial logit
- Memetic algorithm
- ボトルネック層を持つ自己記述ネットワーク
- 決定木プルーニングステップのあるその他の多数の機械学習手法
特徴選択のためのソフトウェア
MATLAB, Scilab, NumPy, R言語などの多くの標準的なデータ解析ソフトウェア(参考:en:Category:Data analysis software)では、特徴選択の機能が提供されている。特徴選択に特化したソフトウェアとしては次のものがある。
- RapidMiner – 無料で公開されているオープンソースソフトウェア。
- Weka – 無料で公開されているオープンソースソフトウェア。
- Orange (ソフトウェア) – 無料で公開されているオープンソースソフトウェア。(orngFSSモジュール)。
- TOOLDIAG Pattern recognition toolbox – 無料で公開されている C のツールボックス。
- minimum redundancy feature selection tool – 無料で公開されている、最小冗長性による特徴選択を行う C/Matlab のソースコード。
関連項目
参考文献
- JMLR Special Issue on Variable and Feature Selection
- Feature Selection for Knowledge Discovery and Data Mining (本)
- An Introduction to Variable and Feature Selection (サーベイ)
- Toward integrating feature selection algorithms for classification and clustering (サーベイ)
- Searching for Interacting Features
- Feature Subset Selection Bias for Classification Learning
- M. Hall 1999, Correlation-based Feature Selection for Machine Learning
- 特徴選択のページへのリンク