C4.5と ID3
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/02 07:08 UTC 版)
C4.5はID3から多くの改良が施されている。以下にその一部を列挙する。 連続値と離散値の双方の取り扱い 連続値の属性を扱うために、C4.5は閾値を生成し、リストをその閾値以上か以下か、あるいは等しいか否かで分割する。[Quinlan, 96] 属性値が欠損している教師データの取り扱い C4.5は属性値が欠損している場合「?」とマークすることを許している。欠損した属性値は単にゲインとエントロピーの計算に使われないだけである。 コストが異なる属性の扱い 生成後の枝打ち C4.5では生成された後、木を遡り役に立たない枝をリーフノードと置き換えることで取り除こうとする。
※この「C4.5と ID3」の解説は、「C4.5」の解説の一部です。
「C4.5と ID3」を含む「C4.5」の記事については、「C4.5」の概要を参照ください。
- C4.5と ID3のページへのリンク