码迷,mamicode.com
首页 > 其他好文 > 详细

决策树

时间:2017-11-02 11:20:29      阅读:149      评论:0      收藏:0      [点我收藏+]

标签:就是   方案   算法   决策   car   树节点   模块   最优   大量   

决策树分类器就像带有终止块的流程图,终止块表示分类结果。开始处理数据集时,我们首先需要测量集合中数据的不一致性,也就是熵,然后寻找最优方案划分数据集,知道数据集中的所有数据属于同一分类。ID3算法可以用于划分标称型数据集。构建决策树时,我们通常采用递归的方法将数据集转化为决策树。一般我们并不构造新的数据结构,而是使用python语言内嵌的数据结构字典存储树节点信息。

使用Matplotlib的注解功能,我们可以存储的树结构转化为容易理解的图形。Python语言的pickle模块可以存储决策树的结构。但是决策树可能会产生过多的数据集划分,从而产生过度匹配数据集的问题。我们可以通过裁剪决策树,合并相邻的无法产生大量信息增益的叶节点,消除过度匹配问题。

除了ID3算法外,最流行的决策树构造算法是C4.5和CART,接下来做相应的介绍。

决策树

标签:就是   方案   算法   决策   car   树节点   模块   最优   大量   

原文地址:http://www.cnblogs.com/kfpa/p/7770892.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!