决策树的结果是唯一的吗?
不同的决策树它的结果不都一样。首先我们看一下决策树的生成过程:
(1)将所有的特征看成一个一个的节点;
(2)遍历当前特征的每一种分割方式,找到最好的分割点、将数据划分为不同的子节点,eg: N1、 N2、…、Nm;计算划分之后所有子节点的“纯度”信息;
(3)使用第二步遍历所有特征,选择出最优的特征,以及该特征的最优的划分方式,得出最终的子节点N1、 N2、…、Nm;(4)对子节点N1、N2、…、Nm分别继续执行2-3步,直到每个最终的子节点都足够“纯”。
从上述步骤可以看出,决策树的生成过程中有三个重要的问题:对数据进行分割、选择分裂特征以及什么时候停止分裂。