本站推荐+更多
图5.9引入新的字段“时尚用户I
引人Type节点,按照5. 3. 1中的数据处理要求定义数据方 向,如图5. 10所示:
0 _
Ofil Aprion COST jmSEft^P ‘?? R
B lai JL,1:
:?圖 m m
HMPxlc-Vfii&flP * ‘ ~
图5. n模型建立的整个流程图 5.4.3.1未剪枝(剪枝少)树
未剪枝是指在枸建决策树的过程中,剪枝程度参数设置Default : F
5.4.4. I 模型评价
是否对生成的决策树进行剪枝,或者说应该剪枝到什么程度, 这取决于多方面的因素,但最重要的参考因素是生成模型的精度。 我们首先来看未剪枝的树,该树共6层,生成的规则集共10条, 模型精度为85.3%,如图5. 13所示。我们可以看到,模型精度本 身并不是很高,没有达到90%,但作为对电信增值消费行为的分 析,这样的精度是可以接受的。因为目前人们对增值业务的需求 本身就不是很高,再加上每个消费个体的需求差异很大,所以模 型的精度对实际的CRM是有意义的,是可用的。经过多次设置不 同的剪枝程度,最终得到层次数为4,规则集数为7,精度为 83.4%的模型,如图5. 14所示。我们可以看出,最终确定的决策 树的层数和规则集数都比未剪枝树少,而模型精度相差并不多, 我们愿意牺牲微小的模型精度差别来换取更加简练的模型输出结 果,因为这样的结果更加具有实用性和可操作性。有时候,在不同的应用场合对模型的错判成本是不同的。
本站推荐