数据发掘系列(三): 决策树模型

举一个例子:目标销售

我们面对调查数据集,头很大:

  • 我们收集的记录,可能是数以万计的数据。
  • 我们可以找到我们的目标群体吗?哪些人会为我们的商品买单?
  • 怎样找到用户有效转化的的因素?即如何了解潜在用户?

我们需要一些动作:

  • 用一个分类器来检查内在关系,并做出未来的预测。
  • 下次向选定的家庭发送促销小册子。实现目标销售。

首先,我们来梳理一下调查的数据:

然后,建立一个树模型:

 

最后,我们发现以下规律:

  • (地域 = 农村) → (结果 = 答复)
  • (地域 = 城市) 和 (回头客 = 是) → (结果 = 无响应)

通过上边的数据梳理和决策树模型的建立,明确了我们的潜在客户(农村或者没上过当的小白用户)。等到村里边的人们赶集的时候发发传单,转化率很乐观。

这里需要提的一点是,上边的决策树模型是众多模型中的一种,比如其中有一种模型对城市的家庭男女方是否离异做了判决,树的复杂度高了,对我们的预测结果却没有任何帮助。

做决策的时候你需要一把“奥卡姆的剃刀”

“当你有两个相互竞争的理论, 做出完全相同的预测时, 简单的就更好了。”

“解释任何现象都应该尽可能少的假设, 剔除那些没有区别的解释。”

剃刀这个词是指剃去不必要的假设,以得到最简单的解释,更简单的树通常是首选。。

关于决策树模型总结,

在机器学习中,决策树是一个预测模型,是直观的运用统计概率分析的图法。它表示对象属性和对象值之间的一种映射,树中的每一个节点表示对象属性的判断条件,其分支表示符合节点条件的对象。树的叶子节点表示对象所属的预测结果。

题外话,通过数据分析,这款产品没有回头客,质量一定有问题,我会拒绝上边的分析。

1 COMMENTS
  1. 2018/09/04
    Page

    前人总结的一些规律和原理真的能让人秒懂很多道理啊

LEAVE A REPLY

loading