“分而治之,逐一击破”的决策树分类应用实例
“分而治之,逐一击破”
前言
随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的决策树分类应用实践案例。
一、数据集
在案例开始前,自然要先有数据集(你可以理解成做实验需要用的小白鼠),在本例中,我采用的是常见的鸢尾花数据集。考虑二维图形更直观,因此,选取了鸢尾花的两个特征来作图。
from sklearn.datasets import load_iris
iris = load_iris()
x = iris.data[:,2:4]
y = iris.target
plt.scatter(x[:,0],x[:,1],c=y)
plt.show()
petal length:花瓣长度 petal width:花瓣宽度 选取的两个特征
二、sklearn中的决策树
因为是实战案例,公式推导的方法就不演示了,直接用调库大法。
1.引入库
Sklearn.tree 中的DecisionTreeClassifier分类器
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(max_depth=2,criterion='entropy') #max_depth:决策树的深度,criterion:"gini"或者"entropy"
clf.fit(x,y)
2.分类结果可视化
3.决策树可视化
from sklearn.tree import plot_tree
plot_tree(clf)
小结,先声明一下X[1]特征就是花瓣宽度这个特征,弄清楚了这个,图片就好看懂了。根据决策树可知,最后划分成了3类,第一阶段根据花瓣宽度<=0.8划分为第一类,共50个数据,再再根据花瓣宽度>0.8且花瓣宽度<=1.75划分为为第二类,共49+5个数据,剩下的根据花瓣宽度>1.75划分为为第三类,共1+45个数据。
总结
以上就是决策树分类模型的具体应用,虽然分类的任务是解决了,但是这个分类结果好不好或者说这个模型精确度怎样?还请大家留意下一篇文章,会涉及决策树分类模型的评价以及该模型的优缺点,还请大家多多关注。