自媒体网站建设,建网站平台安全性,wordpress显示,百度网络电话友情提示#xff1a;此篇文章大约需要阅读 7分钟57秒#xff0c;不足之处请多指教#xff0c;感谢你的阅读。安装Anaconda Python集成环境下载环境anaconda下载选择安装环境下载过程中使用默认#xff0c;但有一个页面需要确认#xff0c;如下图。anaconda选择页面第一个勾…友情提示此篇文章大约需要阅读 7分钟57秒不足之处请多指教感谢你的阅读。安装Anaconda Python集成环境下载环境anaconda下载选择安装环境下载过程中使用默认但有一个页面需要确认如下图。anaconda选择页面第一个勾是是否把 Anaconda 加入环境变量这涉及到能否直接在 cmd中使用 conda、jupyter、 ipython 等命令推荐打勾。第二个是是否设置 Anaconda 所带的 Python 3.6 为系统默认的 Python 版本可以打勾。安装完成后在开始菜单中显示“Anaconda2”如下图所示。安装显示界面安装第三方程序包 Graphviz目的是在决策树算法中八进制最终的树结构。1、打开 Anaconda Prompt 输入 conda install python-graphviz回车即可完成安装如下图所示本图所示已经安装 了 graphviz包若之前没有安装这时会花点时间安装安装不用干预。安装决策树依赖包安装完成后先输入 python然后再输入 import graphviz测试是否成功安装如上图所示。需要设置环境变量才能使用新安装的 graphviz。Anaconda及依赖包环境变量设置首先查看 anaconda安装在哪个目录下可以打开 Spyder的属性看一看目标是什么目 录。例如本机的 anaconda安装路径为 C:\Users\lenovo\Anaconda2。下面设置环境变量(1) 在用户变量“path”里添加 C:\Users\lenovo\Anaconda2\Library\bin\graphviz(2) 在系统变量的“path”里添加 C:\Users\lenovo\Anaconda2\Library\bin\graphviz\dot.exe(3) 如果现在有正在打开的 anaconda 程序例如正在 Spyder那么关闭 Spyder再启动这 样刚才设置的环境变量生效。决策树分析格式化原始数据将下图的表 demo输入到 Excel中保存为.csv 文件(.csv为逗号分隔值文件格式)。注意将表 demo中的汉字值转换成数据字值例如“是否是公司职员”列中的“是”为“1” “否”为“0”。转换后的表中数据如下图所示。学习表编写数据分析代码编写程序对上面的数据进行决策树分类采用信息熵(entropy)作为度量标准。参考代码如下所示from sklearn.tree import DecisionTreeClassifier,export_graphvizimport graphvizimport csvdataset []reader csv.reader(open(demo.csv))for line in reader:if reader.line_num 1:continuedataset.append(line)X [x[0:4] for x in dataset]y [x[4] for x in dataset]clf DecisionTreeClassifier(criterionentropy).fit(X, y)dot_data export_graphviz(clf, out_fileNone)graph graphviz.Source(dot_data)graph.render(table);digraph Tree {node [shapebox] ;0 [labelX[0] 0.5\nentropy 0.94\nsamples 14\nvalue [9, 5]] ;1 [labelX[1] 1.5\nentropy 0.985\nsamples 7\nvalue [3, 4]] ;0 - 1 [labeldistance2.5, labelangle45, headlabelTrue] ;2 [labelentropy 0.0\nsamples 3\nvalue [0, 3]] ;1 - 2 ;3 [labelX[1] 2.5\nentropy 0.811\nsamples 4\nvalue [3, 1]] ;1 - 3 ;4 [labelentropy 0.0\nsamples 2\nvalue [2, 0]] ;3 - 4 ;5 [labelX[3] 0.5\nentropy 1.0\nsamples 2\nvalue [1, 1]] ;3 - 5 ;6 [labelentropy 0.0\nsamples 1\nvalue [1, 0]] ;5 - 6 ;7 [labelentropy 0.0\nsamples 1\nvalue [0, 1]] ;5 - 7 ;8 [labelX[1] 2.5\nentropy 0.592\nsamples 7\nvalue [6, 1]] ;0 - 8 [labeldistance2.5, labelangle-45, headlabelFalse] ;9 [labelentropy 0.0\nsamples 4\nvalue [4, 0]] ;8 - 9 ;10 [labelX[3] 0.5\nentropy 0.918\nsamples 3\nvalue [2, 1]] ;8 - 10 ;11 [labelentropy 0.0\nsamples 2\nvalue [2, 0]] ;10 - 11 ;12 [labelentropy 0.0\nsamples 1\nvalue [0, 1]] ;10 - 12 ;}数据分析结果程序运行结果在与该程序在同一目录下的 table.pdf 文件中将每一个叶子结点转换成IF-THEN 规则。决策树分析结果IF-THEN分类规则(1)IF不是公司员工 AND 年龄大于等于40, THEN 不买保险。(2)IF不是公司员工 AND 年龄小于40, THEN 买保险。(3)IF不是公司员工 AND 年龄大于50 AND 信用为良, THEN 不买保险。(4)IF不是公司员工 AND 年龄大于40 AND 信用为优, THEN 买保险。(5)IF是公司员工 AND 年龄小于50, THEN 不买保险。(6)IF是公司员工 AND 年龄小于50 AND 信用为优, THEN 买保险。(7)IF是公司员工 AND 年龄小于50 AND 信用为良, THEN 不买保险。