[]
谷歌开发者视频中文频道:
学习笔记
一、在中写第一个机器学习的程序:
这里使用的分类器是决策树
from sklearn import tree
特征为:第一个元素是[140,1];第二个元素是[130,1];第三个元素是[150,0];第四个元素是[170,0]。
标签有["apple","apple","orange","orange"]。其中包含两个"apple"和两个"orange"。
labels = [0,0,1,1]
定义了一个名为 clf 的决策树分类器对象,该对象是通过 tree.DecisionTreeClassifier() 创建的。
clf = clf.fit(feature,labels)
打印(clf.predict([[150,0]]))
二、鸢尾花数据集训练决策树
可视化代码用于将训练好的决策树模型以可视化的形式呈现出来,以便更好地理解和分析。
鸢尾花数据集下载:)
参考资料:
# -*- coding: utf-8 -*-
"""
Spyder Editor
这是一个临时的脚本文件。
"""
# 引入数据集
import numpy as np
使用 sklearn 库中的 datasets 模块来加载鸢尾花数据集。
from sklearn import tree

iris = load_iris()
打印(iris 的特征名称);这些特征名称为["萼片长度(cm)", "萼片宽度(cm)", "花瓣长度(cm)", "花瓣宽度(cm)"]
打印(iris.target_names) # 其中包含的元素有 'setosa' 、'versicolor' 、'virginica'
打印(iris.data 的第一个元素) # [ 5.1 3.5 1.4 0.2]
print(iris.target[0]) # 0
test_idx 包含 0、50 和 100 这几个位置的数据,这些数据被选取出来作为测试集,所以这里的测试集只有三组数据。
# training data
在 iris.target 中,将 test_idx 对应的元素删除,得到 train_target 。
train_data 是通过将 iris.data 中的 test_idx 对应的行在轴为 0 的方向上删除而得到的
# testing data
iris 中的目标值是通过 test_idx 来选取的,选取出来的目标值为 test_target
测试数据是鸢尾花数据中索引为 test_idx 的部分。
clf = tree.DecisionTreeClassifier()
clf 对 train_data 和 train_target 进行拟合操作,从而得到相应的结果。clf 执行了 fit 方法,将 train_data 作为输入数据,train_target 作为目标数据,通过这个过程完成了拟合的动作。最终 clf 得到了拟合后的状态。
# print(test_target)
打印(clf 对 test_data 的预测结果)
# viz code 可视化 制作一个简单易读的PDF
在 sklearn 的外部模块 six 中,有一个名为 StringIO 的东西。
import pydot
dot_data = StringIO()
tree 会将 clf 导出为图形可视化数据并存储到 out_file 所指定的 dot_data 文件中。
iris 的特征名称为 feature_names 。
类别名称为 iris.target_names 。
filled=True, rounded=True,
special_characters=True)
graph 是通过 pydot 的 graph_from_dot_data 方法,使用 dot_data 的 getvalue 方法获取到的值来创建的。
print(len(graph)) # 1
print(graph) # []
print(graph[0]) #
# graph.write_pdf("iris.pdf")
使用 graph[0] 生成了名为 "iris.pdf" 的 PDF 文件。graph[0] 具备将数据以 PDF 格式输出的功能,通过调用其 write_pdf 方法,实现了将相关内容写入到 "iris.pdf" 文件中的操作。
·pdf如图:
·
三、本项目中导入包的问题
你的开始菜单中没有新建虚拟环境的命令行入口。比如新建了一个 2.7 的环境,开始菜单里就没有其相关入口。
你需要安装像图中那样的包,只有这样,你才能够在开始菜单里看到新建的虚拟环境的命令行入口,即.7 。
当然,能够直接在 cmd 中激活 2.7 的虚拟环境,也可以点击如图所示的三角形 open 来进入命令行终端。不过,这样做不是很方便。
在命令栏中输入 pip 安装
此时已经在.7环境下安装好了包。
补充: 和 的问题
发现有不少小伙伴在进行 dot 转换为 PDF 的过程中遇到了 dot 方面的问题或者找不到相关内容等情况。这里有以下几点提醒:
注意在安装好(pip)和(pip)三方库之后,你还需要进行()软件的安装。可以在终端使用命令 sudo apt-get 来完成该安装操作。
二、很可能是因为没把的bin目录加入path路径。
三、注意先安装,再安装 。
参考:
end
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;
工作时间:8:00-18:00
客服电话
0755-88186625
电子邮件
admin@lanyu.com
扫码二维码
获取最新动态