揭阳企业网站排名多少钱,wordpress 模块,网站怎么做seo排名,有什么网站可以做浏览单1、导入数据#导入花萼数据
from sklearn.datasets import load_iris
irisload_iris()
iris.data前四列为花萼长度#xff0c;花萼宽度#xff0c;花瓣长度#xff0c;花瓣宽度等4个用于识别鸢尾花的属性2、建模#创建kmeans聚类
from sklearn.cluster import KMeans
kmeansKM…1、导入数据#导入花萼数据
from sklearn.datasets import load_iris
irisload_iris()
iris.data前四列为花萼长度花萼宽度花瓣长度花瓣宽度等4个用于识别鸢尾花的属性2、建模#创建kmeans聚类
from sklearn.cluster import KMeans
kmeansKMeans(n_clusters3,initk-means,random_state123) #分为三类
y_kmeanskmeans.fit_predict(iris.data)
y_kmeans
可以看出0聚类得很好但是2当中夹杂着11中夹杂着21和2存在混淆3、可视化聚类模型import matplotlib.pyplot as plt
#画出了三个类的中心点位置
plt.scatter(iris.data[y_kmeans0,2],iris.data[y_kmeans0,3],s100,cred,labelCluter 1)
plt.scatter(iris.data[y_kmeans1,2],iris.data[y_kmeans1,3],s100,cblue,labelCluter 2)
plt.scatter(iris.data[y_kmeans2,2],iris.data[y_kmeans2,3],s100,cgreen,labelCluter 3)plt.scatter(kmeans.cluster_centers_[:,2],kmeans.cluster_centers_[:,3],s100,cblack,labelControids)
plt.legend()
plt.show()从图上可以看出第0类为花瓣长度花瓣宽度较低的类别第1类为花瓣长度花瓣宽度居中的类别图中黑点为三个类别的中心点4、模型优化对于聚类模型分多少类是关键点每类数据到其中心点的距离之和值越小据类越好但是当类别越多k自然就越小值对应的也就越小因此有一种判定方法当快速下降趋于平缓下降的转折点为聚类的最好情况。vess[]
for i in range(1,4):kmeansKMeans(n_clustersi,initk-means,random_state42)kmeans.fit(iris.data)vess.append(kmeans.inertia_)#kmeans.inertia_ 每类数据到其中心点的距离之和
plt.plot(range(1,4),vess)
plt.show()
可以发现到横坐标为2时中心点距离缓慢下降所以分成两类会比较好以上简单的聚类模型建立完毕啦后续再优化吧