青岛开发区做网站,徐州网站建设方案维护,泰安红河网站建设,成都开发公司sklearn转换器和估计器(estimator) 1.转换器 - 特征工程的父类 实例化#xff08;实例化是一个转换器类#xff08;Transform#xff09;#xff09; 调用fit_transform 标准化 (x - mean) / std fit_transform() fit() 计算每一列的平均值、标准差 transform() (x - mean)…sklearn转换器和估计器(estimator) 1.转换器 - 特征工程的父类 实例化实例化是一个转换器类Transform 调用fit_transform 标准化 (x - mean) / std fit_transform() fit() 计算每一列的平均值、标准差 transform() (x - mean) / std 进行最终的转换 2.估计器(sklearn机器学习算法的实现) 估计器estimator 1.实例化一个estimator 2.estimator.fit(x_train,y_train) 计算每一列的平均值、标准差 – 调用完后模型生成 3.模型评估 1) 直接对比真实值和预测值 y_predict estimator.predict(x_test) y_test y_predict 2) 计算准确率 estimator.score(x_test, y_test)
1.k-近邻算法KNN-K Nearest Neighbor 核心思想根据你的邻居来判断出你的类别 开发步骤 1.获取数据 2.划分数据集训练集特征值 测试集特征值 训练集目标值 测试集目标值 3.标准化 4.knn预估器 5.参数准备 6.加入网格搜索和交叉验证 7模型评估
2.朴素贝叶斯算法 -native bayes朴素贝叶斯 概率分类算法 应用场景文本分类 优点对缺失数据不太敏感算法也比较简单常用与文本分类分类准确定高速度快 缺点由于使用了样本属性独立性的假设所以特征属性有关联时效果不好 拉普拉斯平滑系数为了解决零概率的问题用加1的方法估计没有出现过的现象的概率 开发步骤 1.获取数据 2.对数据进行分割处理训练集特征值、测试集特征值、训练集目标值、测试集目标值 3.特征工程–标准化、分词-特征工程提取 4.朴素贝利叶预估器流程 5.模型评估 1)直接对比预测结果和测试集目标值 2)对比测试集特征值和测试集目标值算出准确率