当前位置: 首页 > news >正文

神兵网站建设佛山网站建设费用

神兵网站建设,佛山网站建设费用,校园推广是什么工作,已备案网站数量1可用数据集 公司内部 eg:百度 数据接口 花钱 数据集 学习阶段可用的数据集#xff1a; sklearn:数据量小#xff0c;方便学习kaggle#xff1a;80万科学数据#xff0c;真实数据#xff0c;数据量大UCI#xff1a;收录了360个数据集#xff0c;覆盖科学、生活、经济等…1可用数据集 公司内部 eg:百度 数据接口 花钱 数据集 学习阶段可用的数据集 sklearn:数据量小方便学习kaggle80万科学数据真实数据数据量大UCI收录了360个数据集覆盖科学、生活、经济等领域数据量几十万 Kaggle网址http://www.kaggle.com/datasets UCI网址http://archive.ics.uci.edu/ml/ scikit-learn网址http://scikit-learn.org/stable/datasets/index.html 2scikit-learn工具介绍 Python语言的机器学习工具Scikit-learn包括许多知名的机器学习算法的实现Scikit-learn文档完善容易上手丰富的API目前稳定版本0.19.1 2.1安装 pip3 install Scikit-learn0.19.1安装好之后可以通过以下命令查看是否安装成功 import sklearn注安装scikit-learn需要NumpyScipy等库 2.2sklearn数据集 scikit-learn数据集API介绍 sklearn.datasets 加载获取流行数据集datasets.load_*() - 获取小规模数据集数据包含在datasets里datasets.fetch_*(data_homeNone) - 获取大规模数据集需要从网络上下载函数的第一个参数是data_home表示数据集下载的目录,默认是~/scikit_learn_data/ sklearn小数据集 sklearn.datasets.load_iris() -加载并返回鸢尾花数据集 名称数量类别3特征4样本数量150每个类别数量50 sklearn.datasets.load_boston() -加载并返回波士顿房价数据集 名称数量目标类别5-50特征13样本数量506 sklearn大数据集 sklearn.datasets.fetch_20newsgroups(data_homeNone,subset‘train’) subset: train’或者’test’all’可选选择要加载的数据集。训练集的“训练”测试集的“测试”两者的“全部” sklearn数据集的使用 以鸢尾花数据集为例 sklearn数据集返回值介绍load和fetch返回的数据类型datasets.base.Bunch(字典格式) data:特征数据数组是[n_samples * n_features]的二维numpy.ndarray数组target:标签数组是n_samples的一维numpy.ndarray数组DESCR:数据描述feature_names:特征名,新闻数据手写数字、回归数据集没有otarget_names:标签名 from sklearn.datasets import load_iris #获取鸢尾花数据集 iris load_iris() print(鸢尾花数据集的返回值:\n, iris) #返回值是一个继承自字典的Bench print(鸢尾花的特征值:\n, iris [data]) print(鸢尾花的目标值:\n,iris.target) print(鸢尾花特征的名字:\n, iris.feature_names) print(鸢尾花目标值的名字: \niris.target_names) print(鸢尾花的描述:\in, iris.DESCR)2.3数据集的划分 机器学习一般的数据集会划分为两个部分 训练数据:用于训练构建模型测试数据:在模型检验时使用用于评估模型是否有效 划分比例 训练集:70% 80% 75% 测试集:30% 20% 30% 数据集划分api sklearn.model_selection.train_test_split(arrays, options) ×数据集的特征值y数据集的标签值test_size测试集的大小一般为float random_state 随机数种子不同的种子会造成不同的随机采样结果。相同的种子采样结果相同。return 训练集特征值测试集特征值训练集目标值测试集目标值 x_train,x_test, y_train,y_test from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split#数据集划分 x_trainx_testy_trainy_test train_test_split(iris.datairis.targettest_size0.2random_state22) print(训练集的特征值:\n, x_train,x_train.shape)
http://www.pierceye.com/news/329418/

相关文章:

  • 网站建设的公司实习做什么成都住建局官网住建智慧建管
  • 建一个免费看电影的网站犯法不国家企业信用信息没有网站怎么做
  • 长春网站vantage wordpress
  • 帝国cms如何做网站地图自己做的网站还要买域名么
  • 网站建设与维护税率网络营销案例及视频
  • 网站建设 繁体精品课网站制作
  • 常州 招网站开发seo的名词解释
  • 二级域名网站seo竞价网站建设
  • 麻栗坡网站建设正规网站建设
  • 邯郸网站建设哪家好重庆app开发
  • 自学网站开发多久大型网站建站
  • 网站设计定制多少钱新增备案网站负责人
  • 匿名聊天网站开发网站关键字挖掘
  • 外国域名注册很多网站做网站的人找不到了
  • 好的学习网站打广告免费浏览器网站
  • 美团先做网站还是app学生网站建设的总结与评价
  • 网站建设代理网站wordpress微博
  • dw建设网站视频宁波seo优化项目
  • 网站里添加百度地图浙江网站建设公司
  • php网站开发最新需求排名优化百度
  • 网站制作的电话智慧校园信息门户网站建设
  • 网站备案申请福田企业网站优化方案
  • 企业网站seo怎么做有空间站的国家
  • Linux网站建设总结网站建设目的确定
  • 怎么做网站的内部链接wordpress 写php页面跳转
  • 推广自己的网站网页设计代码html文件怎么查
  • 网站在线制作软件邯郸公众号小程序制作
  • 网站后台生成静态页面天津百度推广电话号码
  • 网站单个页面301跳转湖南省建设局网站
  • 潮州网站建设十堰seo招聘