福清网站商城建设,wordpress不能放大图片,四川自助seo建站,郑州网站建设企起前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。开运张 | 作者知乎专栏 | 来源三个步骤#xff1a;确定问题#xff0c;选择图形转换数据#xff0c;应用函数参数设置#xff0c;一目了然首先对…前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。开运张 | 作者知乎专栏 | 来源三个步骤确定问题选择图形转换数据应用函数参数设置一目了然首先对时段进行分析第一步提出问题租赁总量对应湿度的变化趋势适合图形因为湿度属于连续性数值变量我们可以选择折线图反应变化趋势第二步转换数据我们需要一个二维数据框按照温度变化排序取对应的三个租赁数的平均值应用函数直接应用plt的plot函数即可完成折线图workingday_df Bikedata[Bikedata[workingday]1]#tworkingday_df workingday_df.groupby([hour],as_indexTrue).agg({count:mean,registered:mean,casual:mean})nworkingday_df Bikedata[Bikedata[workingday]0]nworkingday_df nworkingday_df.groupby([hour],as_indexTrue).agg({count:mean,registered:mean,casual:mean})nworkingday_df.head()第三步设置参数figure,axes plt.subplots(1,2,shareyTrue)#设置一个1*2的画布且共享y轴workingday_df.plot(figsize(15,5),titleThe average number of rentals initiated per hour in the working day,axaxes[0])nworkingday_df.plot(figsize(15,5),titleThe average number of rentals initiated per hour in the nworking day,axaxes[1])可以看出在工作日会员出行对应两个很明显的早晚高峰期并且在中午会有一个小的高峰可能对应中午外出就餐需求工作日非会员用户出行高峰大概在下午三点工作日会员出行次数远多于非会员用户在周末总体出行趋势一致大部分用车发生在11-5点这段时间早上五点为用车之最。对温度进行分析第一步提出问题租赁总量对应湿度的变化趋势适合图形因为湿度属于连续性数值变量我们可以选择折线图反应变化趋势第二步转换数据我们需要一个二维数据框按照温度变化排序取对应的三个租赁数的平均值应用函数直接应用plt的plot函数即可完成折线图第三步参数设置只需要设置折线图的标题其他参数默认temp_df Bikedata.groupby([temp],as_indexTrue).agg({count:mean,registered:mean,casual:mean})temp_df.plot(title The average number of rentals initiated per hour changes with the temperature)随着温度的升高租赁数量呈上升趋势在温度达到35度时因天气炎热总体数量开始下降在温度在4度时租赁数达到最低点湿度对租赁数量的影响第一步提出问题租赁总量对应湿度的变化趋势适合图形因为湿度属于连续性数值变量我们可以选择折线图反应变化趋势第二步转换数据我们需要一个二维数据框按照温度变化排序取对应的三个租赁数的平均值应用函数直接应用plt的plot函数即可完成折线图第三步参数设置只需要设置折线图的标题其他参数默认humidity_df Bikedata.groupby([humidity],as_indexTrue).agg({count:mean,registered:mean,casual:mean})humidity_df.plot(titleAverage number of rentals initiated per hour in different humidity)可以观察到在湿度20左右租赁数量迅速达到高峰值此后缓慢递减。年份月份和季节作图方法类似都采用折线图绘制这里省略。查看不同天气对出行情况的影响第一步提出问题租赁总量对应湿度的变化趋势适合图形因为天气情况属于数值型分类变量我们可以选择柱形图观察数量分布第二步转换数据我们需要一个二维数据框按照天气情况对租赁数量取平均值应用函数应用plt的plot.bar函数绘制组合柱形图第三步参数设置只需要设置折线图的标题其他参数默认weather_df Bikedata.groupby([weather],as_indexTrue).agg({registered:mean,casual:mean})weather_df.plot.bar(stackedTrue,titleAverage number of rentals initiated per hour in different weather)观察到天气等级为4时平均出行人数比天气等级为2是还要高这不符合常理我们查看一下天气等级为4的详细情况count_weather Bikedata.groupby(weather)count_weather[[casual,registered,count]].count()天气状况为4级的只有一天我们把数据打印出来查看一下Bikedata[Bikedata[weather]4]时间为工作日的下午六点钟属于晚高峰异常数据不具有代表性。会员用户和临时用户在整体用户中占比第一步提出问题查看会员用户和临时用户在整体用户中的比例适合图形查看占比适合用饼图pie第二步转换数据需要一个二维数据框按天数取两种用户的平均值应用函数应用plt的plot.pie函数绘制饼图第三步参数设置这是数据标签和类别标签#考虑到相同日期是否工作日星期几以及所属年份等信息是一样的把租赁数据按天求和其它日期类数据取平均值day_df Bikedata.groupby([date], as_indexFalse).agg({casual:sum,registered:sum,count:sum, workingday:mean,weekday:mean,holiday:mean,year:mean})day_df.head()#按天取两种类型用户平均值number_peiday_df[[casual,registered]].mean()number_peicasual 517.411765registered 2171.067031dtype: float64#绘制饼图plt.axes(aspectequal)plt.pie(number_pei, labels[casual,registered], autopct%1.1f%%, pctdistance0.6 , labeldistance1.05 , radius1 )plt.title(Casual or registered in the total lease)Text(0.5,1,Casual or registered in the total lease)