当前位置: 首页 > news >正文

建设e购物网站新网站如何做百度收录

建设e购物网站,新网站如何做百度收录,网站建设东莞公司,百度搜索 网站图片在前一篇文章 Pandas数据可视化工具——Seaborn用法整理(上)#xff0c;我们了解了如何使用这些Seaborn代码绘制分布图和分类图。在本文中#xff0c;我们将继续讨论Seaborn提供的一些其他以绘制不同类型统计图的功能#xff0c;我们将从矩阵图开始讨论。矩阵图矩阵图是一种…在前一篇文章 Pandas数据可视化工具——Seaborn用法整理(上)我们了解了如何使用这些Seaborn代码绘制分布图和分类图。在本文中我们将继续讨论Seaborn提供的一些其他以绘制不同类型统计图的功能我们将从矩阵图开始讨论。矩阵图矩阵图是一种以行和列的形式显示数据的图。Heat maps是矩阵图的一个典型例子。Heat MapsHeat Maps通常用于以矩阵形式绘制数值列之间的相关性。这里需要提到的是要绘制矩阵图需要有关于行和列的有价值的信息。延续上一篇文章的主题我们将使用财报数据10-18年的数据看看行和列标题是否都是有意义的信息。执行以下代码:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdf DataSource(financial_statement_CN_STOCK_A).read(start_date2010-04-01,end_date2018-04-02)df.head()在输出中可以看到如下结果:从输出中可以看到列标头包含有用的信息如股票代码、日期、固定资产、营业利润等。而行标头只包含索引0、1、2等。一种方法是调用数据集上的corr()方法。函数的作用是:返回数据集中所有数字列之间的相关性。执行以下代码:df_0 df[[date,instrument,fs_operating_profit,fs_current_assets,fs_net_profit_ttm,fs_roe,fs_gross_profit_margin,fs_free_cash_flow]]df_0.corr()(这里为了使结果图简洁只选择了六个统计量。)在输出中将看到各列之间的相关系数如下所示:现在要创建具有这些相关值的Heat Maps需要调用heatmap()函数并将相关系数的DataFrame传递给它。请看下面的代码:sns.heatmap(df_0.corr())在输出中将看到如下结果:从输出中可以看出heatmap的基本功能是为行和列值的每个组合绘制一个框。图像的颜色取决于渐变。例如在上面的图像中如果两个特征之间有很高的相关性对应的单元格或者方框是白偏向于色的另一方面如果没有相关性对应的单元格是黑色的。通过为传递参数annot为True相关系数也可以绘制在heatmap上。执行下面的代码看看这是否有效:sns.heatmap(df_0.corr(), annotTrue)还可以通过给cmap传递参数来更改heatmap的颜色。现在看看下面的代码:sns.heatmap(df_0.corr(), cmapwinter)结果如下除了仅使用所有列之间的相关性之外还可以使用pivot_table函数指定索引、列以及希望看到的与索引和列对应的值。为了展示pivot_table函数的运行情况我们可以观察单个股票的情况。这里我们执行以下代码导入数据集并查看数据集的前5行:df_1 df.ix[df[instrument]600760.SHA]#选出某一只股票单独作图(否则图像无意义)df_2 df_1.pivot_table(indexfs_quarter_index, columnsfs_quarter_year, valuesfs_roe )df_2.head()输出(由于财报数据没有类似月份的列我们选择的时间也相对较短本图美观度有所欠缺不过重在总结方法)现在使用pivot_table函数我们可以创建一个Heat Maps显示在特定年份的特定季度特定股票的净资产收益率(fs_roe)。为此我们将输入季度(fs_quarter_index)作为index参数的值。index属性对应于行。接下来我们需要将输入年份(fs_quarter_year)作为列参数。最后对于values参数我们将输入净资产收益率(fs_roe)。执行以下代码:sns.heatmap(df_2)结果如下从结果可以明显看出该股票在这段时间里净资产收益率的变化有时候我们会发现方框或单元格是重叠的单元格边界之间的区别不是很清楚。要在单元格之间创建清晰的边界可以使用linecolor和linewidths参数。看看下面的代码:sns.heatmap(df_2, linecolorblue, linewidth1)在上面的代码中我们输入了“blue”作为linecolor参数的值而line width参数被设置为1。在输出中您将看到每个单元格的蓝色边界:如果需要更厚的边界可以增加linewidth参数的值。Cluster Map除了Heat Map另一个常用的矩阵图是Cluster Map。Cluster Map基本上使用层次聚类来对矩阵的行和列进行聚类。让我们绘制一个Cluster Map表示在特定季度和特定年份的净资产收益率。执行以下代码:df_3 df_1[[fs_quarter_index,fs_roe,fs_quarter_year]]df_4 df_3.pivot_table(indexfs_quarter_year, columnsfs_quarter_index, valuesfs_roe)sns.clustermap(df_4)要绘制集群映射需要使用clustermap函数与heat map函数一样传递的数据集应该具有行和列的有意义的标题。上面代码的结果是这样的:在输出中您可以看到根据特定季度和特定年份聚集起来的净资产收益率。至此我们结束了关于矩阵图的讨论。在下一节中我们将开始讨论Seaborn库的网格功能。Seaborn网格Seaborn中的网格允许我们根据图中使用的特性操作子图。Pair Grid在本系列文章的第1部分中我们了解了如何使用pair plot绘制数据集中数字列的所有可能组合的散点图。现在让我们在上述代码的基础上绘制Pair Plot。执行以下代码:df_5 df[[fs_account_payable,fs_account_receivable,fs_capital_reserves,fs_construction_in_process,fs_undistributed_profit]]sns.pairplot(df_5)该代码输出是这样的:现在我们来画Pair Grid看看Pair Grid和Pair Plot的区别。要创建对网格只需将数据集传递给PairGrid函数如下所示:sns.PairGrid(df_5)在输出中可以看到空网格。这就是pair grid函数的作用。它返回数据集中所有特性的空网格集。接下来需要对pair grid函数返回的对象调用map函数并将希望在网格上绘制的绘图类型传递给它。让我们用对网格绘制一个散点图。df_5 df_5.dropna()df_6 sns.PairGrid(df_5)df_6.map(plt.scatter)输出是这样的:可以在看到df_5中所有列分别作x、y轴的散点图。还可以在同一对网格上绘制不同类型的图。例如如果想在对角线上绘制“分布”图在对角线的上半部分绘制“kdeplot”图在对角线的下半部分绘制“散点”图那么可以分别使用map_diag、map_upper和map_lower函数。将绘制的绘图类型作为参数传递给这些函数。看看下面的代码:grids sns.PairGrid(df_5)grids.map_diag(sns.distplot)grids.map_upper(sns.kdeplot)grids.map_lower(plt.scatter)代码结果如下从上面的图像中可以看出pair grid函数的真正威力。对角线上是分布图上半部分是核密度图下半部分是散点图。Facet GridsFacet Grid用于将两个或两个以上的分类特征与两个或两个以上的数字特征进行绘图。让我们画一个 Facet Grid来展示这几个统计量两两之间的关系。在本节中我们将再次使用财报数据的部分列。执行以下代码加载数据集:df_6 df[[fs_quarter_index,fs_roe,fs_quarter_year,fs_account_payable,fs_account_receivable,fs_capital_reserves,fs_construction_in_process,fs_undistributed_profit]]df_6.head()要绘制Facet Grid使用FacetGrid()函数。函数的第一个参数是数据集第二个参数col指定要在列上绘图的特性而row参数指定行上的特性。函数的作用是:返回一个对象。与pair grid类似可以使用map函数指定要绘制的绘图类型。执行以下脚本:(winsorize函数将df_6进行去极值处理目的是使得结果更加具有表现力)def winsorize(df, width3):df df.copy()factor_columns set(df.columns).difference([date,instrument])for factor in factor_columns:mean df[factor].mean()sigma df[factor].std()df[factor] df[factor].clip(mean-width*sigma,meanwidth*sigma)return dfdf_6 winsorize(df_6)grid sns.FacetGrid(datadf_6, colfs_quarter_year, rowfs_quarter_index)grid.map(sns.distplot, fs_roe)在上面的代码中我们在小平面网格上绘制了净资产收益率分布图。输出是这样的:从输出中您可以看到4×9个图单个图上展示了各个股票在特定年份特定季度的净资产收益率(fs_roe)的分布这由FacetGrid()函数指定。对于不同的子图之间子图的位置决定了该子图的时间第一行第一列的图为2009年第一季度的净资产收益率的分布图以此类推除了为一个特征绘制分布图外我们还可以绘制包含面网格上两个特征的散点图。例如下面的代码为年份和季度绘制了应付账款(fs_account_payable)和资本公积金(fs_capital_reserves)的散点图。grid sns.FacetGrid(datadf_6, colfs_quarter_year, rowfs_quarter_index)grid.map(sns.scatterplot, fs_account_payable,fs_capital_reserves)输出结果如下回归图回归图顾名思义是用来进行两个或多个变量之间的回归分析。在这一节中我们将研究线性模型图它根据数据绘制出两个变量之间的线性关系以及最佳拟合回归线。为了绘制线性模型使用lmplot()函数。第一个参数是要在x轴上绘制的特征第二个变量是要在y轴上绘制的特征。最后一个参数是数据集。执行以下代码:sns.lmplot(xfs_account_payable, yfs_capital_reserves, datadf_6)还可以根据分类特征绘制多个线性模型。特性名作为值传递给hue参数。例如如果要绘制不同季度的时候应付账款(fs_account_payable)和资本公积金(fs_capital_reserves)之间关系的多个线性模型根据不同季度的情况可以使用lmplot函数如下:sns.lmplot(xfs_account_payable, yfs_capital_reserves, datadf_6,huefs_quarter_index)结果如下从输出可以看出对于理想切割的钻石克拉与价格之间的线性关系是最陡的而对于合理切割的钻石线性模型是最浅的。除了为不同色调的cut feature绘制数据外我们还可以为每个cut绘制一个plot。为此需要将列名传递给col属性。看看下面的脚本:sns.lmplot(xfs_account_payable, yfs_capital_reserves, datadf_6,colfs_quarter_index)在输出中将看到钻石数据集的cut列中的每个值都有一个单独的列如下所示:还可以使用aspect和size参数更改绘图的大小和纵横比。看看下面的代码:sns.lmplot(xfs_account_payable, yfs_capital_reserves, datadf_6,colfs_quarter_index,aspect 0.5,size 8)aspect参数定义宽度和高度之间的纵横比。长宽比为0.5意味着宽度是输出中所示高度的一半。可以看出图的大小已经发生了变化字体大小仍然很小。在下一节中我们将看到如何控制Seaborn图的字体和样式。图像样式Seaborn库提供了多种样式选项。在本节中我们将讲解其中一些。设置风格函数的作用是:设置网格的样式。您可以将darkgrid、whitegrid、dark、white和tick作为参数传递给set_style函数。在本节中我们将再次使用df_6。执行以下代码以查看darkgrid样式。df_6 df_6.dropna()sns.set_style(darkgrid)sns.distplot(df_6[fs_roe])输出如下在输出中您可以看到我们有带有网格的黑色背景。让我们看看whitegrid是什么样子。执行以下代码:sns.set_style(whitegrid)sns.distplot(df_6[fs_roe])输出如下现在你可以看到我们仍然有网格在背景中但深灰色的背景是不可见的。我们建议尝试使用其他选项看看哪种风格适合自己。改变图大小由于Seaborn在后台使用Matplotlib函数可以使用Matplotlib的pyplot包来更改图形大小如下图所示:plt.figure(figsize(8,4))sns.distplot(df_6[fs_roe])在上面的代码中我们将情节的宽度和高度分别设置为8英寸和4英寸。上面脚本的输出是这样的:设置 Context可以使用theset_context()函数并将poster作为惟一的属性传递给它如下所示:sns.set_context(poster)sns.distplot(df_6[fs_roe])在输出中应该看到一个符合海报标准的图如下所示。例如可以看到字体比正常的图形大得多。小结Seaborn库是用于数据可视化的高级Python库。本文是关于在Python中使用Seaborn实现数据可视化的系列文章的第2部分。在这篇文章中我们看到了如何在Seaborn中绘制回归图和矩阵图。我们还了解了如何更改绘图样式和使用网格函数来操作子图。本文实现代码可直接前往BigQuant平台一键克隆代码进行实践研究。
http://www.pierceye.com/news/789459/

相关文章:

  • 网站建设哪家专业网站开发费用怎么做账
  • 用dw怎么做网站首页wordpress 文章页面失败
  • 郑州网站制作专业乐云seowordpress it博客主题
  • 支付宝手机网站支付二维码怎么做网站 开发
  • 教育网站制作视频代理网址ag80hncom
  • 泰兴公司做网站建设制作外贸网站公司
  • 手机wap网站大全作品提示优化要删吗
  • 郑州网站建设技术支持云南澄江县建设局网站
  • wordpress建企业网站设置网站一级域名和二级域名
  • 云南省城乡与住房建设厅网站合肥网红打卡地
  • 用dw做的企业网站宁波seo优化费用
  • 网站制作开发建网站公司 蓝纤科技
  • 怎样到国外做合法网站法网站网站建设小组实验报告
  • DNF做钓鱼网站网站建设方案书编写
  • 提高网站粘性wordpress tag中文
  • 公司已有网站 如何自己做推广wordpress的音乐插件怎么用
  • 权威网站php wordpress 等
  • 建设网站企业公司中通建设计院第四分公司网站
  • 快站免费网站建设哪家好南宁市住房建设局网站
  • 学生做的网站成品roseonly企业网站优化
  • 台前网站建设电话百度账号注册申请
  • 政和县建设局网站公告征婚网站咋做
  • 做网站需要用到的语言注册公司需要多少钱保证金
  • 如何给别人做网站赚钱互联网广告营销方案
  • 上海专业做网站公司地址软文代写
  • 家居网站源码宁波专业建设网站建站公司
  • 成都网站建设 Vr功能 卓 公司网站后台管理系统怎么用
  • 微站网建站系统南昌科技网站建设
  • 商家网站建设模板快速备份wordpress
  • 网站建设推广价格肯德基网站建设