专业做网站开发,怎么做自己网站的API,应用公园app免费制作,Nana 3.3 wordpress前言
Python 是常用是数据分析工具#xff0c;常用的数据分析库有很多#xff0c;下面主要介绍如下五个分析库#xff1a;NumPy、Pandas、SciPy、StatsModels、Matplotlib。
NumPy 是一个非常常用的数据分析库#xff0c;更准确点说是一个数学计算库#xff0c;包括下面的…前言
Python 是常用是数据分析工具常用的数据分析库有很多下面主要介绍如下五个分析库NumPy、Pandas、SciPy、StatsModels、Matplotlib。
NumPy 是一个非常常用的数据分析库更准确点说是一个数学计算库包括下面的 Pandas 也依赖于 NumPy。话说为什么用 NumPy他有什么优点
众多内置的数学计算文章你看到这里说明你要做的工作大概率是和人工智能、机器学习或数据分析相关的工作这些工作不是简单的代码逻辑的堆叠而更多的数学的应用时常需要矩阵计算、基本线性代数操作、随机模拟和傅里叶变换等NumPy 内置就可以精心这些操作而不需要你徒手进行傅里叶展开。
快举个例子矩阵 a 和 b 的乘法可以直接写成 a * b元素乘积或 a b矩阵乘积会比你徒手写循环要快原因你可能猜到了那就是预编译成 C 代码或者用到更好的缓存策略等有这样的优点你没有什么理由不用。
代码简单矩阵相乘上面的写法就比循环更易读更少的代码也意味着更少的 Bug。
做数据分析人生苦短都已经用了 Python那不妨了解一下 NumPy你会有更深的理解。
PandasPython Data Analysis Library这是一个为数据建模分析而生的工具库Pandas 包含许多数据模型也吸纳了很多其他库的优势比如上文就提到 Pandas 依赖于 NumPy这里也建议了解了 NumPy 后再去学习 Pandas。Pandas 提供了大量的数据处理的函数和方法尤其对大型数据集有其独特的优势且由于其创建有着金融方面的背景因此其在时间序列分析或经济学方面也有其独特的优势。
Matplotlib 是一个 2D 绘图库。一堆数据摆在面前或者是一个巨大的数据表格摆在面前去分析其中数据特征这样的任务对于人眼来说有点难度但是如果转化为图形则又是另一番感觉了。几行代码就可以画出精确的直方图、条形图、误差图或散点图这样的工具对于数据分析来说就是神器呀。
上面就是 Python 数据分析三大支柱当然有人会说其他的库或工具也很好用确实我不否认这一点但是我个人及一部分人仍然认为上面三个库是 Python 数据分析三大支柱下面继续分析其他三个也很好用值得了解学习的工具库。
很多人也想把 SciPy 列为支柱工具包可见其还是很重要的。SciPy 也依赖于 NumPySciPy 是一个科学计算工具库其中也包含很多的高阶抽象和物理模型在积分、差值、信号处理等。
StatsModels 包含了许多的统计模型线性模型、广义线性模型、方差分析、时间序列Pandas 也可以做因为 StatsModels 又依赖于 Pandas和线性混合效用模型等在统计方面有其独特的优势。
后记
对于 Python 的数据分析库我不得不说他们之间真的是紧密的联系在了一起往往官网也都是相互有链接索引互相推荐真的是抱团取暖呀。并且他们之间有些功能还略有重复但又各有侧重对于这一点这也是难免的因为数据分析一些基础的操作都是一致的哪一个库又都不可能把那些基础的功能屏蔽掉。对我们来说我们往往是都需要有一定的了解在不同的工作或任务中使用不同的工具库。
对于学习步骤我的建议是先看看三大支柱NumPy、Pandas 和 Matplotlib的文档学会基本使用后具体的 API 以后的学习过程中慢慢去掌握。