织梦五彩婚纱源码网_婚庆策划网站php源码,湛江人做寄生虫网站,昌平网站制作开发公司,百度知道app官方下载Excel工作表是非常本能和用户友好的#xff0c;这使得它们非常适合操作大型数据集#xff0c;即使是技术人员也不例外。如果您正在寻找学习使用Python在Excel文件中操作和自动化内容的地方#xff0c;请不要再找了。你来对地方了。 在本文中#xff0c;您将学习如何使用Pan…Excel工作表是非常本能和用户友好的这使得它们非常适合操作大型数据集即使是技术人员也不例外。如果您正在寻找学习使用Python在Excel文件中操作和自动化内容的地方请不要再找了。你来对地方了。 在本文中您将学习如何使用Pandas来处理Excel电子表格。在文章的最后您将了解
为此需要必要的模块以及如何在系统中设置它们。使用Python从excel文件阅读数据到pandas中。在Pandas中浏览Excel文件中的数据。在Pandas中使用函数来操作和重塑数据。
安装
要在Anaconda中安装Pandas我们可以在Anaconda终端中使用以下命令
conda install pandas要在常规Python非Anaconda中安装Pandas我们可以在命令提示符中使用以下命令
pip install pandas开始使用
首先我们需要导入Pandas模块这可以通过运行命令来完成
import pandas as pd输入文件 让我们假设excel文件看起来像这样
Sheet 1: Sheet 2: 现在我们可以使用Pandas中的read_excel函数导入excel文件。第二个语句从excel中读取数据并将其存储到pandas数据框中该数据框由变量newData表示。如果excel工作簿中有多个工作表则该命令将导入第一个工作表的数据。要使用工作簿中的所有工作表创建数据框最简单的方法是分别创建不同的数据框然后将它们连接起来。read_excel方法接受参数sheet_name和index_col我们可以指定数据框应该由哪个工作表组成index_col指定标题列如下所示
file (path_of_excel_file)
newData pd.read_excel(file)
newData示例 第三个语句连接两个表。现在要检查整个数据帧我们可以简单地运行以下命令
sheet1 pd.read_excel(file,sheet_name 0,index_col 0)sheet2 pd.read_excel(file,sheet_name 1,index_col 0)newData pd.concat([sheet1, sheet2])newData要从数据框的顶部和底部查看5列可以运行命令。这个head()和tail()方法也接受参数作为要显示的列数的数字。
newData.head()
newData.tail()shape方法可用于查看数据框中的行数和列数如下所示
newData.shape如果任何列包含数值数据我们可以使用pandas中的sort_values()方法对该列进行排序如下所示
sorted_column newData.sort_values([Height], ascending False)现在假设我们想要排序列的前5个值我们可以在这里使用head()方法
sorted_column[Height].head(5)我们可以使用数据框的任何数值列来执行此操作如下所示
newData[Weight].head()现在假设我们的数据主要是数字。我们可以得到统计信息如平均值最大值最小值等。使用describe()方法对数据帧进行处理如下所示
newData.describe()也可以使用以下命令对所有数值列单独执行此操作
newData[Weight].mean()也可以使用相应的方法来计算其他统计信息。与Excel一样也可以应用公式并创建计算列如下所示
newData[calculated_column] newData[“Height”] newData[“Weight”]
newData[calculated_column].head()对数据框中的数据进行操作后我们可以使用to_excel方法将数据导出回Excel文件。为此我们需要指定一个输出excel文件其中要写入转换后的数据如下所示
newData.to_excel(Output File.xlsx)