网站建设对电子商务的作用,wordpress怎么修改网站标题,中关村,学做热干面网站处理Excel文件是数据分析师日常工作中的常见任务之一。 幸运的是#xff0c;Python的Pandas库提供了一套强大的工具#xff0c;使得读取、处理和写入Excel文件变得既清晰又快捷。 在本篇博客中#xff0c;我们将探讨如何使用Pandas的 read_excel 方法来读取Excel文件#x… 处理Excel文件是数据分析师日常工作中的常见任务之一。 幸运的是Python的Pandas库提供了一套强大的工具使得读取、处理和写入Excel文件变得既清晰又快捷。 在本篇博客中我们将探讨如何使用Pandas的 read_excel 方法来读取Excel文件以及如何遍历和修改DataFrame中的数据。 安装
openpyxl是因为pandas读完excel需要。
pip install openpyxl
pip install pandas 读取
导入Pandas库并使用 read_excel 方法来读取Excel文件。需要注意的是对于 .xlsx 文件我们需要指定 engineopenpyxl默认xlrd因为Pandas需要一个额外的库来处理这种格式的文件。
字段格式的锁定可以使用 dtype
锁定sheet可以使用 sheet_name。
import pandas as pddf_map pd.read_excel(ioexcels/xxx.xlsx,engineopenpyxl)
# len(df_map) # 读取df的行数据# 有时excel里的字符串型数字在read_excel读取时可能会被识别成int整型这时候可以设置dtype:
df_map pd.read_excel(ioexcels/xxx.xlsx,dtype{列字段A: str},engineopenpyxl
)# 锁定sheet有两种方式比如第二个sheet名称为sheet2
#1索引式索引从零开始
df_map pd.read_excel(ioexcels/xxx.xlsx,engineopenpyxl,sheet_name1
)
#2直接sheet名称推荐
df_map pd.read_excel(ioexcels/xxx.xlsx,engineopenpyxl,sheet_namesheet2
) 遍历DataFrame Pandas的DataFrame对象提供了 iterrows() 方法允许我们遍历DataFrame中的每一行。在遍历过程中index 代表行索引而 row 代表行内容。
for index, row in df_map_kpi.iterrows():if not pd.isnull(row[列字段A]): # isnull判断是否为空不能直接用Python对象判空形式print(row[列字段A]) else:df_map.at[index, 列字段A] A # 修改改行某行数据 例子中检查了 列字段A 是否为空。如果不为空打印出该值如果为空我们将其设置为 A还未实际生效。 同时判断多列是否同时都为空或有一个为空。
row_list [row[列字段A], row[列字段B], row[列字段C]]
# 是否全部为空
pd.isnull(row_list).all()
# 是否有一个为空
pd.isnull(row_list).any() 写回Excel文件
通常会设置 indexFalse 来防止将行索引写入文件
# 将修改后的DataFrame写回Excel文件这里使修改生效
df.to_excel(excels/xxx.xlsx, indexFalse) Pandas是一个功能强大的数据处理工具帮助高效地处理Excel文件。无论是读取数据、遍历DataFrame还是写入更改Pandas都能提供简洁的解决方案。