企业网站建设制作多少钱,相机网站建设规划书,统一门户网站建设参考规范,哪些网站可以在线做动图目录
1.文件读取方式
1.1.绝对路径读取文件
1.2.相对路径读取文件
2.列表数据操作
2.1.列索引指定
2.2.代码数据对齐
3.创建新CSV文件
4.缺失值处理
4.1.缺失值创建
4.2.缺失值检索
4.3.缺失值查询 4.3.1.isnull()函数判断 4.3.2.notnull()函数判断
4.3.3.any()函数…目录
1.文件读取方式
1.1.绝对路径读取文件
1.2.相对路径读取文件
2.列表数据操作
2.1.列索引指定
2.2.代码数据对齐
3.创建新CSV文件
4.缺失值处理
4.1.缺失值创建
4.2.缺失值检索
4.3.缺失值查询 4.3.1.isnull()函数判断 4.3.2.notnull()函数判断
4.3.3.any()函数搭配寻找
4.3.4. 具体寻找缺失索引
4.4.缺失值处理
4.4.1.缺失值剔除
4.4.2.缺失值填充
4.4.2.1.按常数填充
4.4.2.2.按指定填充
4.4.2.3.按前数填充
4.4.2.4.按后数填充
4.4.2.5.按统计数据填充 1.文件读取方式
绝对路径:绝对路径是指文件在硬盘上真正存在的路径,就是相当于从计算机根目录开始出发一直搜索到文档为止的目录信息.
相对路径:相对路径非常简单就是需要提取的文件就是相对于当前目标文件位置。
EXAMPLE:
1.pop_path rC:\Users\Zeng Zhong Yan\Desktop\py.vs\python学习\population.csv这个就是绝对路径从根目录开始.2.pop_path rpopulation.csv这个就是相对路径这个文件在文件夹里面只需要直接提取出来即可。
1.1.绝对路径读取文件
#以具体路径的形式读取文件
pop_path rC:\Users\Zeng Zhong Yan\Desktop\py.vs\python学习\population.csv#前面一定要加个r
population pd.read_csv(pop_path, encodinggbk,skiprows[0, 1, 8, 9])
population
1.2.相对路径读取文件
#将文件放入同文件夹中直接读取
pop_path rpopulation.csv
pop pd.read_csv(pop_path, encodinggbk,skiprows[0, 1, 8, 9])
pop
2.列表数据操作
2.1.列索引指定
#将某一列当作行索引
pop pd.read_csv(pop_path, encodinggbk,skiprows[0, 1, 8, 9], index_col指标)
pop.index.name None
pop
2.2.代码数据对齐
#代码对齐
pop pd.read_csv(pop_path, encodinggbk,skiprows[0, 1, 8, 9], index_col指标)
pop.index.name None
pd.set_option(display.unicode.ambiguous_as_wide, True)
pd.set_option(display.unicode.east_asian_width, True)
pd.set_option(display.max_columns, None)
pop
3.创建新CSV文件
#读取数据
#读取2019-2014年的人口并且创建一个对应的csv文件.
pop2 pop.iloc[:, 0:6]
pop2.to_csv(pop2.csv, encodinggbk)
4.缺失值处理
4.1.缺失值创建
#缺失值处理
np.random.seed(3)
grades pd.DataFrame(np.random.randint(60, 100, size(4, 3)), index[Ann, Bob, Cindy, Lee], columns[Python, C, Java])
#np.nan/None创建确实值
grades.loc[Ann, C] np.nan
grades.loc[Cindy, Python] None
grades
4.2.缺失值检索
#发现检索缺失值
grades.info()
#查看对应的缺失值 3 non-null表示
#Python/C各有一个缺失值 4.3.缺失值查询
Pandas有两种发现缺失值的方法isnull和notnull
isnull(): Series.isnull()、DataFrame.isnull() 4.3.1.isnull()函数判断 元素级别的判断---把DataFrame或Series所有元素的位置都列
出来元素为空或者NA返回True否则返回Falsegrades.isnull() 4.3.2.notnull()函数判断 和isnull类似区别是notnull的判断依据相反即缺失值返回
False非缺失值返回Truegrades.notnull()
4.3.3.any()函数搭配寻找
#any()函数1.isnull()和any函数搭配Series.any()、DataFrame.any()
2.和Numpy的any函数类似统计Series或DataFrame中是否存在True若存在,返回True否则返回False
2.1.默认参数axis0即按列统计
2.2.调用DF.isull( ).any( )如果某一列中有缺失值则返回值中该列对应值为Truegrades.isnull().any()
#如结果所示Java没有缺失值显示为True C和Python都有缺失值显示为False
4.3.4. 具体寻找缺失索引
#搜寻nan的信息
grades.index[grades.isnull().any(axis1)]#按行搜索index[]花式搜索
4.4.缺失值处理
4.4.1.缺失值剔除
#处理缺失值:Pandas剔除缺失值的方法-DataFrame.dropna()默认axis0剔除包含缺失值的整行数据grades.dropna()
4.4.2.缺失值填充
#填充缺失值
#数据是宝贵的一般情况只要数据缺失比例不高尽量不要剔除缺失值而是填充缺失值1.填充缺失值的方法Series.fillna(),DataFrame.fillna()
2.DataFrame.fillna(valueNone, methodNone,axisNone, inplaceFalse)
2.1.value 填充的值---用常数替代缺失值
2.2.method填充方式---{ ‘bfill’, ffill, None}
2.3.ffill : 使用前一个值来填充缺失值
2.4.bfill : 使用后一个值来填充缺失值4.4.2.1.按常数填充
#全部填充0
grades.fillna(0)
4.4.2.2.按指定填充
#按照自己的意愿填充
grades.fillna({Python:80,C:60})
4.4.2.3.按前数填充
#分别采用ffill和bfill方式对dataFrame缺失值填充
#ffill参考前一个
grades.fillna(methodffill)#默认axis0 按列来
grades.fillna(methodffill,axis1)#也可以指定
4.4.2.4.按后数填充
#bfill参考后一个
grades.fillna(methodbfill)#默认axis0 按列来
grades.fillna(methodbfill,axis1)#也可以指
4.4.2.5.按统计数据填充
#利用某些统计数据进行填充
grades[C].fillna(grades[C].mean())