当前位置: 首页 > news >正文

深圳南山企业网站建设三网合一网站系统

深圳南山企业网站建设,三网合一网站系统,住建网站需多少钱,微信公众号设计与布局日常用Python做数据分析最常用到的就是查询筛选了#xff0c;按各种条件、各种维度以及组合挑出我们想要的数据#xff0c;以方便我们分析挖掘。 东哥总结了日常查询和筛选常用的种骚操作#xff0c;供各位学习参考。本文采用sklearn的boston数据举例介绍。 from sklearn …日常用Python做数据分析最常用到的就是查询筛选了按各种条件、各种维度以及组合挑出我们想要的数据以方便我们分析挖掘。 东哥总结了日常查询和筛选常用的种骚操作供各位学习参考。本文采用sklearn的boston数据举例介绍。 from sklearn import datasets import pandas as pdboston datasets.load_boston() df pd.DataFrame(boston.data, columnsboston.feature_names)1. [] 第一种是最快捷方便的直接在dataframe的[]中写筛选的条件或者组合条件。比如下面想要筛选出大于NOX这变量平均值的所有数据然后按NOX降序排序。 df[df[NOX]df[NOX].mean()].sort_values(byNOX,ascendingFalse).head()当然也可以使用组合条件条件之间使用逻辑符号 |等。比如下面这个例子除了上面条件外再加上且条件CHAS为1注意逻辑符号分开的条件要用()隔开。 df[(df[NOX]df[NOX].mean()) (df[CHAS] 1)].sort_values(byNOX,ascendingFalse).head()2. loc/iloc 除[]之外loc/iloc应该是最常用的两种查询方法了。loc按标签值列名和行索引取值访问iloc按数字索引访问均支持单值访问或切片查询。除了可以像[]按条件筛选数据以外loc还可以指定返回的列变量从行和列两个维度筛选。 比如下面这个例子按条件筛选出数据并筛选出指定变量然后赋值。 df.loc[(df[NOX]df[NOX].mean()),[CHAS]] 23. isin 上面我们筛选条件 !都是个范围但很多时候是需要锁定某些具体的值的这时候就需要isin了。比如我们要限定NOX取值只能为0.538,0.713,0.437中时。 df.loc[df[NOX].isin([0.538,0.713,0.437]),:].sample(5)当然也可以做取反操作在筛选条件前加~符号即可。 df.loc[~df[NOX].isin([0.538,0.713,0.437]),:].sample(5)4. str.contains 上面的举例都是数值大小比较的筛选条件除数值以外当然也有字符串的查询需求。pandas里实现字符串的模糊筛选可以用.str.contains()来实现有点像在SQL语句里用的是like。 下面利用titanic的数据举例筛选出人名中包含Mrs或者Lily的数据|或逻辑符号在引号内。 train.loc[train[Name].str.contains(Mrs|Lily),:].head().str.contains()中还可以设置正则化筛选逻辑。 caseTrue使用case指定区分大小写naTrue就表示把有NAN的转换为布尔值Trueflagsre.IGNORECASE标志传递到re模块例如re.IGNORECASEregexTrueregex 如果为True则假定第一个字符串是正则表达式否则还是字符串 5. where/mask 在SQL里我们知道where的功能是要把满足条件的筛选出来。pandas中where也是筛选但用法稍有不同。 where接受的条件需要是布尔类型的如果不满足匹配条件就被赋值为默认的NaN或其他指定值。举例如下将Sex为male当作筛选条件cond就是一列布尔型的Series非male的值就都被赋值为默认的NaN空值了。 cond train[Sex] male train[Sex].where(cond, inplaceTrue) train.head()也可以用other赋给指定值。 cond train[Sex] male train[Sex].where(cond, otherFEMALE, inplaceTrue)甚至还可以写组合条件。 train[quality] traincond1 train[Sex] male cond2 train[Age] 25train[quality].where(cond1 cond2, other低质量男性, inplaceTrue)mask和where是一对操作与where正好反过来。 train[quality].mask(cond1 cond2, other低质量男性, inplaceTrue)6. query 这是一种非常优雅的筛选数据方式。所有的筛选操作都在之内完成。 # 常用方式 train[train.Age 25] # query方式 train.query(Age 25)上面的两种方式效果上是一样的。再比如复杂点的加入上面的str.contains用法的组合条件注意条件里有时两边要用包住。 train.query(Name.str.contains(William) Age 25)在query里还可以通过来设定变量。 name William train.query(Name.str.contains(name))7. filter filter是另外一个独特的筛选功能。filter不筛选具体数据而是筛选特定的行或列。它支持三种筛选方式 items固定列名regex正则表达式like以及模糊查询axis控制是行index或列columns的查询 下面举例介绍下。 train.filter(items[Age, Sex])train.filter(regexS, axis1) # 列名包含S的train.filter(like2, axis0) # 索引中有2的train.filter(regex^2, axis0).filter(likeS, axis1)8. any/all any方法意思是如果至少有一个值为True结果便为Trueall需要所有值为True结果才为True比如下面这样。 train[Cabin].all()Falsetrain[Cabin].any()Trueany和all一般是需要和其它操作配合使用的比如查看每列的空值情况。 train.isnull().any(axis0)再比如查看含有空值的行数。 train.isnull().any(axis1).sum()708e any和all一般是需要和其它操作配合使用的比如查看每列的空值情况。 train.isnull().any(axis0) [外链图片转存中...(img-QYyk6pc2-1694485667807)]再比如查看含有空值的行数。 train.isnull().any(axis1).sum() 708
http://www.pierceye.com/news/312933/

相关文章:

  • 购物网站设计的目的wordpress 游戏主题下载失败
  • 兰州最好的网站开发公司单页网站是什么样子的
  • 在线购物商城网站江苏营销型网站
  • 如何在百度上为企业做网站wordpress轮播图设置
  • qt 网站开发怎样开发一个app软件
  • html5博客网站模板泉州市住房与城乡建设网站
  • 没网站怎么做app创意设计图片
  • 重庆涪陵网站设计公司推荐外贸优化网站制作
  • 网页怎么制作四页石家庄seo排名外包
  • 高校信息化建设 网站东阳网络科技有限公司
  • 网站 如何做 中英文切换网站怎么提升关键词排名
  • 企业只有建立自己的网站平台金坛建设局网站
  • 网站建设及维护费用网站开发质量控制计划书
  • dede免费网站模板内蒙古住房与建设官方网站
  • 网络设计开发网站电子商务网站建设财务分析
  • 牛商做网站的理念国外便宜域名注册商
  • 深圳网站制作880网页设计与制作教程 个人简历代码
  • 皇岗网站建设济南市住房和城乡建设局
  • 产品创新设计方案seo 网站案例
  • 做名片最好的网站上海网站开发制作公司
  • 网站如何做三端适配wordpress get_the_author_meta
  • 个人介绍微电影网站模板网站制作策划
  • 怎么在网上注册自己的网站网站框架建设
  • 哪个网站做自媒体比较好广西模板十大名牌排名榜
  • 苏州手机网站制作建设视频网站费用
  • 301的网站用什么来做为企业为什么做网站
  • wordpress怎安装关键词优化排名易下拉排名
  • 怎么做网站评估android安卓软件下载
  • 网站建设设计培训班南昌广告公司
  • 网站问责建设书企业网站建设 百度文库