当前位置: 首页 > news >正文

网站建设管理工作总结报告自己怎样建立网站

网站建设管理工作总结报告,自己怎样建立网站,比较好的搜索引擎,南昌房产网欢迎关注微信公众号#xff0c;更多优质内容会在微信公众号首发 1. pyspark中时间格式的数据转换为字符串格式的时间#xff0c;示例代码 from datetime import datetimedate_obj datetime(2023, 7, 2) formatted_date date_obj.strftime(%Y-%m-%d %H:%M:%S)p…欢迎关注微信公众号更多优质内容会在微信公众号首发 1. pyspark中时间格式的数据转换为字符串格式的时间示例代码 from datetime import datetimedate_obj datetime(2023, 7, 2) formatted_date date_obj.strftime(%Y-%m-%d %H:%M:%S)print(formatted_date) # 2023-07-02 00:00:00 2. pysoark中打印dataframe中的有哪些列示例代码 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John, 25), (2, Alice, 30), (3, Bob, 35)], [id, name, age])# 打印 DataFrame 的列 columns df.columns print(columns) # [id, name, age] 3. pyspark中选择其中一些列示例代码 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John, 25), (2, Alice, 30), (3, Bob, 35)], [id, name, age])# 选择 name 和 age 列 selected_columns [name, age] selected_df df.select(selected_columns)# 打印选择的列 selected_df.show() -------- | name|age| -------- | John| 25| |Alice| 30| | Bob| 35| -------- 4. pyspark中选择其中一列不是空的行示例代码 from pyspark.sql import SparkSession from pyspark.sql.functions import col# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John, 25), (2, None, 30), (3, Bob, None)], [id, name, age])# 选择 name 列不为空的行 selected_df df.filter(col(name).isNotNull())# 打印选择的行 selected_df.show() ---------- | id|name|age| ---------- | 1|John| 25| ---------- 5. pyspark中的dataframe统计有多少行 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John, 25), (2, Alice, 30), (3, Bob, 35)], [id, name, age])# 打印 DataFrame 的行数 row_count df.count() print(row_count) 3 6. pyspark的dataframe删除重复行示例代码 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John), (2, Alice), (3, Bob), (4, Alice)], [id, name])# 选择 name 列的不重复值 distinct_values df.select(name).distinct() 7. pyspark中的DataFrame对一列分组统计数量并添加到原来的dataframe示例代码 from pyspark.sql import SparkSession from pyspark.sql.functions import count# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John), (2, Alice), (3, Bob), (4, Alice)], [id, name])# 对 name 列进行分组并统计每个值的数量 grouped_df df.groupBy(name).agg(count(*).alias(count))# 打印分组统计结果 grouped_df.show() ---------- | name|count| ---------- | Bob| 1| |Alice| 2| | John| 1| ---------- 8. spark中的DataFrame写入csv示例代码 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John, 25), (2, Alice, 30), (3, Bob, 35)], [id, name, age])# 将 DataFrame 写入为 CSV 文件 df.write.csv(path/to/output.csv, headerTrue) 9. pyspark中的dataframe取前n行示例代码 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John, 25), (2, Alice, 30), (3, Bob, 35)], [id, name, age])# 获取前 10 行 top_10_rows df.limit(10)# 打印前 10 行 top_10_rows.show()10. 打印pyspark中的dataframe的某一列的纯文本值示例代码 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df df spark.createDataFrame([(1, John), (2, Alice), (3, Bob)], [id, a])# 选择 a 列的纯文本值并打印 text_values df.select(a).collect()for row in text_values:print(row[a])输出 John Alice Bob11. pyspark中用lit给dataframe添加一列示例代码 from pyspark.sql import SparkSession from pyspark.sql.functions import lit# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 创建包含常量值的列 df spark.range(5).select(lit(Hello).alias(message))# 打印 DataFrame df.show()------- |message| ------- | Hello| | Hello| | Hello| | Hello| | Hello| -------12. 打印pyspark中dataframe中列的数据类型和列名示例代码1 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df列名为 column_name df spark.createDataFrame([(1, Hello), (2, World), (3, Spark)], [id, column_name])# 打印列的数据类型 df.printSchema()root|-- id: long (nullable true)|-- column_name: string (nullable true)示例代码2 from pyspark.sql import SparkSession# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df列名为 column_name df spark.createDataFrame([(1, Hello), (2, World), (3, Spark)], [id, column_name])# 获取列的数据类型 column_data_type df.dtypes[1][1]# 打印列的数据类型 print(column_data_type)string13. pyspark中的dataframe的两列做某种运算并形成新的列 from pyspark.sql import SparkSession from pyspark.sql.functions import col# 创建 SparkSession spark SparkSession.builder.getOrCreate()# 假设您的 DataFrame 名称为 df包含两列col_a 和 col_b data [(1, 2), (3, 4), (5, 6)] df spark.createDataFrame(data, [col_a, col_b])# 将 col_a 列除以 col_b 列并生成新的列 col_result df_with_division df.withColumn(col_result, col(col_a) / col(col_b))# 打印包含新列的 DataFrame df_with_division.show()---------------------------- |col_a|col_b| col_result| ---------------------------- | 1| 2| 0.5| | 3| 4| 0.75| | 5| 6|0.8333333333333334| ----------------------------
http://www.pierceye.com/news/421269/

相关文章:

  • 开发网站私活wordpress 被墙
  • 安徽索凯特建设工程有限公司网站wordpress虚拟资源
  • 做购物网站安全吗河南网站平台建设公司
  • 网站台做计么呢wordpress微信插件开发
  • 外贸电商网站制作网站开发数据库问题
  • 如何推广个人网站广州关键词优化外包
  • 长沙专业网站建设公司排名运城网站建设专业服务商
  • 建设银行宁波招聘网站会议管理系统
  • 重庆 网站开发如何将网站提交到搜索引擎
  • 怎么把网站封包做app网页设计基础开题报告及网页流程图
  • 网上购物网站开发的背景网站开发与应用 论文
  • 广州做网站哪个公司做得好优化设计方法
  • ie的常用网站企业文化建设网站
  • 网站广告是文化事业建设费系统客户管理软件
  • 企业网站用个人备案佛山网站建设公司哪个性比价好些
  • 深圳龙华做网站公司网络平面设计包括哪些
  • 高清素材网站无水印我要找人做网站的主页
  • 手机网站 程序网站备案要关多久
  • 网站需要具备条件在线用代码做网站
  • 代码下载网站河北恒山建设集团网站
  • 网站设计应遵循的原则做企业网站有哪些好处
  • 网站不用域名解绑商务网站建设的一般流程是什么?
  • 企业网站的运营如何做秦皇岛网站制作与网站建设
  • 潍坊 营销型网站建设室内设计和装修设计
  • 滕州市东方建设工程事务有限公司网站房房网
  • php网站漂浮广告代码百度一下打开网页
  • 华为公司网站建设方案模板自己做网站的费用
  • 网站设计命名规范广州短视频内容营销平台
  • 天津专门做网站的公司成都市城乡建设局网站
  • 品牌网站升级wordpress 4.9中文