当前位置: 首页 > news >正文

seo站长常用工具南京市工程造价信息网

seo站长常用工具,南京市工程造价信息网,广州网页建站,图片生成器在线一、配置 忽略损坏的文件、忽略丢失的文件、路径全局过滤器、递归文件查找和修改时间路径过滤器等选项/配置仅在使用基于文件的源#xff08;parquet#xff0c;orc#xff0c;avro#xff0c;json#xff0c;csv#xff0c;txt#xff09;时才有效。 以下示例中使用的…一、配置 忽略损坏的文件、忽略丢失的文件、路径全局过滤器、递归文件查找和修改时间路径过滤器等选项/配置仅在使用基于文件的源parquetorcavrojsoncsvtxt时才有效。 以下示例中使用的目录层次结构为 dir/├── childDir/│ └── test.json└── test.avro└── test.orc└── test1.json 二、忽略损坏的文件 设置spark.sql.files.ignoreCorruptFiles为true从文件读取数据时忽略损坏的文件。 读取数据文件时忽略损坏的文件例子 spark.sql(set spark.sql.files.ignoreCorruptFilestrue); // dir/test.avro 和 dir/test.avro不是json被忽略 DatasetRow jsonDF spark.read().json(hdfs://master:9000/dir/,hdfs://master:9000/dir/chidDir/); jsonDF.show(); 三、忽略丢失的文件 设置spark.sql.files.ignoreMissingFiles设置为true在文件读取数据时忽略不存在的文件。 spark.sql(set spark.sql.files.ignoreMissingFilestrue);DatasetRow jsonDF spark.read().json(hdfs://master:9000/dir/,hdfs://master:9000/dir/chidDir/a.json); jsonDF.show(); 四、路径全局过滤器 pathGlobFilter用于仅包含文件名与模式匹配的文件。语法实现为org.apache.hadoop.fs.GlobFilter类它不会更改分区发现的行为。 要加载具有与给定全局模式匹配的路径的文件同时保持分区发现的行为例子 DatasetRow jsonDF spark.read().format(json).option(pathGlobFilter, *.json) // dir只读取json文件.load(hdfs://master:9000/dir); jsonDF.show(); 五、递归文件查找 recursiveFileLookup用于递归加载文件并且禁用分区推断。其默认值为false。如果数据源显式指定partitionSpec并且recursiveFileLookup为true则将引发异常。 递归加载所有文件例子 DatasetRow jsonDF spark.read().format(json).option(recursiveFileLookup, true).load(hdfs://master:9000/dir); jsonDF.show(); 六、修改时间路径过滤器 modifiedBefore和·modifiedAfter是可以一起应用或单独应用的选项。注意结构化流文件源不支持这些选项。 modifiedBefore可选的时间戳记仅包含修改时间在指定时间之前发生的文件。提供的时间戳必须采用以下格式YYYY-MM-DDTHHmmss例如2021-03-31T201000modifiedAfter可选的时间戳记仅包括修改时间在指定时间之后发生的文件。提供的时间戳必须采用以下格式YYYY-MM-DDTHHmmss例如2021-03-31T201000 如果未提供时区选项则时间戳使用Spark会话时区spark.sql.session.timeZone。 要加载路径与给定的修改时间范围匹配的文件例子 DatasetRow jsonDF spark.read().format(json).option(modifiedBefore, 2021-03-21T11:34:00).option(modifiedAfter, 2021-03-05T11:34:00)// Interpret both times above relative to CST timezone.option(timeZone, CST).load(hdfs://master:9000/dir); jsonDF.show();
http://www.pierceye.com/news/727216/

相关文章:

  • 网站打不开服务器错误网站怎么设置支付
  • 做网站的宽度为多少云南省建设工程信息服务平台
  • 网站优化公司大家好桂林网络搭建
  • 做a漫画在线观看网站网站建设这个工作怎么样
  • 商城网站建设缺点培训机构退费
  • 大型网站需要什么样的团队建购物网站 教程
  • 商业设计网站推荐网站注册免费qq
  • 做微信首图的网站阿里网站建设App开发
  • .网站链接策略网页制作手机版
  • 河南网站优化要多少钱网站技术有哪些
  • 域名还在备案可以做网站吗高端设计公司名字大全
  • 简洁的门户网站网站开发文案
  • 信息网站 模板中国建设银行手机银行下载官方网站
  • 番禺网站开发设计小程序后端数据库搭建
  • 丰都集团网站建设云南网站开发公司
  • 赶集网的二级域名网站怎么做海南网站建设报价方案
  • dede做手机网站网站开发小作业
  • 网站建设推广ppt室内设计知名网站
  • asp 网站源码网站搭建好了怎么上到服务器
  • 网站有什么到期wordpress怎么编辑保存
  • 服务器添加网站300500启迪设计
  • 上海市建设安全协会网站移动端页面
  • 手机做网站公司成都住房和城乡建设厅官网
  • 锋创科技园网站建设网站开发ide php
  • 山东做网站的公司有哪些电脑怎么制作视频短片
  • 书画网站 建站维护网站成本
  • 什么事网站开发网站服务器租用报价
  • 做黏土的网站青岛网站建设微动力
  • 建网站权威公司广告发布平台
  • 自助游网站开发分析报告总结怎么注册公司微信公众号