当前位置: 首页 > news >正文

房产律师网站模板三水做网站

房产律师网站模板,三水做网站,农业开发公司好名字,怎么做网站广告位最近在GitHub上创建了一个新工程#xff0c;收集个人在数据工程工作的小工具集合#xff0c;命名为data_dragon (数据一条龙)。取这个名字的是希望这些脚本或代码能够复用#xff0c;端到端地减少临时数据处理的时间。最近因为工作上的一些变化#xff0c;写作节奏有点被打… 最近在GitHub上创建了一个新工程收集个人在数据工程工作的小工具集合命名为data_dragon (数据一条龙)。取这个名字的是希望这些脚本或代码能够复用端到端地减少临时数据处理的时间。最近因为工作上的一些变化写作节奏有点被打乱已经有2个月没有更新文章了。这次刚好将最近创建的小工程做个介绍。首先这个工程都是些零散的代码脚本目前上传了3个有Python有Bash shell。后期可能还有用sed写的HLR上的IMSI处理脚本Java写的Hive UDF……总之就是一些在实际工作中为了避免重复劳动的临时代码。放在线上就是为了方便以后遇到相同的问题可以重用该工程的代码地址是https://github.com/camash/data_dragon。工程中每一个文件夹都是一个独立的小工具用于解决一个独立的问题。目前已经上传的三个脚本分别用于“快速生成Azkaban任务调度的DAG”“hive同步数据到ES索引”以及“传输大量SFTP文件以及检查”。以下分别对上传的三个脚本做简要介绍。generate_azkaban_flow作用在Excel中配置任务依赖关系然后使用shell脚本快速生成Azkaban的job文件。使用方法创建文件 在Excel或者其它表格软件中按如下结构创建编号任务名称任务调用脚本依赖000start_kettle001test/home/hadoop/test/kettle/all/test.sh resource000_start_kettle002end_job/home/hadoop/test/kettle/all/end_job.sh000_start_kettle, 001_test执行转换 复制到文本文件中保存为tsv文件比如test.txt。然后执行shell脚本。bash ./gen_azkaban_flow.sh test.txt执行之后在文件所在路径内会生成以编号_任务名称.job的Azkaban任务文件。文件数量等同于tsv文件中的行数。ls -1 *.job000_start_kettle.job001_test.job002_end_job.jobjob文件内容主要包含执行项和依赖项依赖项就是最终生成任务DAG的边。同时这个脚本中默认会给执行命令加入执行日期参数若不需要可以通过修改shell命令实现。$ cat 002_end_job.job typecommanddependencies000_start_kettle, 001_testcommand/bin/bash /home/hadoop/test/kettle/all/end_job.sh ${azkaban.flow.start.year}${azkaban.flow.start.month}${azkaban.flow.start.day}使用总结可以通过先在表格中规则的梳理任务流避免了任务太多时直接写job文件容易遗漏的情况。梳理完成之后使用该脚本一次性生成所有的job秒秒钟完成。hive_to_elasticsearch作用将Hive表中的数据导入到Elasticsearch的索引中。使用方法脚本是通过Python3编写的因此使用Python3调用即可。python3 hive_records_to_es.py其中Hive地址和Elasticsearch的地址放在connection.cfg文件中样例如下[hive]host  192.168.1.4port  10000user  hadoop[es]es_url_1  http://192.168.1.6:7200/es_url_2  http://192.168.1.7:7200/es_url_3  http://192.168.1.8:7200/另外表名和索引名在脚本中是静态赋值后期需要动态传入。scp_copy_and_check作用从远程SFTP同步文件指定文件夹下的所有文件至本地的指定路径。在传输前后可以对源和目标系统上的文件数量进行校验(也可以支持其它校验和方式)。同时在传输前对源的文件数量可以设置一定阈值数量过少直接报异常退出程序。使用方法脚本是使用bash shell进行编写的需要传入日期参数来确认文件夹的路径参数格式为YYYYMMDD。若不传入参数则会取执行日期做为默认参数。调用方式如下bash scp_log_file.sh 20200916
http://www.pierceye.com/news/100724/

相关文章:

  • 大淘客网站建设婚庆网页设计作品dw
  • 嘉兴网站关键词优化后端开发流程
  • 有网络网站打不开怎么回事培训机构推广
  • 淄博网站建设优化珍云网站可信图标
  • 大连外贸网站建设江门营销网站建设
  • 县网站建设方案怎么做付费的小说网站
  • 企业公众号以及网站建设我想做个网站
  • 网站设为主页功能怎么做怎样制作h5
  • 网站的内容与功能设计微信公众平台小程序二维码怎么生成
  • 西安网站快速优化重庆明建网络科技有限公司干啥的
  • 广州市天河区门户网站软件制作公司
  • 做网站前期创建文件夹博罗高端网站建设价格
  • 襄阳网站建设价格淄博网站推广价格
  • 网站推广的软件六安网站制作哪里有
  • 大型门户网站模板wordpress有哪些小工具
  • 有flash的网站新闻资讯app制作公司
  • 网站和平台有什么区别黄页88怎么发信息质量高
  • 阿里建站价格小户型室内装修设计公司网站
  • 建设银行网站安全性分析网络推广服务平台
  • 大型购物网站建设福建微网站建设公司
  • 做网站软件j程序员找工作网站
  • 济南网站建设系统画册设计公司宣传册
  • 上海网站设计方案家纺网站建设
  • 衡水精品网站建设游戏广告推广平台
  • 响应式企业网站建设营销战略
  • wordpress离线浏览搜索引擎优化包括
  • 门户网站建设需要多少呼伦贝尔市住房和城乡建设局网站
  • 静海集团网站建设住房城乡建设网站
  • 个人备案挂企业网站网站开发公司照片
  • 网站建设课程体会国内最新新闻简短