当前位置: 首页 > news >正文

深圳龙华建设局官方网站找个免费的网站

深圳龙华建设局官方网站,找个免费的网站,vscode wordpress,品牌营销策划书DataX及使用 【一】DataX概述【二】DataX架构原理【1】设计理念【2】框架设计【3】运行流程【4】调度决策思路【5】DataX和Sqoop对比 【三】DataX部署【四】DataX上手【1】使用概述【2】配置文件格式【3】同步Mysql数据到HDFS 【五】DataX整合Springboot 【一】DataX概述 Data… DataX及使用 【一】DataX概述【二】DataX架构原理【1】设计理念【2】框架设计【3】运行流程【4】调度决策思路【5】DataX和Sqoop对比 【三】DataX部署【四】DataX上手【1】使用概述【2】配置文件格式【3】同步Mysql数据到HDFS 【五】DataX整合Springboot 【一】DataX概述 DataX是阿里巴巴开源的一个异构数据源离线同步工具用于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 支持的数据源如下 【二】DataX架构原理 【1】设计理念 为了解决异构数据源同步问题DataX把复杂的网状的同步链路变成了星型数据链路DataX作为重甲传输载体负责连接各种数据源。当需要接入一个新的数据源的时候只需要把此数据源对接到DataX就能跟已有的数据源做到无缝数据同步。 【2】框架设计 DataX本身作为离线数据同步框架采用FrameworkPlugin架构构建把数据源读取和写入抽象成Reader/Writer插件纳入到整个同步框架中。 1Reader数据采集模块负责采集数据源的数据把数据发给Framework 2Writer数据写入模块负责不断地向Framework取数据并把数据写入到目的端 3Framework用于连接Reader和Writer作为两者的数据传输通道并处理缓存、流控、并发、数据转换等核心问题 【3】运行流程 用一个DataX作业生命周期的时序图说明DataX的运行流程、核心概念和每个概念之间的关系 1Job单个作业同步的作业称为一个job一个job启动一个进程 2Task根据不同数据源切分策略一个job会切分为多个tasktask是DataX作业的最小单元每个Task负责一部分数据的同步工作。 3TaskGroupScheduler调度模块对Task进行分组每个Task组叫做一个Task Group每个Task Group负责以一定的并发度运行其分得得Task单个Task Group的并发度为5。 4Reader-Channel-Writer每个Task启动后都会固定启动Reader-Channel-Writer的线程来完成同步工作。 【4】调度决策思路 例子用户提交了一个DataX作业并且配置了总的并发度为20目的是对一个有100张分表的mysql数据源进行同步。DataX的调度决策思路是 1DataX Job根据分库分表切分策略将同步工作分成100个Task。 2根据配置的总的并发度20以及每个Task Group的并发度5DataX计算共需要分配4个TaskGroup。 34个TaskGroup平分100个Task每一个TaskGroup负责运行25个Task。 【5】DataX和Sqoop对比 【三】DataX部署 1下载DataX安装包并上传到hadoop102的/opt/software 下载地址http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz 2解压datax.tar.gz到/opt/module tar -zxvf datax.tar.gz -C /opt/module 3自检执行如下命令python /opt/module/datax/bin/datax.py /opt/module/datax/job/job.json 出现如下内容则表明安装成功 …… 2021-10-12 21:51:12.335 [job-0] INFO JobContainer - 任务启动时刻 : 2021-10-12 21:51:02 任务结束时刻 : 2021-10-12 21:51:12 任务总计耗时 : 10s 任务平均流量 : 253.91KB/s 记录写入速度 : 10000rec/s 读出记录总数 : 100000 读写失败总数 : 0 【四】DataX上手 【1】使用概述 任务提交命令用户需要根据同步数据的数据源和目的地选择相应的Reader和Writer并将Reader和Writer的信息配置在一个json文件中然后执行命令提交数据同步任务即可。python bin/datax.py path/to/your/job.json 【2】配置文件格式 查看DataX配置文件模板python bin/datax.py -r mysqlreader -w hdfswriter json最外层是一个jobjob包含setting和content两部分其中setting用于对整个job进行配置content用户配置数据源和目的地。 Reader和Writer的具体参数参考官方文档 https://github.com/alibaba/DataX/blob/master/README.md https://gitee.com/mirrors/DataX/blob/master/README.md 【3】同步Mysql数据到HDFS 使用一个栗子来完成同步MySQL数据-HDFS的应用 要求同步gmall数据库中base_province表数据到HDFS的/base_province目录 分析需选用MySQLReader和HDFSWriterMySQLReader具有两种模式分别是TableMode和QuerySQLMode前者使用tablecolumnwhere等属性声明需要同步的数据后者使用一条SQL查询语句声明需要同步的数据。 【五】DataX整合Springboot
http://www.pierceye.com/news/826031/

相关文章:

  • 开发一个交易网站多少钱做哪类网站比较赚钱
  • 帮人做彩票网站支付接口成都网络推广培训哪家好
  • 电子商务网站建设的教案404 not found wordpress
  • 怎样建设一个购物网站什么网站可以做直播
  • 石家庄网站开发培训灵犀科技网站开发佼佼者
  • 做阿里还是网站三个律师做网站合适吗
  • 梅州做网站设计公司网站 在百度搜索不到
  • 临沂门户网站制作微信附近人推广引流
  • 九龙坡区网站建设外贸是什么工作
  • 贵州省住房和城乡建设厅网站报名网网站开发入职转正申请书
  • 外贸平台哪个网站好做dede网站白屏
  • 可信的手机网站建设服装网站ui设计
  • 江苏网站建设效果好技术支持 英铭网站建设
  • 很多网站开发没有框架如何制作的网站模板制作与安装教程视频教程
  • 小说网站建设目的360如何做网站
  • 永安市住房与城乡建设局网站腾讯邮箱企业邮箱入口登录
  • 手机和wap网站建设wordpress链接 数据库
  • 1688网站简介青岛网站建设系统
  • 优秀网站的特点wordpress 腾讯云oss
  • 深圳专业做网站公司怎么做网站跳转
  • 设计教学网站推荐重庆大渝网
  • 网站建设询价邀请函二级建造师报名的官网
  • 沈阳个人网站建设表白网站制作软件
  • 开封+网站建设+网络推广网站建设及托管合同模板
  • 怎么看公司网站建设的时间苏州展厅设计公司排名
  • 新电商平台电脑优化软件哪个好用
  • 个人可以建网站咨询公司简介
  • 关于网站开发怎么找到做外贸的国内公司
  • 国外优秀摄影作品网站互联网项目推广方案
  • icp网站备案查询美容整形网站建设