当前位置: 首页 > news >正文

点击图片直接进入网站怎么做举报网站建设情况 汇报

点击图片直接进入网站怎么做,举报网站建设情况 汇报,如何注册国外网站,湖北省平安建设网站一、目的 在离线数仓中#xff0c;需要用Flume去采集Kafka中的数据#xff0c;然后写入HDFS中。 由于每种数据类型的频率、数据大小、数据规模不同#xff0c;因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume#xff0c;感觉Flume的使用难点就是配置文件 二、…一、目的 在离线数仓中需要用Flume去采集Kafka中的数据然后写入HDFS中。 由于每种数据类型的频率、数据大小、数据规模不同因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume感觉Flume的使用难点就是配置文件 二、使用场景 静态排队数据是数据频率为1s的数据类型代表数据量很大、频率很高因此搞定了静态排队数据的采集就搞定了这一类高频率数据的实时采集问题 1台雷达每日的静态排队数据规模是25MB10台雷达的数据规模则是250MB 三、静态排队数据的配置文件 ## agent a1 a1.sources s1 a1.channels c1 a1.sinks k1 ## configure source s1 a1.sources.s1.type org.apache.flume.source.kafka.KafkaSource a1.sources.s1.kafka.bootstrap.servers 192.168.0.27:9092 a1.sources.s1.kafka.topics topic_b_queue a1.sources.s1.kafka.consumer.group.id queue_group a1.sources.s1.kafka.consumer.auto.offset.reset latest a1.sources.s1.batchSize 1000 ## configure channel c1 ## a1.channels.c1.type memory ## a1.channels.c1.capacity 10000 ## a1.channels.c1.transactionCapacity 1000 a1.channels.c1.type file a1.channels.c1.checkpointDir /home/data/flumeData/checkpoint/queue a1.channels.c1.dataDirs /home/data/flumeData/flumedata/queue ## configure sink k1 a1.sinks.k1.type hdfs a1.sinks.k1.hdfs.path hdfs://hurys23:8020/user/hive/warehouse/hurys_dc_ods.db/ods_queue/day%Y-%m-%d/ a1.sinks.k1.hdfs.filePrefix queue a1.sinks.k1.hdfs.fileSuffix .loga1.sinks.k1.hdfs.round true a1.sinks.k1.hdfs.roundValue 10 a1.sinks.k1.hdfs.roundUnit second a1.sinks.k1.hdfs.rollSize 10240000 a1.sinks.k1.hdfs.rollCount 0 a1.sinks.k1.hdfs.rollInterval 0 a1.sinks.k1.hdfs.idleTimeout 60 a1.sinks.k1.hdfs.minBlockReplicas 1 ## Bind the source and sink to the channel a1.sources.s1.channels c1 a1.sinks.k1.channel c1 四、Flume写入HDFS结果 Flume根据时间戳按照ODS层表的分区将数据写入对应HDFS文件 五、ODS表刷新分区后查验数据 一刷新表分区 MSCK REPAIR TABLE ods_queue; 二查看表数据 select * from ods_queue; 六、注意点 一配置文件中的重点是红色标记的几点 a1.sinks.k1.hdfs.round true a1.sinks.k1.hdfs.roundValue 10 a1.sinks.k1.hdfs.roundUnit second a1.sinks.k1.hdfs.rollSize 10240000 a1.sinks.k1.hdfs.rollCount 0 a1.sinks.k1.hdfs.rollInterval 0 a1.sinks.k1.hdfs.idleTimeout 60 a1.sinks.k1.hdfs.minBlockReplicas 1 二这几个重点参数的含义 序号Flume参数参数含义1round是否启用时间上的”舍弃”如果启用则会影响除了%t的其他所有时间表达式                                       默认值false2roundValue多少时间单位创建一个新的文件夹3roundUnit重新定义时间单位4rollSize当临时文件达到该大小(单位:bytes)时,滚动成目标文件;默认值:1024byte            如果设置成0,则表示不根据临时文件大小来滚动文件5rollCount当events数据达到该数量时候,将临时文件滚动成目标文件;默认值:10               如果设置成0,则表示不根据events数据来滚动文件6rollInterval多久将临时文件滚动成最终目标文件,单位:秒;默认值:30s                    如果设置成0,则表示不根据时间来滚动文件;7idleTimeout当目前被打开的临时文件在该参数指定的时间秒内,没有任何数据写入,则将该临时文件关闭并重命名成目标文件;            默认值:08minBlockReplicas写入HDFS文件块的最小副本数一般配置成1才能正确滚动文件 更多Flume配置文件参数含义请看鄙人另一篇博客 一百九十一、Flume——Flume配置文件各参数含义持续完善中 http://t.csdnimg.cn/o5XbGhttp://t.csdnimg.cn/o5XbG 就先这样吧如果有问题的话后面再更新
http://www.pierceye.com/news/849698/

相关文章:

  • 网站建设深圳赶集网网页设计工程师工资
  • 哪家企业网站建设好闵行区网站制作
  • 重庆行业网站建设陕西省建设监理协会查询官方网站
  • 手机网站 尺寸网站规划的认识
  • 永川网站制作联系电话wordpress 参数 传递
  • 西宁市网站建设高端网站开发人员要求
  • 前端做商城网站需要多久yum wordpress
  • 便宜网站建设成都免费建网站视频教程
  • 班级网站自助建设功能没有充值入口的传奇
  • 杭州网站seo免费网站建设
  • 好看的网站设计网站开发龙岗网站建设
  • 物流如何做网站wordpress qq互联插件
  • 权威发布李建济南做seo排名
  • 六安网站建设 220广州安尔捷做的网站好吗
  • 企业网站写好如何发布wordpress免插件生成地图
  • 公司 网站 苏州链接下载
  • 网站页面设计素材网站做权重的方法
  • 网站优化标题怎么做宿迁房产网备案查询
  • 建设企业官方网站的流程秦皇岛网站备案
  • 北京网站优化前景建设银行包头分行网站
  • 南京江宁区住房建设局网站电商交流平台有哪些
  • 查询网站流量排名做网站 我们的工人怎么写
  • 龙岗-网站建设深圳信科免备案的网站空间
  • 360网站推广官网软件安徽海外网络推广
  • c# asp.net网站开发书考试网站怎么做的
  • 网站开发 技术路线融资融券配资网站建设
  • 建设网站如国家高新技术企业证书
  • 网站服务是什么网站建设投标书报价表
  • 商业网站开发与设计宝塔面板wordpress安装
  • 学交互设计网站企业网站建设要多久