当前位置: 首页 > news >正文

建立网站目的百度搜索资源平台提交

建立网站目的,百度搜索资源平台提交,crm管理系统软件,wordpress用户导出一、目的 作为日志采集工具Flume#xff0c;它在项目中最常见的就是采集Kafka中的数据然后写入HDFS或者HBase中#xff0c;这里就是用flume采集Kafka的数据导入HDFS中 二、各工具版本 #xff08;一#xff09;Kafka kafka_2.13-3.0.0.tgz #xff08;二#xff09;…一、目的 作为日志采集工具Flume它在项目中最常见的就是采集Kafka中的数据然后写入HDFS或者HBase中这里就是用flume采集Kafka的数据导入HDFS中 二、各工具版本 一Kafka kafka_2.13-3.0.0.tgz 二HadoopHDFS hadoop-3.1.3.tar.gz 三Flume apache-flume-1.9.0-bin.tar.gz 三、实施步骤 一到flume的conf的目录下 # cd  /home/hurys/dc_env/flume190/conf 二创建配置文件evaluation.properties # vi  evaluation.properties ### Name agent, source, channels and sink alias a1.sources s1 a1.channels c1 a1.sinks k1 ### define kafka source a1.sources.s1.type org.apache.flume.source.kafka.KafkaSource # Maximum number of messages written to Channel in one batch a1.sources.s1.batchSize 5000 # Maximum time (in ms) before a batch will be written to Channel The batch will be written whenever the first of size and time will be reached. a1.sources.s1.batchDurationMillis 2000 # set kafka broker address a1.sources.s1.kafka.bootstrap.servers 192.168.0.27:9092 # set kafka consumer group Id and offset consume # 官网推荐1.9.0版本只设置了topic但测试后不能正常消费需要添加消费组id自己写一个并定义偏移量消费方式 a1.sources.s1.kafka.consumer.group.id evaluation_group a1.sources.s1.kafka.consumer.auto.offset.reset earliest # set kafka topic a1.sources.s1.kafka.topics topic_b_evaluation ### defind hdfs sink a1.sinks.k1.type hdfs # set store hdfs path a1.sinks.k1.hdfs.path hdfs://hurys22:8020/rtp/evaluation/evaluation_%Y-%m-%d # set file size to trigger roll a1.sinks.k1.hdfs.rollSize 0 a1.sinks.k1.hdfs.rollCount 0 a1.sinks.k1.hdfs.rollInterval 3600 a1.sinks.k1.hdfs.threadsPoolSize 30 a1.sinks.k1.hdfs.fileTypeDataStream a1.sinks.k1.hdfs.writeFormatText ### define channel from kafka source to hdfs sink # memoryChannel快速但是当设备断电数据会丢失 # FileChannel速度较慢即使设备断电数据也不会丢失 a1.channels.c1.type file # 这里不单独设置checkpointDir和dataDirs文件位置参考官网不设置会有默认位置 # channel store size a1.channels.c1.capacity 100000 # transaction size a1.channels.c1.transactionCapacity 10000 ### 绑定source、channel和sink a1.sources.s1.channels c1 a1.sinks.k1.channel c1 三配置文件创建好后启动flume服务 # cd /home/hurys/dc_env/flume190/ # ./bin/flume-ng agent -n a1  -f /home/hurys/dc_env/flume190/conf/evaluation.properties 四到HDFS文件里验证一下 HDFS中生成evaluation_2023-09-07 文件夹里面有很多小文件 五注意小文件里的数据是JSON格式即使我设置文件后缀名为csv也没用可能配置文件中的文件类型设置需要优化 a1.sinks.k1.hdfs.writeFormatText 六jps查看Flume的服务 [roothurys22 conf]# jps 16801 ResourceManager4131 Application 18055 AlertServer 16204 DataNode22828 Application 17999 LoggerServer 2543 launcher.jar22224 Application 17393 QuorumPeerMain 16980 NodeManager 17942 WorkerServer 16503 SecondaryNameNode11384 Application32669 Application 17886 MasterServer 10590 Jps 16031 NameNode 18111 ApiApplicationServer 注意Application就是Flume运行的任务 七关闭Flume服务 如果想要关闭Flume服务直接杀死服务就好了 # kill -9 32669 八checkpointDir和dataDirs默认的文件位置 默认的文件位置/root/.flume/file-channel/ 总之Flume这个工具的用法还需进一步研究优化当然kettle也可以所以这个项目目前还是用kettle吧
http://www.pierceye.com/news/911573/

相关文章:

  • 公司建设个网站制作装饰公司网站
  • 高质量的网站内容建设做网站信科网站建设
  • 网站建设倒计时模板学校室内设计效果图
  • 海东营销网站建设公司东莞网络优化排名
  • 株洲网站建设服务建筑公司怎么注册
  • 心理学网站的建设网站开发公司比较有名
  • 需要做网站设计海南网页制作
  • 开发网站有什么用仿站小工具官网
  • 支付宝网站登录入口个人微信公众号如何推广
  • 北京网站制作net2006常见的营销型网站
  • 设计建设网站公司天津市建设信息网官网
  • 企业网站建站 费用比较有名的个人网站
  • 网站规划与开发设计企业班组建设案例
  • 招聘网站开发设计做网站 免费字体
  • 网站上传程序流程桐城住房和城乡建设局网站
  • 回力网站建设初衷ps可以做网站吗
  • 广州网站建设市场佛山专业做网站公司哪家好
  • 四川省凉亭建设工程有限公司网站的博客wordpress
  • 搭建一个网站需要多少钱?如何做网站二级域名
  • 广德县住房和城乡建设网站wordpress网站维护教程
  • 在网站上显示地图金湖县网站建设
  • 网站域名区别吗模板和网站是一体的吗
  • 百度网盟推广怎么选择投放网站抖音seo代理
  • 电商wordpress网站优化百度
  • phpcms v9 网站搬家南通网站设计专家
  • 延安网站建设推广黄骅市网站建设价格
  • 做网站怎么选关键词网站管理强化阵地建设
  • 网站制作是那个cms 导航网站
  • 网站标题优化技巧房产信息网上自助查询系统
  • wordpress电影网教程合肥网站快速排名优化