当前位置: 首页 > news >正文

领卷网站如何做代理湖南大钧工程建设有限公司网站

领卷网站如何做代理,湖南大钧工程建设有限公司网站,广州 网站建设,长春市网络品牌推广#x1f947;#x1f947;【大数据学习记录篇】-持续更新中~#x1f947;#x1f947; 个人主页#xff1a;beixi 本文章收录于专栏#xff08;点击传送#xff09;#xff1a;【大数据学习】 #x1f493;#x1f493;持续更新中#xff0c;感谢各位前辈朋友们支持… 【大数据学习记录篇】-持续更新中~ 个人主页beixi 本文章收录于专栏点击传送【大数据学习】 持续更新中感谢各位前辈朋友们支持学习~ 文章目录 1.Flume集群环境介绍2.搭建环境介绍3.启动HDFS集群环境4.Flume集群环境搭建 1.Flume集群环境介绍 Flume是一个分布式、可靠和高可用性的数据采集工具用于将大量数据从各种源采集到Hadoop生态系统中进行处理。在大型互联网企业的数据处理任务中Flume被广泛应用。 Flume集群环境介绍 AgentFlume的基本组成单元是Agent用于在不同的节点之间传输数据。Agent可以是单节点或分布式部署。 SourceSource是Flume数据采集的起点用于从数据源如日志文件、网络流、消息队列等中获取数据并将其发送到Channel中。Flume支持多种Source类型如Avro、Netcat、Exec等。 ChannelChannel是Flume的缓存区用于暂存从Source获取的数据。Flume支持多种Channel类型如Memory、File、Kafka等可以根据数据量和数据传输速率选择合适的Channel类型。 SinkSink是Flume的目标用于将数据输出到指定的目标位置。Flume支持多种Sink类型如HDFS、HBase、Elasticsearch等。 EventEvent是Flume传输的基本单元表示采集到的数据。一个Event包含Header和Body两个部分其中Header用于描述Event的属性如时间戳、数据类型等Body是实际的数据内容。 CollectorCollector用于收集Flume的监控信息如Agent的启停状态、数据采集速率等。Flume提供了Web界面和API接口来实现监控和管理。 Flume逻辑上分三层架构agentcollectorstorage。agent用于采集数据agent是Flume中产生数据流的地方同时agent会将产生的数据流传输到collector。collector的作用是将多个agent的数据汇总后加载到storage中。storage是存储系统可以是一个普通file也可以是HDFSHIVEHBase等。 2.搭建环境介绍 本次搭建的环境有 Oracle Linux 7.4三台虚拟机分别为master,slave1,slave2 JDK1.8.0_144 Hadoop2.7.4集群环境 Flume1.6.0 3.启动HDFS集群环境 1.打开master命令窗口启动HDFS平台。 start-dfs.sh2.查看”主节点”上HDFS守护进程 jps3.打开slave1从机命令窗口查看HDFS守护进程。 jps4.打开slave2从机命令窗口查看HDFS守护进程。 jps4.Flume集群环境搭建 1.打开master命令窗口。 2.解压Flume压缩文件至/opt目录。 tar -zxvf experiment/file/apache-flume-1.6.0-bin.tar.gz -C /opt3.修改解压后文件夹的名字为flume。 mv /opt/apache-flume-1.6.0-bin /opt/flume4.查看Flume配置文件目录conf ll /opt/flume/conf/5.复制Flume配置文件flume-env.sh.template名为flume-env.sh cp /opt/flume/conf/flume-env.sh.template /opt/flume/conf/flume-env.sh6.查找Java安装路径 echo $JAVA_HOME7.配置flume-env.sh文件 vim /opt/flume/conf/flume-env.sh8.按键 i 更改代码如下 export JAVA_HOME/usr/lib/java-1.89.按键Esc按键”:wq!”保存退出。 10.通过ssh命令跳转至slave1机器命令窗口创建日志文件夹再退回到master命令窗口。 ssh slave1mkdir -p /root/flume/logsexit11.通过ssh命令跳转至slave2机器命令窗口创建日志文件夹再退回到master命令窗口。 ssh slave2mkdir -p /root/flume/logsexit12.在当前“主节点”命令窗口中配置slave.conf文件进行配置。 vim /opt/flume/conf/slave.conf13.按键 i 更改代码如下 # 主要作用是监听目录中的新增数据采集到数据之后输出到avro 输出到agent # 注意Flume agent的运行主要就是配置source channel sink # 下面的a1就是agent的代号source叫r1 channel叫c1 sink叫k1 a1.sources r1 a1.sinks k1 a1.channels c1 #具体定义source a1.sources.r1.type spooldir #先创建此目录保证里面空的 a1.sources.r1.spoolDir /root/flume/logs #对于sink的配置描述 使用avro日志做数据的消费 a1.sinks.k1.type avro # hostname是最终传给的主机名称或者ip地址 a1.sinks.k1.hostname master a1.sinks.k1.port 44444 #对于channel的配置描述 使用文件做数据的临时缓存 这种的安全性要高 a1.channels.c1.type file a1.channels.c1.checkpointDir /root/flume/checkpoint a1.channels.c1.dataDirs /root/flume/data #通过channel c1将source r1和sink k1关联起来 a1.sources.r1.channels c1 a1.sinks.k1.channel c114.按键Esc按键”:wq!”保存退出。 15.将flume分发至slave1、slave2机器。 scp -r /opt/flume slave1:/optscp -r /opt/flume slave2:/opt16.配置master.conf文件 vim /opt/flume/conf/master.conf17.按键 i 更改代码如下 # 获取slave1,2上的数据聚合起来传到hdfs上面 # 注意Flume agent的运行主要就是配置source channel sink # 下面的a1就是agent的代号source叫r1 channel叫c1 sink叫k1a1.sources r1 a1.sinks k1 a1.channels c1#对于source的配置描述 监听avro a1.sources.r1.type avro # hostname是最终传给的主机名称或者ip地址 a1.sources.r1.bind master a1.sources.r1.port 44444#定义拦截器为消息添加时间戳 a1.sources.r1.interceptors i1 a1.sources.r1.interceptors.i1.type org.apache.flume.interceptor.TimestampInterceptor$Builder#对于sink的配置描述 传递到hdfs上面 a1.sinks.k1.type hdfs #集群的nameservers名字 #单节点的直接写hdfs://主机名(ip):9000/xxx #ns是hadoop集群名称 # a1.sinks.k1.hdfs.path hdfs://ns/flume/%Y%m%d a1.sinks.k1.hdfs.path /flume/events/root a1.sinks.k1.hdfs.filePrefix events- a1.sinks.k1.hdfs.fileType DataStream #不按照条数生成文件 a1.sinks.k1.hdfs.rollCount 0 #HDFS上的文件达到128M时生成一个文件 a1.sinks.k1.hdfs.rollSize 134217728 #HDFS上的文件达到60秒生成一个文件 a1.sinks.k1.hdfs.rollInterval 60 #对于channel的配置描述 使用内存缓冲区域做数据的临时缓存 a1.channels.c1.type memory a1.channels.c1.capacity 1000 a1.channels.c1.transactionCapacity 100#通过channel c1将source r1和sink k1关联起来 a1.sources.r1.channels c1 a1.sinks.k1.channel c118.按键Esc按键”:wq!”保存退出。 至此Flume集群环境搭建就到此结束了如果本篇文章对你有帮助记得点赞收藏关注~
http://www.pierceye.com/news/686251/

相关文章:

  • 做推广什么网站便宜企业网站管理系统湖南岚鸿
  • 电影下载网站 怎么做flash翻页效果网站模板
  • 社交网站开发语言河北建设工程信息网首页
  • 上海营销型网站建设公司wordpress 自己做页面
  • 网站布局选择临淄信息网手机版
  • 怎样申请网站呢注册商标怎么注册商标
  • 网站地址英文不相关的网站做单项链接可以吗
  • 怎么做网站超链接wordpress 主题 设置
  • 手机电影网站建设如何做网站域名备案
  • 重庆手机网站推广价格网络营销论文参考文献
  • 如何给网站添加搜索关键字做流量网站有收入吗
  • 购物网站的英文如何不让百度收录网站
  • 上海定制网站建设公司哪家好建立公司官网
  • jsp电影网站开发教程滁州网站建设梦天堂
  • 网站建设哪个好一些网站服务器证书有问题
  • 广东省广州市白云区钟落潭镇优化什么建立生育支持政策体系
  • wordpress+代码质量哈尔滨百度seo代理
  • 北京模板网站建设全包中国招标与采购网官网
  • 戴尔公司网站建设成功的关键是什么永久网站
  • 上海青浦做网站做分销网站系统
  • 互联网公司网站建设的目的王烨演员
  • 网站开发图片加载慢如皋建设网站
  • 国家示范校建设成果网站wordpress文章图片alt
  • asp.net网站开发技术物流专线网站建设
  • 免费网站流量统计工具线下推广方法及策略
  • 西安市社交网站制作公司网站建设的参考文献
  • 企业网站内容建设网站开发小程序开发
  • 个人个案网站 类型wordpress群组
  • 微网站建设深圳英文站seo
  • 做网站要钱么网站建设备案多长时间