当前位置: 首页 > news >正文

全国建设网站网站开发实训小结

全国建设网站,网站开发实训小结,云龙徐州网站开发,安卓开发前景如何1. MapReduce Architecture MapReduce是一套可编程的框架#xff0c;大部分MapReduce的工作都能够用Pig或者Hive完毕。可是还是要了解MapReduce本身是怎样工作的#xff0c;由于这才是Hadoop的核心#xff0c;而且能够为以后优化和自己写做准备。 Job Client, 就是用户 Job … 1. MapReduce Architecture MapReduce是一套可编程的框架大部分MapReduce的工作都能够用Pig或者Hive完毕。可是还是要了解MapReduce本身是怎样工作的由于这才是Hadoop的核心而且能够为以后优化和自己写做准备。   Job Client, 就是用户 Job Tracker和Task Tracker也是一种Master - Slave构建   工作流程MapReduce Pipeline   Job Client提交了MapReduce的程序比方jar包中的二进制文件。所须要的数据结果输出位置提交给Job Tracker. Job Tracker会首先询问Name Node, 所须要的数据都在哪些block里面然后就近选择一个Task Tracker(离这些所需数据近期的一个task tracker,可能是在同一个Node上或者同一个Rack上或者不同rack上)把这个任务发送给该Task Tracker Task Tracker来真正运行该任务。Task Tracker内部有Task Slots来真正运行这些任务。假设运行失败了。Task Tracker就好汇报给Job Tracker Job Tracker就再分配给别的Task Tracker来运行。Task Tracker在运行过程中要不断的向Job Tracker汇报。最后Task Tracker运行完毕后汇报给Job Tracker。Job Tracker就更新任务状态为成功。   注意当用户提交一个MapReduce任务的时候不只同一时候把任务提交给Job Tracker同一时候还会拷贝一份到HDFS的一个公共位置图中的咖啡位置由于传递代码和命令相对要easy一些。然后Task Tracker就能够非常方便的得到这些代码。   详细步骤就是图中的7步。 2. MapReduce Internals   Split阶段依据Input Format。把输入数据切割成小部分该阶段与Map任务同一时候运行切割后就放到不同的Mapper里面。 Input Format: 决定了数据怎样被切割放入Mapper。比方Log, 数据库二进制码等。 Map阶段把切割后传入的splits转化成一些key-value对。怎样转化取决于用户代码怎么写的。 Shuffle  Sort阶段把Map阶段得到的数据归类然后送给Reducers。 Reduce阶段把送入的Map数据Key, Value依照用户的代码进行整合处理。 Output Format: Reduce阶段处理完后。结果依照此格式放入HDFS的输出文件夹。   Imperative Programming Paradigm: 把计算当做一系列改变程序状态的过程。也就是程序化编程。更加关注对象和状态。   Functional Programming Paradigm: 大致就是函数化编程把一系列计算作为一个数学函数。Hadoop使用的是这样的编程范式。有输入有输出没有对象没有状态。   为了优化起见Hadoop还加入了很多其它的一个接口combine阶段见下图。主要是在输送到Shuffle/sort阶段前。如今本地进行一次小的Reduce计算。这样能够省非常多带宽还记得job的代码放入一个公共区域了吗 上面的整个过程看上去可能不那么直观可是这是Hadoop最难理解的部分了。理解了这个流程Hadoop Pipeline就更easy理解以后的内容了。   3. MapReduce Example   举样例来说明在实际的机器操作中Hadoop怎样完毕上述任务。   在Windows环境下安装了一个hyperV软件。里面有四个Hadoop节点。每一个Hadoop节点都是一个Ubuntu环境。 能够看到上面有一个Name Node,还有三个Data Node。 首先连接上Name Node。而且打开一个Data Node节点。进入Name Node的Ubuntu系统中。打开一个终端。输入jps能够看到jvm里面正在运行的东西。 在Data Node机器中运行相同命令能够看到里面运行着DataNode, Jps, TaskTracker三个内容。   首先进入Data Node的机器里面。到根文件夹以下创建一个文件叫words.txt文件内容就是上图中要分析的一些词。 第二步。把这个Words.txt文件放入HDFS中。 首先 hadoop/bin/hadoop fs -ls  查看眼下HDFS中的文件 然后新建一个文件夹 Hadoop/bin/hadoop fs -mkdir /data 我们能够使用浏览器来看看HDFS中的文件系统 浏览器中输入hnname:50070打开Web UI 能够再Live Nodes里面看到刚刚新建的data文件夹。运行 hadoop/bin/hadoop fs -copyFromLocal words.txt /data 然后words.txt就复制到/data文件夹下了。能够使用Web UI来验证。   第三步运行MapReduce 任务。这个任务是统计单词频率这个任务已经由现成的jar包写好了在hadoop/bin/文件夹下hadoop-examples-1.2.0.jar. 这个文件中面有非常多非常多写好的MapReduce任务。 运行命令 Hadoop/bin/hadoop jar hadoop/hadoop*examples.jar wordcount /data/words.txt /data/results   先指定jar包再指定程序名wordcount, 再指定输入数据/data/words.txt 最后是输出文件夹/data/results 没有文件夹会创建一个。 运行完毕后。能够通过Web UI来看运行结果。 我擦。原来的图片太多了发不了。不得不说删掉几张。。。。 转载于:https://www.cnblogs.com/ldxsuanfa/p/9941414.html
http://www.pierceye.com/news/806948/

相关文章:

  • 浙江省的网站建设公司有哪些代理注册公司一般多少钱
  • 如何在建设银行网站预约纪念币东莞网站建设服务有什
  • 有哪些可以做h5的网站代理网址上境外网
  • 做网站所需要的代码6红杏直播
  • 南通制作网站wordpress移动版设置
  • 哪个网站有免费ppt下载建筑类网站的推荐理由
  • 视觉差的网站公司外包
  • 基础做网站内蒙住房和城乡建设部网站
  • 发帖效果好的网站展馆展示设计公司排名
  • 童装网站建设文案什么网站做的号
  • 能打开的a站莆田网站建设建站系统
  • 上海市城乡建设管理局网站一个月做网站
  • 网站后台管理系统 aspwordpress拖拽上传
  • 华为手机官方网站登录爬虫做视频网站
  • 山东省工程建设信息官方网站河南网站seo推广
  • 低成本做网站 白之家重庆市建设执业资格注册管理中心网站
  • 电子商务网站建设需求在别的公司做的网站可以转走吗
  • 网站流量怎么做乡1万做网站需要几个人
  • 阿里云centos7做网站怀化网站seo
  • 我做的网站怎样被百度收录易语言 做网站mysql
  • 花店网站模板免费下载9个做简历的网站
  • 东港区网站制作seo推广模式是什么
  • 用织梦做网站能练技术吗广州专业网络推广公司
  • 下载ppt模板免费的网站在线做头像网站
  • 网络推广怎么免费做网站内部优化的方法
  • 沧州wap网站制作哈尔滨建设网证件查询
  • 一键查询注册过的网站快速排名教程
  • 响应式模板网站泰安招聘信息最新招聘2021
  • 信阳市住房和城乡建设厅网站wordpress加载速度
  • 建设本地网站 配置iis百度h5在线制作免费