当前位置: 首页 > news >正文

金华外贸网站建设组织建设方面

金华外贸网站建设,组织建设方面,wordpress要装在根目录,快批小程序的收费标准pig是hadoop的一个子项目#xff0c;用于简化MapReduce的开发工作#xff0c;可以用更人性化的脚本方式分析数据。 一、安装 a) 下载 从官网http://pig.apache.org下载最新版本(目前是0.14.0版本)#xff0c;最新版本可以兼容hadop 0.x /1.x / 2.x版本#xff0c;直接解压到…pig是hadoop的一个子项目用于简化MapReduce的开发工作可以用更人性化的脚本方式分析数据。 一、安装 a) 下载 从官网http://pig.apache.org下载最新版本(目前是0.14.0版本)最新版本可以兼容hadop 0.x /1.x / 2.x版本直接解压到某个目录即可。 注下面是几个国内的镜像站点 http://mirrors.cnnic.cn/apache/pig/ http://mirror.bit.edu.cn/apache/pig/ http://mirrors.hust.edu.cn/apache/pig/ 本文的解压目录是/Users/jimmy/app/pig-0.14.0 b) 环境变量 export PIG_HOME/Users/jimmy/app/pig-0.14.0export HADOOP_HOME/Users/jimmy/app/hadoop-2.6.0export PIG_CLASSPATH${HADOOP_HOME}/etc/hadoop/export HADOOP_CONF_DIR${HADOOP_HOME}/etc/hadoop...export PATH${PIG_HOME}/bin:$PATH 至少要配置上面这几项其它项比如JAVA_HOME就不必多说了肯定也是要的。 c) 启动 $PIG_HOME/bin/pig 如果能正常进入grunt 提示符就表示ok了   二、基本HDFS操作 pig的好处之一是简化了HDFS的操作没有pig之前要查看一个hdfs的文件必须$HADOOP_HOME/bin/hdfs dfs -ls /input 打一堆命令而在pig shell交互模式下只需要 ls /input 即可   查看hdfs文件内容 cat /input/duplicate.txt 跟在linux下操作完全一样其它命令留着大家自己去研究吧不熟悉的可以用help查看帮助   三、基本的数据分析 在前面的文章 Hadoop: MapReduce2的几个基本示例 中我们用JAVA编程的方式演示了几个基本例子现在拿pig来实现一把作为对比 a) 求Count grunt a LOAD /input/duplicate.txt AS (value:int); 先将输入文件加载到a中由于输入文件每行只有一个数字最后的AS部分表示创建了一个列名称为value为整型其值就是这个数字的值。 可以用describle a; 查看结构如果要看具体值可以用dump a;   grunt b GROUP a all; 对a进行分组这里由于没有指定分组条件所以相当每一行都是分组组件这一条命令的主要作用是实现行转列执行完以后可以查下b的结构和值   grunt c FOREACH b GENERATE COUNT(a.value); 由于b只有一行了所以上面的语句其实就是求该所有a.value列的个数即输入文件的总数。 原来用MapReduce要写一坨java代码的工作现在用PIG只要3条命令就搞定了。   b) 求最大值(MAX) grunt c FOREACH b GENERATE MAX(a.value);   c) 求平均值(AVG) grunt c FOREACH b GENERATE AVG(a.value);   d) 求和(SUM) grunt c FOREACH b GENERATE SUM(a.value);   e) 去重复(DISTINCT) DISTINCT的思路跟前面略有不同关键在于如何分组见下面的命令 grunt b GROUP a by value;  对a分组分组依据为value值这样重复的值就归到一组了可以用dump b;看下结果 剩下的事情就好办了把b的第一列取出来即可 grunt c FOREACH b GENERATE group; 处理完成用dump c;查看结果 当然对本例而言还有一种更简单的去重方法grunt b DISTINCT a;   f) WordCount 已经有人研究过了就直接拿来用吧见http://blog.itpub.net/26495863/viewspace-1348121/ grunt a LOAD /input/immortals.txt as (line:chararray); //加载输入文件并按行分隔 grunt words FOREACH a GENERATE flatten(TOKENIZE(line)) as w; //将每行分割成单词 grunt g GROUP words by w; //按单词分组 grunt wordcount FOREACH g GENERATE group,COUNT(words);  //单词记数 输出结果 dump wordcount; (I,4) (Of,1) (am,1) (be,3) (do,2) (in,1) (it,1) (of,1) (to,1) (we,3) (But,1) (all,1) (are,2) (bad,1) (but,1) (dog,1) (not,1) (say,1) (the,4) (way,1) (They,1) (best,1) (have,1) (what,1) (will,2) (your,1) (fever,1) (flame,1) (guard,1) (dreams,1) (eternal,1) (watcher,1) (behavior,1)   g) wordcount2(带词频倒排序) 在刚才的示例上修改一下a LOAD /input/immortals.txt as (line:chararray); words FOREACH a GENERATE flatten(TOKENIZE(line)) as w; g GROUP words by w;前面这几行都不用改wordcount FOREACH g GENERATE group,COUNT(words) as count;//给单词数所在列加一个别名countr foreach wordcount generate count,group;//将结果列交换将变成{countword}这种结构 (4,I) (1,Of) (1,am) (3,be) (2,do) (1,in) (1,it) (1,of) (1,to) (3,we) (1,But) (1,all) (2,are) (1,bad) (1,but) (1,dog) (1,not) (1,say) (4,the) (1,way) (1,They) (1,best) (1,have) (1,what) (2,will) (1,your) (1,fever) (1,flame) (1,guard) (1,dreams) (1,eternal) (1,watcher) (1,behavior) g2 group r by count;//按count分组 (1,{(1,behavior),(1,watcher),(1,eternal),(1,dreams),(1,guard),(1,flame),(1,fever),(1,your),(1,what),(1,have),(1,best),(1,They),(1,way),(1,say),(1,not),(1,dog),(1,but),(1,bad),(1,all),(1,But),(1,to),(1,of),(1,it),(1,in),(1,am),(1,Of)}) (2,{(2,will),(2,are),(2,do)}) (3,{(3,we),(3,be)}) (4,{(4,I),(4,the)}) x foreach g2 generate group,r.group;//去掉无用的列 (1,{(behavior),(watcher),(eternal),(dreams),(guard),(flame),(fever),(your),(what),(have),(best),(They),(way),(say),(not),(dog),(but),(bad),(all),(But),(to),(of),(it),(in),(am),(Of)}) (2,{(will),(are),(do)}) (3,{(we),(be)}) (4,{(I),(the)}) y order x by group desc;//按count倒排 (4,{(I),(the)}) (3,{(we),(be)}) (2,{(will),(are),(do)}) (1,{(behavior),(watcher),(eternal),(dreams),(guard),(flame),(fever),(your),(what),(have),(best),(They),(way),(say),(not),(dog),(but),(bad),(all),(But),(to),(of),(it),(in),(am),(Of)}) 最后给二个网友整理的pig用法文章地址 hadoop pig 入门总结 http://blackproof.iteye.com/blog/1791980 pig中各种sql语句的实现 http://www.open-open.com/lib/view/open1385173281604.html
http://www.pierceye.com/news/812008/

相关文章:

  • 秦皇岛网站制作小程序开发wordpress调用分类标签
  • 网站绑定别名好吗台州品牌网站设计
  • 安徽省住房和城乡建设厅网站域名东莞松山湖华为小镇
  • 购物网站开发教程中文版做一个自己的免费网站吗
  • 网站建设网络推广平台湖北省级建设主管部门网站
  • 手机网站建设口碑好google海外版
  • 网站加视频播放设计怎么做的oa系统管理平台
  • 湛江有网站的公司名称秘密入口3秒自动进入
  • 网站建设需要租用什么北京网站设计制作过程
  • 设计高端网站建设电子商务平台的建设步骤
  • 对外网站ipv6建设方案模板网站提交地址
  • 网站优化包括哪些内容哪一个网站做专栏作家好点
  • 网站外包 博客网络广告的优势有哪些
  • 福建网站建设网wordpress批量替换标签
  • 网站建设 海外房产商标注册证查询
  • 门户网站建设要求易申建设网站
  • 现在创业什么行业最好seo全网营销公司
  • 网站 域名 授权服务器 分布式网站模板英文
  • wordpress 二维码插件搜索引擎优化的方法
  • 国外申请域名的网站CC wordpress 攻击
  • 能发外链的网站中国机械加工网加热炉节能
  • 个人网站推广 公司网站地址栏小图标
  • 网站 如何 备案营销型网站建设便宜
  • 从网上怎么做网站营销做算命类网站违法吗?
  • 口碑好的网站开发公司哪家最专业网站优化关键词是怎么做的
  • 一级a做爰片免费网站天天看专业网站建设公司推荐
  • 套模版做的网站好优化吗win10系统优化软件
  • 红酒营销 网站建设网站建设多少钱一年
  • 公众号注册入口官网seo排名的影响因素有哪些
  • 化妆品网站素材wordpress广告插件中文