当前位置: 首页 > news >正文

知名网站设计服务商时尚类网站设计公司

知名网站设计服务商,时尚类网站设计公司,互联网营销师是什么,wordpress 移动端主题目录 一、实验目的二、实验平台三、实验内容1.spark-shell 交互式编程2.编写独立应用程序实现数据去重3.编写独立应用程序实现求平均值问题 一、实验目的 1、熟悉 Spark 的 RDD 基本操作及键值对操作#xff1b; 2、熟悉使用 RDD 编程解决实际具体问题的方法 二、实验平台 … 目录 一、实验目的二、实验平台三、实验内容1.spark-shell 交互式编程2.编写独立应用程序实现数据去重3.编写独立应用程序实现求平均值问题 一、实验目的 1、熟悉 Spark 的 RDD 基本操作及键值对操作 2、熟悉使用 RDD 编程解决实际具体问题的方法 二、实验平台 1、Scala 版本为 2.11.8。 2、操作系统linux推荐使用Ubuntu16.04。 3、Jdk版本1.7或以上版本。 三、实验内容 1.spark-shell 交互式编程 请到本教程官网的“下载专区”的“数据集”中下载 chapter5-data1.txt该数据集包含了某大学计算机系的成绩数据格式如下所示 Tom,DataBase,80 Tom,Algorithm,50 Tom,DataStructure,60 Jim,DataBase,90 Jim,Algorithm,60 Jim,DataStructure,80 …… 请根据给定的实验数据在 spark-shell 中通过编程来计算以下内容 1该系总共有多少学生 val lines sc.textFile(file:///usr/local/spark/mycode/rdd/data.txt) val par lines.map(rowrow.split(,)(0)) val distinct_par par.distinct() distinct_par.count2该系共开设来多少门课程 代码如下 val lines sc.textFile(file:///usr/local/spark/mycode/rdd/data.txt) val par lines.map(rowrow.split(,)(1)) val distinct_par par.distinct() distinct_par.count3Tom 同学的总成绩平均分是多少 代码如下 val lines sc.textFile(file:///usr/local/spark/mycode/rdd/data.txt) val pare lines.filter(rowrow.split(,)(0)Tom) pare.foreach(println) pare.map(row(row.split(,)(0),row.split(,)(2).toInt)).mapValues(x(x,1)).reduceByKey((x,y ) (x._1y._1,x._2 y._2)).mapValues(x (x._1 / x._2)).collect()4求每名同学的选修的课程门数 代码如下 val lines sc.textFile(file:///usr/local/spark/mycode/rdd/data.txt) val pare lines.map(row(row.split(,)(0),row.split(,)(1))) pare.mapValues(x (x,1)).reduceByKey((x,y) ( ,x._2 y._2)).mapValues(x x._2).foreach(println)5该系 DataBase 课程共有多少人选修 代码如下 val lines sc.textFile(file:///usr/local/spark/mycode/rdd/data.txt) val pare lines.filter(rowrow.split(,)(1)DataBase) pare.count 6各门课程的平均分是多少 代码如下 val lines sc.textFile(file:///usr/local/spark/mycode/rdd/data.txt) val pare lines.map(row(row.split(,)(1),row.split(,)(2).toInt)) pare.mapValues(x(x,1)).reduceByKey((x,y) (x._1y._1,x._2 y._2)).mapValues(x (x._1 / x._2)).collect() 7使用累加器计算共有多少人选了 DataBase 这门课。 代码如下 val lines sc.textFile(file:///usr/local/spark/mycode/rdd/data.txt) val pare lines.filter(rowrow.split(,)(1)DataBase).map(row(row.split(,)(1),1)) val accum sc.longAccumulator(My Accumulator) pare.values.foreach(x accum.add(x)) accum.value 2.编写独立应用程序实现数据去重 对于两个输入文件 A 和 B编写 Spark 独立应用程序对两个文件进行合并并剔除其 中重复的内容得到一个新文件 C。下面是输入文件和输出文件的一个样例供参考。 输入文件 A 的样例如下 20170101 x 20170102 y 20170103 x 20170104 y 20170105 z 20170106 z 输入文件 B 的样例如下 20170101 y 20170102 y 20170103 x 20170104 z 20170105 y 根据输入的文件 A 和 B 合并得到的输出文件 C 的样例如下 20170101 x 20170101 y 20170102 y 20170103 x 20170104 y 20170104 z 20170105 y 20170105 z 20170106 z sacla代码 import org.apache.spark.SparkContext import org.apache.spark.SparkContext._ import org.apache.spark.SparkConf import org.apache.spark.HashPartitioner object task1 {def main(args: Array[String]) {val conf new SparkConf().setAppName(task2_1)val sc new SparkContext(conf)val dataFile file:///home/hadoop/input1/A.txt,file:///home/hadoop/input1/B.txt val res sc.textFile(dataFile,2) .filter(_.trim().length0).map(line(line.trim,)).partitionBy(new HashPartitioner(1)).groupByKey().sortByKey().keys res.saveAsTextFile(file:///home/hadoop/output1/result) } }simple.sbt代码 name : RemDup version : 1.0 scalaVersion : 2.11.8 libraryDependencies org.apache.spark %% spark-core % 2.1.03.编写独立应用程序实现求平均值问题 每个输入文件表示班级学生某个学科的成绩每行内容由两个字段组成第一个是学生 名字第二个是学生的成绩编写 Spark 独立应用程序求出所有学生的平均成绩并输出到 一个新文件中。下面是输入文件和输出文件的一个样例供参考。 Algorithm 成绩 小明 92 小红 87 小新 82 小丽 90 Database 成绩 小明 95 小红 81 小新 89 小丽 85 Python 成绩 小明 82 小红 83 小新 94 小丽 91 平均成绩如下 (小红,83.67) (小新,88.33) (小明,89.67) (小丽,88.67) sacla代码 import org.apache.spark.SparkConf import org.apache.spark.HashPartitioner import org.apache.spark.SparkContext import org.apache.spark.SparkContext._ object task2 {def main(args: Array[String]) {val conf new SparkConf().setAppName(AvgScore)val sc new SparkContext(conf)val dataFile file:///home/hadoop/input1/Algorithm.txt,file:///home/hadoop/input1/Database.txt,file:///home/hadoop/input1/Python.txt val data sc.textFile(dataFile,3)val res data.filter(_.trim().length0).map(line(line.split( )(0).trim(),line.split( )(1).trim().toInt)).partitionBy(new HashPartitioner(1)).groupByKey().map(x {var n 0var sum 0.0for(i - x._2){sum sum in n 1}val avg sum/nval formattedAvg f$avg%1.2f.toDouble(x._1, formattedAvg)})res.saveAsTextFile(file:///home/hadoop/output2/result) } }simple.sbt代码 name : Simple Project version : 1.0 scalaVersion : 2.11.8 libraryDependencies org.apache.spark %% spark-core % 2.1.0
http://www.pierceye.com/news/2376/

相关文章:

  • 微网站自己怎么做4399网页版入口
  • 用dw可以做网站吗怎样与其它网站做友情链接
  • 建购物网站怎么建呀百度网盘登录
  • 网站建设公司广州wordpress调用阅读最多的
  • 南山专业做网站公司备案网站名称 怎么填写
  • 建筑工程类招聘网站哈尔滨网站建设团队
  • 长沙专业外贸建站公司网站建设最新技术及发展趋势
  • 网站一天要发多少外链婚纱摄影网页模板
  • 网站说服力-营销型网站策划积分动力wordpress插件
  • 湖南网站建设公司 要上磐石网络网站建设只有一个空间吗
  • 支付宝 收费 网站开发连云港建设部网站
  • 蚌埠公司做网站wordpress装饰
  • 科技部网站建设合同企业做网站需要什么手续吗
  • 做个简单的网站如何查看网站域名
  • 晋中做网站的公司广东队对阵广州队
  • 郑州经济技术开发区属于哪个区优化方案模板
  • 如何从建设局网站上更换职称人员网站收录排名
  • 蚌埠网站设计wordpress说有图片居中对齐
  • seo站内优化站外优化制造业网站开发
  • 做效果图的网站有哪些饲料网站建设 中企动力
  • 网站建设公司薪酬跨境电商怎么做如何从零开始
  • 网站定制页面调整至居中广告设计图片大全模板
  • 广东网站设计专业团队深圳网站 建设信科网络
  • 儿童教育网站怎么做有趣oa办公系统网页版官网
  • 广州智能建站有没有免费查企业信息的软件
  • 永久网站建设wordpress添加地图
  • 京东不让卖网站制作么制作网站公司选 择乐云seo专家
  • 整站网站优化费用wordpress 新特性
  • 网站收索流量饰品做国际贸易哪些网站
  • 网站技术开发软件源码成品资源下载网站