当前位置: 首页 > news >正文

一个网站做多访问量外贸网站建设行业发展

一个网站做多访问量,外贸网站建设行业发展,哈尔滨做网站的价格,如何注册自己的工作室Spark SQL 数据源 Spark SQL支持读取很多种数据源#xff0c;比如parquet文件#xff0c;json文件#xff0c;文本文件#xff0c;数据库等。下面列出了具体的一些数据源#xff1a; Parquet文件Orc文件Json文件Hive表JDBC 先把people.json导入到hdfs的tmp目录下。peop…Spark SQL 数据源 Spark SQL支持读取很多种数据源比如parquet文件json文件文本文件数据库等。下面列出了具体的一些数据源 Parquet文件Orc文件Json文件Hive表JDBC 先把people.json导入到hdfs的tmp目录下。people.json内容如下 {name:Michael,age:20} {name:Andy, age:30} {name:Justin, age:19}通用的load/save函数 spark提供了通用的load和save函数用于加载和保存数据。支持多种数据格式jsonparquetjdbcorclibsvmcsvtext等。 scala val peopleDF spark.read.format(json).load(hdfs:/tmp/people.json) peopleDF: org.apache.spark.sql.DataFrame [age: bigint, name: string] scala peopleDF.select(name,age).write.format(parquet).save(/tmp/peoplenew.parquet)默认的是parquet可以通过spark.sql.sources.default修改默认配置。 Parquet文件 scala val parquetFileDFspark.read.parquet(hdfs:/tmp/peoplenew.parquet) parquetFileDF: org.apache.spark.sql.DataFrame [name: string, age: bigint] scala peopleDF.write.parquet(/tmp/people.parquet)Orc文件 scala val dfspark.read.json(hdfs:/tmp/people.json) df: org.apache.spark.sql.DataFrame [age: bigint, name: string] scala df.write.mode(append).orc(/tmp/people)在hdfs查看/tmp/people目录 $ hdfs dfs -ls /tmp/people Found 2 items -rw-r--r-- 3 ccpgdev supergroup 0 2019-04-25 17:24 /tmp/people/_SUCCESS -rw-r--r-- 3 ccpgdev supergroup 343 2019-04-25 17:24 /tmp/people/part-00000-3eea0d3e-4349-4cc0-90c7-45c423069284-c000.snappy.orcspark sql 读取orc文件 scala spark.read.orc(/tmp/people).show() ---------- |age| name| ---------- | 20|Michael| | 30| Andy| | 19| Justin| ----------Json文件 scala val dfspark.read.json(hdfs:/tmp/people.json) df: org.apache.spark.sql.DataFrame [age: bigint, name: string] scala df.write.mode(overwrite).json(/tmp/peoplejson/) scala spark.read.json(/tmp/peoplejson/).show() ---------- |age| name| ---------- | 20|Michael| | 30| Andy| | 19| Justin| ---------- $ hdfs dfs -ls /tmp/peoplejson Found 2 items -rw-r--r-- 3 ccpgdev supergroup 0 2019-04-25 17:28 /tmp/peoplejson/_SUCCESS -rw-r--r-- 3 ccpgdev supergroup 80 2019-04-25 17:28 /tmp/peoplejson/part-00000-52a02853-e85b-45eb-ba66-4ab92c3f7142-c000.jsonHive表 Spark 1.6及以前的版本使用hive表需要hivecontext。Spark 2.0开始只需要创建sparksession增加enableHiveSupport()即可。 先在Hive的tmp库下新建一张表tmp_building_num并插入一些数据。 hive create table tmp_building_num(x int); OK Time taken: 0.127 seconds hive insert into tmp_building_num values(1); Query ID ccpgdev_20190425174242_bff1a3ed-b02c-47e7-bb11-8a05eb5c70c1 ...省略日志... Stage-Stage-1: Map: 1 Cumulative CPU: 4.73 sec HDFS Read: 3196 HDFS Write: 78 SUCCESS Total MapReduce CPU Time Spent: 4 seconds 730 msec OK Time taken: 22.339 seconds hive select * from tmp_building_num; OK 1 Time taken: 0.154 seconds, Fetched: 1 row(s) scala import org.apache.spark.sql.SparkSession import org.apache.spark.sql.SparkSession scala val spark SparkSession. | builder(). | enableHiveSupport(). | getOrCreate() 19/04/25 17:38:48 WARN sql.SparkSession$Builder: Using an existing SparkSession; some configuration may not take effect. spark: org.apache.spark.sql.SparkSession org.apache.spark.sql.SparkSession498f1f63 scala spark.sql(select count(1) from tmp.tmp_building_num).show(); -------- |count(1)| -------- | 1 | --------JDBC 数据写入mysql。 scala df.repartition(1).write.mode(append).option(user, root).option(password, password).jdbc(jdbc:mysql://localhost:3306/test,alluxio,new Properties())从mysql里读数据。 scala val fromMysql spark.read.option(user, root).option(password, password).jdbc(jdbc:mysql://localhost:3306/test,alluxio,new Properties())
http://www.pierceye.com/news/346597/

相关文章:

  • 网站建设需要哪些准备wordpress调用单页面跳转
  • 小公司使用的网站开发电子商务毕业设计 网站建设
  • 简单的个人网站模板网站建设费记什么科目
  • 中国建设银行宁波分行网站一般网站空间要多大
  • 做简单视频网站自己看廊坊专门做网站
  • 做贸易网站科技型中小企业服务平台登录
  • 网站怎么接广告赚钱net创建网站之后怎么做
  • 做网站如何让盈利wordpress链接样式表
  • 网站建设与管理计划谷歌浏览器官网下载手机版
  • 做请帖的网站上海阳性增多
  • 有回定ip怎么做网站青岛建设集团招聘信息网站
  • 淘宝内部卷网站怎么做智慧团建网站登录忘记密码
  • 网站建设前十名建站系统cms
  • 第三方网站开发的商家厦门广告公司网站建设
  • 网站建设基础条件临猗网站制作
  • 建设博客网站步骤常州网站建设百科
  • 门户网站 管理系统wordpress 微信图标
  • 广元网站建设广元莱芜论坛二手车
  • 山东省建设工程质量监督网站广州软件合作中心
  • 郑州网站建设怎么样通州建设局网站
  • 免费网站建设福州怎么修改网站主页
  • 深圳企业建站设计公司wordpress不显示样式
  • 外贸网站商城广东省建设协会网站
  • 杭州制作企业公司网站wordpress数据库添加用户
  • 主域名进入网站广告标识标牌制作厂家
  • 网站建设基础流程摘要专题网站建设策划
  • 滁州网站建设电话网站建设与网站优化
  • 慈溪做网站公司哪家好淘宝商城的网站建设
  • 安徽建设厅网站怎么打不开太原网络搭建
  • idea 网站开发最好的免费推广平台