当前位置: 首页 > news >正文

网站变灰色 htmlui设计做网站

网站变灰色 html,ui设计做网站,网站建设的面试要求,上传下载文件网站开发的php源码这里写目录标题 01HDFS02Yarn03Hive04HBase1#xff0e;特点2#xff0e;存储 05Spark及Spark Streaming关于作者#xff1a;推荐理由#xff1a;作者直播推荐#xff1a; 一篇讲明白 Hadoop 生态的三大部件 进入大数据阶段就意味着进入NoSQL阶段#xff0c;更多的是面向… 这里写目录标题 01HDFS02Yarn03Hive04HBase1特点2存储 05Spark及Spark Streaming关于作者推荐理由作者直播推荐 一篇讲明白 Hadoop 生态的三大部件 进入大数据阶段就意味着进入NoSQL阶段更多的是面向OLAP场景即数据仓库、BI应用等。 大数据技术的发展并不是偶然的它的背后是对于成本的考量。集中式数据库或者基于MPP架构的分布数据库往往采用的都是性能稳定但价格较为昂贵的小型机、一体机或者P C服务器等扩展性相对较差而大数据计算框架可以基于价格低廉的普通的硬件服务器构建并且理论上支持无限扩展以支撑应用服务。 在大数据领域中最有名的就是 Hadoop 生态总体来看它主要由三部分构成底层文件存储系统 HDFSHadoop Distributed File SystemHadoop 分布式文件系统、资源调度计算框架 YarnYet Another Resource Negotiator又一个资源协调者以及基于 HDFS 与 Yarn的上层应用组件例如 HBase、Hive 等。一个典型的基于 Hadoop 的应用如下图所示。 一个典型的 Hadoop 应用 01HDFS HDFS 被设计成适合运行在通用硬件Commodity Hardware上的分布式文件系统。它和现有的分布式文件系统有很多共同点例如典型的 Master-Slave 架构这里不准备展开介绍也有不同点HDFS 是一个具有高度容错性的系统适合部署在廉价的机器上。关于HDFS 这里主要想说两点默认副本数的设置以及机架感知Rack Awareness。 HDFS 默认副本数是 3这是因为 Hadoop 有着高度的容错性从数据冗余以及分布的角度来看需要在同一机房不同机柜以及跨数据中心进行数据存储以保证数据最大可用。因此为了达到上述目的数据块需要至少存放在同一机房的不同机架2 份以及跨数据中心的某一机架1 份中共 3 份数据。 机架感知的目的是在计算中尽量让不同节点之间的通信能够发生在同一个机架之 内而不是跨机架进而减少分布式计算中数据在不同的网络之间的传输减少网络带 宽资源的消耗。例如当集群发生数据读取的时候客户端按照由近到远的优先次序决定 哪个数据节点向客户端发送数据因为在分布式框架中网络 I/O 已经成为主要的性能瓶颈。 只有深刻理解了这两点才能理解为什么 Hadoop 有着高度的容错性。高度容错性是Hadoop 可以在通用硬件上运行的基础。 02Yarn Yarn 是继 Common、HDFS、MapReduce 之 后 Hadoop 的又一个子项目 它是在MapReduceV2 中提出的。 在 Hadoop1.0 中JobTracker 由资源管理器由 TaskScheduler 模块实现和作业控制 由 JobTracker 中多个模块共同实现两部分组成。 在 Hadoop1.0 中JobTracker 没有将资源管理相关功能与应用程序相关功能拆分开逐 渐成为集群的瓶颈进而导致集群出现可扩展性变差、资源利用率下降以及多框架支持不 足等多方面的问题。 在 MapReduceV2 中Yarn 负责管理 MapReduce 中的资源内存、CPU 等并且将其 打包成 Container。这样可以使 MapReduce 专注于它擅长的数据处理任务而不需要考虑资源调度。这种松耦合的架构方式实现了 Hadoop 整体框架的灵活性。 03Hive Hive 是基于Hadoop 的数据仓库基础构架它利用简单的 SQL 语句简称 HQL来查询、分析存储在 HDFS 中的数据并把 SQL 语句转换成 MapReduce 程序来进行数据的处理。Hive与传统的关系型数据库的主要区别体现在以下几点。 1存储的位置 Hive 的数据存储在 HDFS 或者 HBase 中而后者的数据一般存储在裸设备或者本地的文件系统中由于 Hive 是基于 HDFS 构建的那么依赖 HDFS 的容错特性Hive 中的数据表天然具有冗余的特点。 2数据库更新 Hive 是不支持更新的一般是一次写入多次读写这部分从 Hive 0.14之后开始支持事务操作但是约束比较多但是由于 Hive 是基于 HDFS 作为底层存储的 而 HDFS 的读写不支持事务特性因此 Hive 的事务支持必然需要拆分数据文件以及日志文 件才能支持事务的特性。 3执行 SQL 的延迟Hive 的延迟相对较高因为每次执行都需要将 SQL 语句解析成MapReduce 程序。 4数据的规模上Hive 一般是 TB 级别而后者规模相对较小。 5可扩展性上Hive 支持 UDF、UDAF、UDTF后者相对来说可扩展性较差。 04HBase HBaseHadoop Database是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。它底层的文件系统使用 HDFS 使用ZooKeeper 来管理集群的 HMaster 和各RegionServer 之间的通信监控各RegionServer 的状态存储各 Region 的入口地址等。 1特点 HBase 是 Key-Value 形式的数据库类比 Java 中的 Map。既然是数据库那肯定就有 表HBase 中的表大概有以下几个特点。 1大一个表可以有上亿行上百万列列多时插入变慢。 2面向列面向列族的存储和权限控制列族独立检索。 3稀疏对于空null的列并不占用存储空间因此表可以设计得非常稀疏。 4每个单元格中的数据可以有多个版本默认情况下版本号自动分配是单元格插入 时的时间戳。 5HBase 中的数据都是字节没有类型定义具体的数据对象因为系统需要适应不同 类型的数据格式和数据源不能预先严格定义模式。 这里需要注意的是HBase 也是基于 HDFS所以也具有默认 3 个副本、数据冗余的特 点。此外 HBase 也是利用 WAL 的特点来保证数据读写的一致性。 2存储 HBase 采用列式存储方式进行数据的存储。传统的关系型数据库主要是采用行式存储 的方式进行数据的存储数据读取的特点是按照行的粒度从磁盘上读取数据记录然后根 据实际需要的字段数据进行处理如果表的字段数量较多但是需要处理的字段较少特 别是聚合场景由于行式存储的底层原理仍然需要以行全字段的方式进行数据的查 询。在这个过程中应用程序所产生的磁盘 I/O、内存要求以及网络 I/O 等都会造成一定的 浪费而列式存储的数据读取方式主要是按照列的粒度进行数据的读取这种按需读取的 方式减少了应用程序在数据查询时所产生的磁盘 I/O、内存要求以及网络 I/O。 此外由于相同类型的数据被统一存储因此在数据压缩的过程中压缩算法的选用以 及效率将会进一步加强这也进一步降低了分布式计算中对于资源的要求。 列式存储的方式更适合 OLAP 型的应用场景因为这类场景具有数据量较大以及查询字段较少往往都是聚合类函数的特点。例如最近比较火的 ClickHouse 也是使用列式存储的方式进行数据的存储。 05Spark及Spark Streaming Spark 由 Twitter 公司开发并开源解决了海量数据流式分析的问题。Spark 首先将数据 导入 Spark 集群然后通过基于内存的管理方式对数据进行快速扫描通过迭代算法实现 全局 I/O 操作的最小化达到提升整体处理性能的目的。这与 Hadoop 从“计算”找“数据” 的实现思路是类似的通常适用于一次写入多次查询分析的场景。 Spark Streaming 是基于 Spark 的一个流式计算框架它针对实时数据进行处理和控制 并可以将计算之后的结果写入 HDFS。它与当下比较火的实时计算框架 Flink 类似但是二者在本质上是有区别的因为 Spark Streaming 是基于微批量Micro-Batch的方式进行数据处理而非一行一行地进行数据处理。 关于作者 李杨资深数据架构师在数据相关领域有10年以上工作经验。头部保险资管公司科技平台交易系统团队开发组负责人负责多个应用以及数据平台的建设、优化以及迁移工作。曾担任某数据公司技术合伙人负责多个金融机构的数据仓库或数据平台相关的工作。《企业级数据架构核心要素、架构模型、数据管理与平台搭建》作者。 推荐理由 一部从企业架构视角系统讲解企业级数据架构的著作系统梳理和阐述了企业架构的基础知识以及数据架构的组成要素、架构模型、数据治理和数据资产管理的理论知识。 作者直播推荐
http://www.pierceye.com/news/205859/

相关文章:

  • 精通网站建设 全能建站密码pdf电商网站设计理念
  • 百度推广建设网站是不是合发手机网站的必要性
  • 企业网站建设是什么实现的物质基础和技术支撑现货交易平台代理
  • 网站建设的描述长沙发布app
  • 好的设计作品网站代理网站建设
  • 做网站的软件m开头网站建设公司问候语
  • 做网站需要工商证吗app软件开发价格
  • 做足球原创短视频网站网站建设永远在路上
  • 做seo为什么要了解网站苏州做网站公司
  • 这几年做哪些网站能致富网站开发账务处理
  • 网站的版权信息做阿里巴巴网站卖货咋样
  • 找项目去哪个网站成都哪里有做网站的公司
  • 网站推广的方法及特点国外专门做童装的网站
  • 企业网站开发模型图wordpress 侧边导航
  • 济南网站系统优化网站建设属于什么专业
  • 114啦建站程序页面效果好的网站
  • 龙华网站建设-信科网络电子商务网站建设和技术现状
  • 网站备案有效期wordpress 评论图片
  • 搭建网站需要哪些步骤wordpress 主题使用
  • 网站怎么发布做微商天眼官方网站
  • qq群网站制作异常网站服务器失去响应
  • aspnet网站开发模板紫光华宇拼音输入法官方下载
  • 东莞网站设计价格wordpress的配置dns
  • 韶关网站建设公司电子商务网站建设考试重点
  • 网站左侧 导航小红书广告投放平台
  • 资阳住房和城乡建设厅网站重庆建设网站建站
  • 网站制作厂家电话多少女生学网络工程难吗
  • 网站建设要经历哪些步骤?网站建设岗位周计划
  • 贵阳网站制作工具福步外贸论坛网首页
  • 网站大全app下载任务发布平台