域名注册网站建设方案,网站建设一般多少钱,织梦网站下载地址,手机网站界面设计第1章HBase简介 
1.1HBase定义 
HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。 1.2HBase数据模型 
逻辑上#xff0c;HBase的数据模型同关系型数据库很类似#xff0c;数据存储在一张表中#xff0c;有行有列。但从HBase的底层物理存储结构#xff08;K-VHBase的数据模型同关系型数据库很类似数据存储在一张表中有行有列。但从HBase的底层物理存储结构K-V来看HBase更像是一个multi-dimensionalmap。 1.2.1HBase逻辑结构 
字典序按位比较。 
下图是一张表但是一张表往往会被切分开来分配在不同区域。 1.2.2HBase物理存储结构 
该数据结构是对上图的store的一个详解 1.2.3数据模型 1NameSpace 命名空间类似于关系型数据库的DatabBase(数据库)概念每个命名空间下有多个表。HBase有两个自带的命名空间分别是hbase和defaulthbase中存放的是HBase内置的表default表是用户默认使用的命名空间。 2Region 类似于关系型数据库的表概念。不同的是HBase定义表时只需要声明列族即可不需要声明具体的列。这意味着往HBase写入数据时字段可以动态、按需指定。因此和关系型数据库相比HBase能够轻松应对字段变更的场景。 3Row HBase表中的每行数据都由一个RowKey和多个Column列组成数据是按照RowKey的字典顺序存储的并且查询数据时只能根据RowKey进行检索所以RowKey的设计十分重要。 4Column HBase中的每个列都由ColumnFamily(列族)和ColumnQualifier列限定符进行限定例如infonameinfoage。建表时只需指明列族而列限定符无需预先定义。 5TimeStamp 用于标识数据的不同版本version每条数据写入时如果不指定时间戳系统会自动为其加上该字段其值为写入HBase的时间。 6Cell 由{rowkey,columnFamilycolumnQualifier,timeStamp}唯一确定的单元。cell中的数据是没有类型的全部是字节码形式存贮。 1.3HBase基本架构 
不完整版 架构角色 1RegionServer RegionServer为Region的管理者其实现类为HRegionServer主要作用如下:对于数据的操作get,put,delete对于Region的操作splitRegion、compactRegion。 2Master Master是所有RegionServer的管理者其实现类为HMaster主要作用如下对于表的操作create,delete,alter对于RegionServer的操作分配regions到每个RegionServer监控每个RegionServer的状态负载均衡和故障转移。 3Zookeeper HBase通过Zookeeper来做Master的高可用、RegionServer的监控、元数据的入口以及集群配置的维护等工作。 4HDFS HDFS为HBase提供最终的底层数据存储服务同时为HBase提供高可用的支持。