免费服装网站模板,江宁网站建设制作,wordpress获取文章信息,建立网站目的2019独角兽企业重金招聘Python工程师标准数据库相关的表DBS该表存储Hive中所有数据库的基本信息#xff0c;字段如下#xff1a;元数据表字段说明示例数据DB_ID数据库ID2DESC数据库描述测试库DB_LOCATION_URI数据库HDFS路径hdfs://namenode/user/hive/warehouse/…2019独角兽企业重金招聘Python工程师标准数据库相关的表DBS该表存储Hive中所有数据库的基本信息字段如下元数据表字段说明示例数据DB_ID数据库ID2DESC数据库描述测试库DB_LOCATION_URI数据库HDFS路径hdfs://namenode/user/hive/warehouse/lxw1234.dbNAME数据库名lxw1234OWNER_NAME数据库所有者用户名lxw1234OWNER_TYPE所有者角色USERDATABASE_PARAMS该表存储数据库的相关参数在CREATE DATABASE时候用WITH DBPROPERTIES (property_nameproperty_value, …)指定的参数。元数据表字段说明示例数据DB_ID数据库ID2PARAM_KEY参数名createdbyPARAM_VALUE参数值lxw1234DBS和DATABASE_PARAMS这两张表通过DB_ID字段关联。表相关的表TBLS该表中存储Hive表、视图、索引表的基本信息。元数据表字段说明示例数据TBL_ID表ID1CREATE_TIME创建时间1436317071DB_ID数据库ID2对应DBS中的DB_IDLAST_ACCESS_TIME上次访问时间1436317071OWNER所有者liuxiaowenRETENTION保留字段0SD_ID序列化配置信息86对应SDS表中的SD_IDTBL_NAME表名lxw1234TBL_TYPE表类型MANAGED_TABLE、EXTERNAL_TABLE、INDEX_TABLE、VIRTUAL_VIEWVIEW_EXPANDED_TEXT视图的详细HQL语句select lxw1234.pt, lxw1234.pcid from liuxiaowen.lxw1234VIEW_ORIGINAL_TEXT视图的原始HQL语句select * from lxw1234TABLE_PARAMS该表存储表/视图的属性信息。元数据表字段说明示例数据TBL_ID表ID1PARAM_KEY属性名totalSize、numRows、EXTERNALPARAM_VALUE属性值970107336、21231028、TRUETBL_PRIVS该表存储表/视图的授权信息元数据表字段说明示例数据TBL_GRANT_ID授权ID1CREATE_TIME授权时间1436320455GRANT_OPTION0GRANTOR授权执行用户liuxiaowenGRANTOR_TYPE授权者类型USERPRINCIPAL_NAME被授权用户usernamePRINCIPAL_TYPE被授权用户类型USERTBL_PRIV权限Select、AlterTBL_ID表ID22对应TBLS表中的TBL_ID存储相关的元数据表SDS该表保存文件存储的基本信息如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。TBLS表中的SD_ID与该表关联可以获取Hive表的存储信息。元数据表字段说明示例数据SD_ID存储信息ID1CD_ID字段信息ID21对应CDS表INPUT_FORMAT文件输入格式org.apache.hadoop.mapred.TextInputFormatIS_COMPRESSED是否压缩0IS_STOREDASSUBDIRECTORIES是否以子目录存储0LOCATIONHDFS路径hdfs://namenode/hivedata/warehouse/ut.db/t_lxwNUM_BUCKETS分桶数量5OUTPUT_FORMAT文件输出格式org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormatSERDE_ID序列化类ID3对应SERDES表SD_PARAMS该表存储Hive存储的属性信息在创建表时候使用STORED BY ‘storage.handler.class.name’ [WITH SERDEPROPERTIES (…)指定。元数据表字段说明示例数据SD_ID存储配置ID1PARAM_KEY存储属性名PARAM_VALUE存储属性值SERDES该表存储序列化使用的类信息元数据表字段说明示例数据SERDE_ID序列化类配置ID1NAME序列化类别名SLIB序列化类org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDeSERDE_PARAMS该表存储序列化的一些属性、格式信息,比如行、列分隔符元数据表字段说明示例数据SERDE_ID序列化类配置ID1PARAM_KEY属性名field.delimPARAM_VALUE属性值,表字段相关的元数据表PARTITIONS该表存储表分区的基本信息。元数据表字段说明示例数据PART_ID分区ID1CREATE_TIME分区创建时间LAST_ACCESS_TIME最后一次访问时间PART_NAME分区名pt2015-06-12SD_ID分区存储ID21TBL_ID表ID2PARTITION_KEYS该表存储分区的字段信息。元数据表字段说明示例数据TBL_ID表ID2PKEY_COMMENT分区字段说明PKEY_NAME分区字段名ptPKEY_TYPE分区字段类型stringINTEGER_IDX分区字段顺序1PARTITION_KEY_VALS该表存储分区字段值。元数据表字段说明示例数据PART_ID分区ID2PART_KEY_VAL分区字段值2015-06-12INTEGER_IDX分区字段值顺序0PARTITION_PARAMS该表存储分区的属性信息。元数据表字段说明示例数据PART_ID分区ID2PARAM_KEY分区属性名numFiles、numRowsPARAM_VALUE分区属性值15、502195示例建表语句CREATE TABLE lxw1234 (cookieid STRING,url STRING,ua STRING,ip STRING,createtime STRING)COMMENT This is the page view tablepartitioned BY (day STRING,site STRING)ROW FORMAT DELIMITEDFIELDS TERMINATED BY ,stored AS ORC;建表执行之后元数据中以下表的数据会有所变化TBLS生成了表lxw1234的基本信息SELECT * FROM TBLS WHERE TBL_NAME ‘lxw1234’;元数据表字段数据TBL_ID41509CREATE_TIME1436324659DB_ID11LAST_ACCESS_TIME0OWNERliuxiaowenRETENTION0SD_ID91740TBL_NAMElxw1234TBL_TYPEMANAGED_TABLEVIEW_EXPANDED_TEXTNULLVIEW_ORIGINAL_TEXTNULLTABLE_PARAMSselect * from TABLE_PARAMS WHERE TBL_ID41509TBL_IDPARAM_KEYPARAM_VALUE41509commentThis is the page view table41509transient_lastDdlTime1436324659SDSSELECT * FROM SDS WHERE SD_ID 91740元数据表字段数据SD_ID91740CD_ID41564INPUT_FORMATorg.apache.hadoop.hive.ql.io.orc.OrcInputFormatIS_COMPRESSED0IS_STOREDASSUBDIRECTORIES0LOCATIONhdfs://namenode/hivedata/warehouse/liuxiaowen.db/lxw1234NUM_BUCKETS-1OUTPUT_FORMATorg.apache.hadoop.hive.ql.io.orc.OrcOutputFormatSERDE_ID91740SERDESselect * from SERDES WHERE SERDE_ID 91740元数据表字段数据SERDE_ID91740NAMESLIBorg.apache.hadoop.hive.ql.io.orc.OrcSerdeSERDE_PARAMSselect * from SERDE_PARAMS WHERE SERDE_ID91740SERDE_IDPARAM_KEYPARAM_VALUE91740field.delim,91740serialization.format,COLUMNS_V2select * from COLUMNS_V2 WHERE CD_ID41564 ORDER BY INTEGER_IDXCD_IDCOMMENTCOLUMN_NAMETYPE_NAMEINTEGER_IDX41564cookieidstring041564urlstring141564uastring241564ipstring341564createtimestring4PARTITION_KEYSselect * from PARTITION_KEYS WHERE TBL_ID41509TBL_IDPKEY_COMMENTPKEY_NAMEPKEY_TYPEINTEGER_IDX41509daystring041509sitestring1再插入数据INSERT OVERWRITE TABLE lxw1234 PARTITION (day 2015-07-08, site lxw1234.com)SELECTcookie1 AS cookieid,http://lxw1234.com AS url,firefox AS ua,127.0.0.1 AS ip,2015-07-08 11:00:01 AS createtimeFROM duallimit 1;插入数据执行完之后以下表的元数据发生变化PARTITIONSselect * from PARTITIONS WHERE TBL_ID41509PART_IDCREATE_TIMELAST_ACCESS_TIMEPART_NAMESD_IDTBL_ID5447214363258120day2015-07-08/sitelxw1234.com9174641509SDSselect * from SDS WHERE SD_ID91746注意这里的存储和表的存储是不同的因为每个分区也会有一个SD元数据表字段数据SD_ID91746CD_ID41564INPUT_FORMATorg.apache.hadoop.hive.ql.io.orc.OrcInputFormatIS_COMPRESSED0IS_STOREDASSUBDIRECTORIES0LOCATIONhdfs://namenode/hivedata/warehouse/liuxiaowen.db/lxw1234/day2015-07-08/sitelxw1234.comNUM_BUCKETS-1OUTPUT_FORMATorg.apache.hadoop.hive.ql.io.orc.OrcOutputFormatSERDE_ID91746PARTITION_KEY_VALSselect * from PARTITION_KEY_VALS where PART_ID54472PART_IDPART_KEY_VALINTEGER_IDX544722015-07-08054472lxw1234.com1PARTITION_PARAMSselect * from PARTITION_PARAMS where PART_ID 54472PART_IDPARAM_KEYPARAM_VALUE54472COLUMN_STATS_ACCURATEtrue54472numFiles154472numRows154472rawDataSize40854472totalSize70354472transient_lastDdlTime1436325813在分区的属性里面生成的该分区的统计信息(Statistics)。