静安做网站的公司,前端开发工程师招聘信息,如何做网站店铺,宝塔linux面板官网维度表#xff08;dimension#xff09;存放着一些维度属性#xff0c;例如时间维度#xff1a;年月日时#xff1b;地域维度#xff1a;省份#xff0c;城市#xff1b;年龄维度#xff1a;老年#xff0c;中年#xff0c;青年#xff1b;职称维度#xff1a;高dimension存放着一些维度属性例如时间维度年月日时地域维度省份城市年龄维度老年中年青年职称维度高中低。它定义了可以从哪些角度分析事实表。
事实表fact存放着一些业务产生的数据例如商品订购产生的订单信息银行的流水信息erp系统的办公信息。但它不仅存放着上述事实信息而且存放在事实信息与维度信息关联的键值例如订单信息里面有日期字段可以和时间维度关联可以通过银行中的个税流水与收入维度关联量化各个收入群体erp流水中的员工号可以同职称维度表关联统计公司运行状态。
其实在设计事实表与维度表的关联关系时要引入两个模型结构星型表star和雪花表snow。
顾名思义星型表模型是事实表与每个维度表分别关联事实表位于中央维度表围绕事实表周围。这种模型结构是一种反范式的设计方式。优点是设计简单减少了关联事实表和维度表的关联层级查询效率会高一些缺点是数据的冗余。例如事实表student(学号年龄姓名国家省份地市专业。。。)维度表country国家编码国家名称province(省份编码省份名称)city国家编码省份编码城市编码城市名称则在存储来自同一省份不同地市的学生时国家和省份就重复存放了。
雪花表模型则是一种规范的范式结构它的数据组织方式是消除冗余的能有效减少数据量优点是减少了冗余并且在关联查询中不容易出现数据重复计算的情况因为它引入了数据完整性缺点是维护复杂增加了关联层级执行效率较低。例如事实表student(学号年龄姓名地域专业。。。)维度表area地域编码国家编码省份编码城市编码country国家编码国家名称province(省份编码省份名称)city国家编码省份编码城市编码城市名称。 接着有上述星型表和雪花表组成的数据集合就是一个数据集市datamart其面向于部门级应用存放少量的历史数据数据来源于数据仓库。
在数据集市的底层则为数据仓库data warehouse它的数据来源于ODS存放着大量历史数据它是ods数据的视图反映。数据存储符合第三范式面向企业级应用。 另外ODSOperational Data Store是业务产生的数据是不断变化的数据例如业务产生的流水数据。