当前位置: 首页 > news >正文

如何建设好一个公司网站若羌县铁路一建设网站

如何建设好一个公司网站,若羌县铁路一建设网站,南宁做网站建设,自己如何申请域名数据存储模型 ​专栏内容#xff1a; postgresql内核源码分析手写数据库toadb并发编程toadb开源库 个人主页#xff1a;我的主页 座右铭#xff1a;天行健#xff0c;君子以自强不息#xff1b;地势坤#xff0c;君子以厚德载物. 概述 在数据库的发展过程中#xff0c;关… 数据存储模型 ​专栏内容 postgresql内核源码分析手写数据库toadb并发编程toadb开源库 个人主页我的主页 座右铭天行健君子以自强不息地势坤君子以厚德载物. 概述 在数据库的发展过程中关系型数据库是一个里程碑式的阶段现在关系型数据仍然占据着重要地位。 在关系型数据中每张表都是一个关系每行数据就是关系的一条记录在存储时每行数据存储在连续的位置行与行也是连续存放 这样方便一次能拿到一整条记录。 处理业务类型 随着互联网的兴起存储容量的提升和计算能力的飞越我们的生活中不断增加了越来越多的被智能设备产生了无尽的信息。 这样的信息规模已经超越了某一单体的能力限制它们被不断分类对于数据库处理模型常常分为 在线事务处理模型(OLTP), 主要以事务一致性关系型数据为主在线分析处理模型(OLAP), 主要以分析统计为主更多的是从大量数据中提取某几个维度的数据 但是这样的划分还远远不能满足信息爆炸带来的需求它不是非黑即白的界线明晰的分类还有大量同时存在OLTP和OLAP的特点的数据和业务此时就需要一种混合性数据库存储模型。 数据存储模型原理 是什么 通过SQL插入的数据在数据库中实际也是要存到磁盘上的此时还要考虑我们写入的效率读取的效率如何产生的IO次数更少那以什么格式组织这些数据才能达到这样的目标呢 我们使用的文件系统都是以块为单位进行读写物理存储设备常用的块大小有2k, 4k等那么数据库为了提升性能也选择以块为单位来组织数据每次按块进行读写数据文件。 每个数据块内又分为块头信息域数据域的起始偏移数据域在数据域中按逻辑表的行进行连续存储。 当然行数据又分为定长或变长两种不同的组织方式定长就是每种数据类型固定了长度这样一行数据的长度也是确定的变长类型就是像字符文本等长度是可变的那么存储时需要记录长度。 它们最大的区别在于更新时定长是可以直接覆盖更新的而变长就需要追加更新。 为什么存储模型这么重要 因为我们的存储到数据库中的数据都是持久化到磁盘中当我们查询时再从磁盘中读出 虽然我们数据库和操作系统层面都已经做了缓存当数据量大时还是会产生大量的磁盘IO而且数据库大多数情况下都是随机访问缓存并不保证全部命中。 相较与内存速度来讲磁盘速度是极底的但是内存往往是有限的所以存储模型至关重要通过将随机写转换为顺序写少的IO就可以精确找到数据减少遍历这些都可以做到减少IO次数提升性能。 数据存储模型类型 NSM模型 故名思义就是按行数据排列的数组形式 数据的物理结构和他们的逻辑结构是一样的也就是我们常说的行存储模型这也是大多数关系型数据库采用的存储模型。 物理存储结构 磁盘是由一个一个数据块组成的因此连续的数据也分在了连续的数据块。 每个数据块中又分块头信息记录块中数据的起始偏移每行数据分为 行的数据偏移item从块头后面连续存储 以及真正的行数据它从块的末尾开始向头部方向连续存储这是为了方便空闲空间的管理。 表数据与物理存储结构对应 如下图所示 应用场景 它的优势在于对关联数据的查询非常快比如根据身份证号就可以一次读出姓名住址等一系列信息。 在此基础上对于复杂的嵌套join就非常有优势因为它的各列数据都在一起。 不适合场景 对于只查找部分列属性数据的业务就会增加IO的成本它需要全行数据的读出。对于按3NF设计还是一张大宽表都避免不了缓存效率的降低。 DSM模型 分解的存储模型也就是将一行中的各字段存储到不同的数据单元中当需要某列数据时只从磁盘加载部分数据如果需要整行数据那就加载全量数据然后进行行组装。 可以是每一列都分别存储也可以根据业务需要不规则的划分比如有三列经常会相时查询那这三列可以一起存储剩余的列分别存储。 物理存储结构 常见的格式有 PAXRCFile(record columnar file)Apache ORCParquet (An Open Columnar Storage for Hadoop) 它们中更多偏向分析型列式存储可以处理大量的时序流式数据也有一些偏向于行列的混合型每种格式都有成熟的产品应用。 应用场景 它们的场景更多偏向分析型如hdoop系列的使用ORC, Parquet。 混合型数据存储模型 为了综合以上NSM和DSM各自的优势互补长短目前一些数据库已经采用了一些混合的存储模型。 常见混合模型实践 数据冗余型 在存储数据时干脆两种格式同时进行存储一种按行进行存储一种按列分别存储这样避免了转换带的复杂度用空间来换取性能在优化引擎中可以选择更适合的路径 数据转换型 因为行存必须带来IO的放大也以实际存储采用列式存储在使用时进行组装成逻辑行数据这种模型的难点在于如何准确的找到逻辑行中的各字段大多都采用PAX中提到的分组的方式。 难点 在大数据处理中已经不局限于关系型数据更多的是非关系型如文本json数据如何将它们转换成列数据可以快速查找这将是混合型存储模型面临的一项挑战。 最近兴起的向量数据量向量与大模型维度是对应的底层数据库存储就需要将各类型数据进行分别存储。 结尾 非常感谢大家的支持在浏览的同时别忘了留下您宝贵的评论如果觉得值得鼓励请点赞收藏我会更加努力 作者邮箱studysenllang.onaliyun.com 如有错误或者疏漏欢迎指出互相学习。 注未经同意不得转载
http://www.pierceye.com/news/371074/

相关文章:

  • 大连哪家公司做网站比较好网页搜索的快捷键
  • 怎样建个小公司的网站濮阳网络电视直播
  • 台州低价网站建设阆中做网站
  • 兰州网站运营诊断学校网站报价方案
  • 宿迁做网站大公司现在企业做网站一般用什么框架
  • 企业如何建自己的网站自己网站的登录api怎么做
  • 专业的网站建设企业微信小程序服务器一年多少钱
  • 关于网站建设的句子苏州实力做网站公司有哪些
  • 网页制作与网站建设》在线作业 答案wordpress信息量几百万
  • 代刷网站系统怎么做wordpress数据库连接
  • 邢台网站改版开发开封美食网站建设规划
  • 网站建设佰金手指科杰二五国内网站推广
  • wordpress 多站点 用户天津经济持续恢复
  • 做网站邯郸怎样建立平台
  • 网站中捕获鼠标位置mip wordpress 评论
  • 室内设计资料网站discuz是什么东西
  • 网站建设方向论文提纲网页作品制作的一般过程
  • 生道网站建设平台高端商品网站
  • 网站维护计划商标注册号查询入口官网
  • 个人怎样申请网站网站整站html
  • 网站规则购房网官网
  • 苏州市吴江区住房和城乡建设局网站西安市今天发生的重大新闻
  • 网站需求建设关系书赚钱软件学生
  • 长春做网站4435怎么做手机网站
  • 电子政务网站系统微信扫码登录wordpress
  • 设计网站一般要多少钱方维服务公司服务范围
  • 济南外贸网站制作做网站推广每天加班
  • 网站开发虚拟主机系统做网站的新闻
  • 黄骅港信息吧windows优化大师好用吗
  • 网站编辑怎么做哪些知名网站用wordpress