网页建站如何保存分享,wordpress 文章加评论,上海营销策划公司哪家好,微网站建设申请报告架构设计与历史
概述
和其他数据库系统相比#xff0c;MySQL有点与众不同#xff0c;它的架构可以在多种不同场景中应用并发挥好的作用#xff0c;但同时也会带来一点选择上的困难。MySQL并不完美#xff0c;却足够灵活#xff0c;能够适应高要求的环境#xff0c;例如…架构设计与历史
概述
和其他数据库系统相比MySQL有点与众不同它的架构可以在多种不同场景中应用并发挥好的作用但同时也会带来一点选择上的困难。MySQL并不完美却足够灵活能够适应高要求的环境例如Web类应用。同时MySQL既可以嵌入到应用程序中也可以支持数据仓库、内容索引和部署软件、高可用的冗余系统、在线事务处理系统(OLTP)等各种应用类型。 为了充分发徽MySQL的性能并顺利地使用就必须理解其设计。MySQL的灵活性体现在很多方面。例如你可以通过配置使它在不同的硬件上都运行得很好也可以支持多种不同得数据类型。但是MySQL最重要、最与众不同的特性是它的存储引擎架构这种架构的设计将查询处理(Query Processing)及其他系统任务(Server Task)和数据的存储/提取相分离。这种处理和存储分离的设计可以在使用时根据性能、特性以及其他需求啦i选择数据存储的方式。
MySQL逻辑架构
如果能在头脑中构建出一幅MySQL各组件之间如何协同工作的架构图就会有助于深入理解MySQL服务器如图所示展示了MySQL逻辑架构图。
最上层的服务并不是MySQL所独有大多数基于网络的客户端/服务器的工具或者服务器都有类似的架构。比如连接处理、授权认证、安全等等。第二层架构是MySQL比较有意思的部分.大多数MySQL的核心服务功能都在这一层包括查询解析、分析、优化、缓存以及所有的内置函数(例如日期、 时间、数学和加密函数)所有跨存储引擎的功能都在这一层实现:存储过程、触发器、视图等。第三层包含了存储引擎。存储引擎负责MySQL中数据的存储和提取。和GNU/Linux下的各种文件系统一样每个存储引擎都有它的优势和劣势。服务器通过API与存储引擎进行通信。这些接口屏蔽了不同存储引擎之间的差异使得这些差异对上层的查询过程透明。存储引擎API包含几十个底层函数用于执行诸如开始一个事务或者根据主键提取一行记录等操作。但存储引擎不会去解析SQL(InnoDB是一个例外它会解析外键定义因为MySQL服务器本身没有实现该功能),不同存储引擎之间也不会相互通信而是简单地响应上层服务器的请求。
连接管理与安全性
每个客户端连接都会在服务器进程中拥有一个线程这个连接的查询只会在这个单独的线程中执行该线程只能轮流在某个CPU核心或者CPU中运行服务器会负责缓存线程因此不需要为每一个新键的连接创建或者销毁线程(MySQL5.5版本后提供了一个API支持线程池(Thread-Pooling)插件可以使用池中少量的线程来服务大量的连接)。 当客户端(应用)连接到MySQL服务器时服务器需要对其进行认证。认证基于用户名、原始主机信息和密码。如果使用了安全套接字(SSL)的方式连接还可以使用X.509证书认证。一旦客户端连接成功服务器会继续验证该客户端是否具有执行某个特定查询的权限(例如是否允许客户端对world数据库的Country表执行SELECT语句)
优化与执行
MySQL会解析查询并创建内部数据结构(解析树)然后对其进行各种优化包括重写查询、决定表的读取顺序以及选择合适的索引等。用户可以通过特殊的关键字提示(hint)优化器影响它的决策过程。也可以请求优化器解释(explain)优化过程的各个因素使用户可以知道服务器是如何进行优化决策的并提供一个参考基准便于用户重构查询和schema、修改相关配置使应用尽可能高效运行。 优化器并不关心表使用的是什么存储引擎但存储引擎对于优化查询是有影响的。优化器会请求存储引擎提供容量或某个具体操作的开销信息以及表数据的统计信息等。例如某些存储引擎的某种索引可能对一些特定的查询有优化。 对于SELECT语句在解析查询之前服务器会先检查查询缓存(Query Cache)如果能够在其中找到对应的查询服务器就不必再执行查询解析、优化和执行的整个过程而是直接返回查询缓存中的结果集
并发控制
无论何时只要有多个查询需要在同一时刻修改数据都会产生并发控制的问题。这里我们讨论的只是MySQL的两个层面的并发控制:服务器层与存储引擎层。并发控制是一个内容庞大的话题我们只是简要地分析MySQL如何控制并发读写。 以Unix系统的email box为例典型的mbox文件格式是非常简单的。一个mbox邮箱中的所有邮件都串行在一起彼此首尾相连。这种格式对于读取和分析邮件信息非常友好同时投递邮件也很容易只要在文件末尾附加新的邮件内容即可。但如果两个进程在同一时刻对同一个邮箱投递邮件会发生什么情况显然邮箱的数据会被破坏两封邮件的内容会交叉地附加在邮箱文件的末尾。设计良好的邮箱邮递系统会通过锁(lock)来防止数据损坏。如果客户视图投递邮件而邮箱已经被其他客户端锁住那就必须等待知道锁释放才能进行投递。 这种锁的方案在实际应用环境中虽然工作良好但并不支持并发处理。因为在任意一个时刻只有一个进程可以修改邮箱的数据这在大容量的邮箱系统中是个问题
读写锁
从邮箱中读取数据没有这样的麻烦即使同一个hi上课多个用户并发读取也不会有什么问题因为读取不会修改数据所以不会出错。但如果某个客户正在读取邮箱同时另外一个用户视图删除编号为25的邮件会产生什么结果结论是不确定读的客户可能会报错退出也可能读取到不一致的邮箱数据。所以为安全起见即使是读取邮箱也需要特别注意。 如果把上述的邮箱当称数据库的一张表把邮件当成表中的一行记录就很容易看出同样的问题依然存在。从很多方面来说邮箱就是一张简单的数据库表。修改数据库中的记录和删除或者修改邮箱中的邮件信息十分类似。 解决这类经典问题的方法就是并发控制其实非常简单。在处理并发读或者写时可以通过实现一个由两种类型的锁组成的锁系统来解决问题。这两种类型的锁通常被称为共享锁(shared lock)和排他锁(exclusive lock)也叫读锁(read lock)和写锁(write lock)
这里先不讨论锁的具体实现描述一下锁的概念如下:读锁是共享的或者说是相互不阻塞的。多个客户端在同一时刻可以同时读取同一个资源而互不干扰。写锁则是排他的也就是说一个写锁会阻塞其他的写锁和读锁这是出于安全策略的考虑只有这样才能确保在给定的时间里只有一个用户能执行写入并防止其他用户读取正在写入的同一资源。 在实际的数据库系统中每时每刻都在发生锁定当某个用户在修改某一部分数据时MySQL会通过锁定防止其他用户读取同一数据。大多数时候MySQL锁的内部管理是透明的
锁粒度
一种提高共享资源并发性的方式就是让锁定对象更有选择性。尽量只锁定需要修改的部分数据而不是所有的资源。更理想的方式是只对会修改的数据片进行精确的锁定。任何时候在给定的资源山锁定的数据量越少则系统的并发程度越高只要相互间不发生冲突即可。 问题是加锁也需要消耗资源锁的各种操作包括获得锁、检查锁是否已经解除、释放锁等都会增加系统的开销。如果系统花费大量的时间来管理锁而不是存取数据那么系统的性能可能会因此受到影响。 所谓的锁策略就是在锁的开销和数据的安全性之间寻求平衡这种平衡当然也会影响到性能。大多数商业数据库系统没有提供更多的选择一般是在表上施加行级锁(row-level lock)并以各种复杂的方式来实现以便在锁比较多的秦广下尽可能地提供更好的性能。 而MySQL则提供了多种选择。每种MySQL存储引擎都可以实现自己的锁策略和锁粒度。在存储引擎的设计中锁管理是个非常重要的决定。将锁粒度固定在某个级别可以为某些特定的应用场景提供更好的性能但同时却会失去对另外一些应用场景的良好支持。好在MySQL支持多个存储引擎的架构所以不需要单一的通用解决方案
表锁(table lock) 表锁是MySQL种最基本的锁策略并且是开销最小的策略。表锁非常类似前文描述的邮箱加锁机制:它会锁定整张表。一个用户在对表进行写操作(插入、删除、更新等)前需要先获得写锁这会阻塞其他用户对该表的所有读写操作。只有没有写锁时其他读取的用户才能获得读锁读锁之间是不相互阻塞的。 在特定的场景种表锁也可能由良好的性能。例如,READ LOCAL表锁支持某些类型的并发写操作。另外写锁也比读锁有更高的优先级因此一个写锁请求可能会被插入到读锁队列的前面(写锁可以插入到锁队列种读锁的前面反之读锁则不能插入到写锁的前面)。 尽管存储引擎可以管理自己的锁MySQL本身还是会使用各种有效的表锁来实现不同的目的。例如服务器会为诸如ALTER TABLE之类的语句使用表锁而忽略存储引擎的锁机制。行级锁(row lock) 行级锁可以最大程度地支持并发处理(同时也带来了最大的锁开销)。众所周知在InnoDB和XtraDB以及其他一些存储引擎种实现了行级锁。行级锁只在存储引擎层实现而MySQL服务器层没有实现。服务器层完全不了解存储引擎中的锁实现