当前位置：首页 > news >正文

成品网站货源网站与网页的关系

news 2025/11/17 18:46:22

成品网站货源,网站与网页的关系,怎么做网站弹窗,如何在网上销售MySQL集群架构搭建以及多数据源管理实战数据库的分库分表操作#xff0c;是互联网大型应用所需要面对的最核心的问题。因为数据往往是一个应用最核心的价值所在。但是#xff0c;在最开始的时候#xff0c;需要强调下#xff0c;在实际应用中#xff0c;对于数据库是互联网大型应用所需要面对的最核心的问题。因为数据往往是一个应用最核心的价值所在。但是在最开始的时候需要强调下在实际应用中对于数据库能不分就不分这也应该是你未来准备对你的应用下手进行分库分表之前需要考量的宗旨。为什么一上来就会要给你们泼这样一盆冷水呢这就需要你提前思考清楚为什么要分库分表。一、分库分表能不分就不分 1、为什么要分库分表数据库应该是一个应用当中最为核心的价值所在也是开发过程中必须熟练掌握的工具。之前我们就学习过很多对MySQL的调优。但是随着现在互联网应用越来越大数据库会频繁的成为整个应用的性能瓶颈。我们经常使用的MySQL数据库也就不断面临数据量太大、数据访问太频繁、数据读写速度太快等一系列的问题。而传统的这些调优方式在真正面对海量数据冲击时往往就会显得很无力。因此现在互联网对于数据库的使用也越来越小心谨慎。例如添加Redis缓存、增加MQ进行流量削峰等。但是数据库本身如果性能得不到提升这就相当于是水桶理论中的最短板。要提升数据库的性能最直接的思路当然是对数据库本身进行优化。例如对MySQL进行调优优化SQL逻辑优化索引结构甚至像阿里等互联网大厂一样直接优化MySQL的源码。但是这种思路在面对互联网环境时会有很多非常明显的弊端。数据量和业务量快速增长会带来性能瓶颈、服务宕机等很多问题。单点部署的数据库无法保证服务高可用。单点部署的数据库无法进行水平扩展难以应对业务爆发式的增长。这些问题背后的核心还是数据。数据库不同于上层的一些服务他所管理的数据甚至比服务本身更重要。即要保证数据能够持续稳定的写入又不能因为服务故障造成数据丢失。现在互联网上的大型应用动辄几千万上亿的数据量就算做好数据的压缩随随便便也可以超过任何服务器的存储能力。并且服务器单点部署也无法真正解决把鸡蛋放在一个篮子里的问题。将数据放在同一个服务器上如果服务器出现崩溃就很难保证数据的安全性。这些都不是光靠优化MySQL产品优化服务器配置能够解决的问题。 2、分库分表的优势那么自然就需要换另外一种思路了。我们可以像微服务架构一样来维护数据库的服务。把数据库从单体服务升级到数据库集群这样才能真正全方位解放数据库的性能瓶颈并且能够通过水平扩展的方式灵活提升数据库的存储能力。这也就是我们常说的分库分表。通过分库分表可以给数据库带来很大的好处提高系统性能分库分表可以将大型数据库分成多个小型数据库每个小型数据库只需要处理部分数据因此可以提高数据库的并发处理能力和查询性能。提高系统可用性分库分表可以将数据复制到多个数据库中以提高数据的可用性和可靠性。如果一个数据库崩溃了其他数据库可以接管其工作以保持系统的正常运行。提高系统可扩展性分库分表可以使系统更容易扩展。当数据量增加时只需要增加更多的数据库和表而不是替换整个数据库因此系统的可扩展性更高。提高系统灵活性分库分表可以根据数据的使用情况对不同的数据库和表进行不同的优化。例如可以将经常使用的数据存储在性能更好的数据库中或者将特定类型的数据存储在特定的表中以提高系统的灵活性。降低系统成本分库分表可以使系统更加高效因此可以降低系统的运营成本。此外分库分表可以使用更便宜的硬件和存储设备因为每个小型数据库和表需要的资源更少。 3、分库分表的挑战可能你会说分库分表嘛也不是很难。一个库存不下那就把数据拆分到多个库。一张表数据太多了就把同一张表的数据拆分到多张。至于怎么做也不难啊。要操作多个数据库那么建立多个JDBC连接就行了。要写到多张表修改下SQL语句就行了。如果你也这么觉得那么就大错特错了。分库分表也并不是字面意义上的将数据分到多个库或者多个表这么简单他需要的是一系列的分布式解决方案。因为数据的特殊性造成数据库服务其实是几乎没有试错的成本的。在微服务阶段从单机架构升级到微服务架构是很灵活的中间很多细节步骤都可以随时做调整。比如对于微服务的接口限流功能你并不需要一上来就用Sentinel这样复杂的流控工具。一开始不考虑性能自己进行限流是很容易的事情。然后你可以慢慢尝试用Guava等框架提供的一些简单的流控工具进行零散的接口限流。直到整个应用的负载真正上来了之后流控的要求更高更复杂了再开始引入Sentinel进行统一流控这都没有问题。这种试错的过程其实是你能够真正用好一项技术的基础。但是对于数据库就不一样了。当应用中用来存储数据的数据库从一个单机的数据库服务升级到多个数据库组成的集群服务时需要考虑的除了分布式的各种让人摸不着边际的复杂问题外还要考虑到一个更重要的因素数据。**数据的安全性甚至比数据库服务本身更重要**因此如果你在一开始做分库分表时的方案不太成熟对数据的规划不是很合理那么这些问题大概率会随着数据永远沉淀下去成为日后对分库分表方案进行调整时最大的拦路虎。所以在决定进行分库分表之前一定需要提前对于所需要面对的各种问题进行考量。如果你没有考虑清楚数据要如何存储、计算、使用或者你对于分库分表的各种问题都还没有进行过思考那么千万不要在真实项目中贸然的进行分库分表。分库分表也称为Sharding。其实我觉得Sharding应该比中文的分库分表更为贴切他表示将数据拆分到不同的数据片中。由于数据往往是一个应用的基础随着数据从单体服务拆分到多个数据分片应用层面也需要面临很多新的问题。比如主键避重问题在分库分表环境中由于表中数据同时存在不同数据库中某个分区数据库生成的ID就无法保证全局唯一。因此需要单独设计全局主键以避免跨库主键重复问题。数据备份问题随着数据库由单机变为集群整体服务的稳定性也会随之降低。如何保证集群在各个服务不稳定的情况下依然保持整体服务稳定就是数据库集群需要面对的重要问题。而对于数据库还需要对数据安全性做更多的考量。数据迁移问题当数据库集群需要进行扩缩容时集群中的数据也需要随着服务进行迁移。如何在不影响业务稳定性的情况下进行数据迁移也是数据库集群化后需要考虑的问题。分布式事务问题原本单机数据库有很好的事务机制能够帮我们保证数据一致性。但是分库分表后由于数据分布在不同库甚至不同服务器不可避免会带来分布式事务问题。 SQL路由问题数据被拆分到多个分散的数据库服务当中每个数据库服务只能保存一部分的数据。这时在执行SQL语句检索数据时如何快速定位到目标数据所在的数据库服务并将SQL语句转到对应的数据库服务中执行也是提升检索效率必须要考虑的问题。跨节点查询归并问题跨节点进行查询时每个分散的数据库中只能查出一部分的数据这时要对整体结果进行归并时就会变得非常复杂。比如常见的limit、order by等操作。在实际项目中遇到的问题还会更多。从这里可以看出Sharding其实是一个很复杂的问题往往很难通过项目定制的方式整体解决。因此大部分情况下都是通过第三方的服务来解决Sharding的问题。比如像TiDB、ClickHouse、Hadoop这一类的NewSQL产品大部分情况下是将数据问题整体封装到一起从而提供Sharding方案。但是这些产品毕竟太重了。更灵活的方式还是使用传统数据库通过软件层面来解决多个数据库之间的数据问题。这也诞生了很多的产品比如早前的MyCat还有后面我们要学习的ShardingSphere等。另外关于何时要开始考虑分库分表呢当然是数据太大了数据库服务器压力太大了就要进行分库分表。但是这其实是没有一个具体的标准的需要根据项目情况进行灵活设计。业界目前唯一比较值得参考的详细标准是阿里公开的开发手册中提到的建议预估三年内单表数据超过500W或者单表数据大小超过2G就需要考虑分库分表。二、应用中如何将单数据库升级为集群分库分表是一个很复杂的问题因此在实际上手ShardingSphere这样的框架之前我们其实有必要了解一下在实际开发中我们如何将一个MySQL服务扩展成一个MySQL集群这样在后续面对ShardingSphere各种复杂的配置以及API时才能弄明白到底在干些什么事情。接下来会一步一步带你完成一个具有主从同步、读写分离这样典型数据库集群操作的应用来理解一下简单的分库分表要怎么做。 1、搭建MySQL集群实现服务和数据的高可用 1搭建基础MySQL服务。以下准备两台服务器用来搭建一个MySQL的服务集群。两台服务器均安装CentOS7操作系统。MySQL版本采用mysql-8.0.20版本。两台服务器的IP分别为192.168.232.128和192.168.232.129。其中128服务器规划为MySQL主节点129服务器规划为MySQL的从节点。接下来需要在两台服务器上分别安装MySQL服务。 MySQL是很基础的服务但是在Linux上搭建经常会出现各种各样的环境问题。如果大家在Linux上搭建MySQL有困难的话可以改为用Windows安装或者用Docker也行。甚至你可以使用宝塔这样的运维面板来协助搭建MySQL服务。宝塔官网地址宝塔面板 - 简单好用的Linux/Windows服务器运维管理面板 MySQL的安装有很多种方式具体可以参考官网手册https://dev.mysql.com/doc/refman/8.0/en/binary-installation.html。我们这里采用对系统环境依赖最低出问题的可能性最小的tar包方式来安装。上传mysql压缩包到worker2机器的root用户工作目录/root下然后按照下面的指令解压安装mysql。 groupadd mysql useradd -r -g mysql -s /bin/false mysql #这里是创建一个mysql用户用于承载mysql服务但是不需要登录权限。 tar -zxvf mysql-8.0.20-el7-x86_64.tar.gz #解压 ln -s mysql-8.0.20-el7-x86_64 mysql #建立软链接 cd mysql mkdir mysql-files chown mysql:mysql mysql-files chmod 750 mysql-files bin/mysqld --initialize --usermysql #初始化mysql数据文件注意点1 bin/mysql_ssl_rsa_setup bin/mysqld_safe --usermysql cp support-files/mysql.server /etc/init.d/mysql.server 注意点 1、初始化过程中会初始化一些mysql的数据文件经常会出现一些文件或者文件夹权限不足的问题。如果有文件权限不足的问题需要根据他的报错信息创建对应的文件或者文件夹并配置对应的文件权限。 2、初始化过程如果正常完成日志中会打印出一个root用户的默认密码。这个密码需要记录下来。 2020-12-10T06:05:28.948043Z 6 [Note] [MY-010454] [Server] A temporary password is generated for rootlocalhost: P6kigsT6Lg 2、启动MySQL服务 bin/mysqld --usermysql 注意点 1、这个启动过程会独占当前命令行窗口如果要后台执行可以在后面添加一个。但是一般第一次启动mysql服务时经常会出现一些错误所以建议用独占窗口的模式跟踪下日志。 3、连接MySQL MySQL服务启动完成后默认是只能从本机登录远程是无法访问的。所以需要用root用户登录下配置远程访问的权限。 cd /root/mysql bin/mysql -uroot -p #然后用之前记录的默认密码登录注意点 1、如果有同学遇到 ERROR 2002 (HY000): Cant connect to local MySQL server through socket /tmp/mysql.sock (2) 这个报错信息可以参照下面的配置修改下/etc/my.cnf配置文件来配置下sock连接文件的地址。主要是下面client部分。 [mysqld] datadir/var/lib/mysql socket/var/lib/mysql/mysql.sock usermysql # Disabling symbolic-links is recommended to prevent assorted security risks symbolic-links0 # Settings user and group are ignored when systemd is used. # If you need to run mysqld under a different user or group, # customize your systemd unit file for mariadb according to the # instructions in http://fedoraproject.org/wiki/Systemd[mysqld_safe] log-error/var/log/mariadb/mariadb.log pid-file/var/run/mariadb/mariadb.pid# # include all files from the config directory # !includedir /etc/my.cnf.d[client] port3306 socket/var/lib/mysql/mysql.sock 登录进去后需要配置远程登录权限 alter user rootlocalhost identified by 123456; #修改root用户的密码 use mysql; update user set host% where userroot; flush privileges; 这样Linux机器上的MySQL服务就搭建完成了。可以使用navicat等连接工具远程访问MySQL服务了。接下来以相同方式在另外服务器上搭建MySQL即可。这里需要注意下的是搭建主从集群的多个服务有两个必要的条件。 1、MySQL版本必须一致。 2、集群中各个服务器的时间需要同步。 2搭建MySQL主从集群既然要解决MySQL数据库的分布式集群化问题那就不能不先了解MySQL自身提供的主从同步原理。这是构建MySQL集群的基础也是后续进行分库分表的基础更是MySQL进行生产环境部署的基础。其实数据库的主从同步就是为了要保证多个数据库之间的数据保持一致。最简单的方式就是使用数据库的导入导出工具定时将主库的数据导出再导入到从库当中。这是一种很常见也很简单易行的数据库集群方式。也有很多的工具帮助我们来做这些事情。但是这种方式进行数据同步的实时性比较差。而如果要保证数据能够实时同步对于MySQL通常就要用到他自身提供的一套通过Binlog日志在多个MySQL服务之间进行同步的集群方案。基于这种集群方案一方面可以提高数据的安全性另外也可以以此为基础提供读写分离、故障转移等其他高级的功能。即在主库上打开Binlog日志记录对数据的每一步操作。然后在从库上打开RelayLog日志用来记录跟主库一样的Binlog日志并将RelayLog中的操作日志在自己数据库中进行重演。这样就能够更加实时的保证主库与从库的数据一致。 MySQL的Binlog默认是不打开的。他的实现过程是在从库上启动一系列IO线程负责与主库建立TCP连接请求主库在写入Binlog日志时也往从库传输一份。这时主库上会有一个IO Dump线程负责将Binlog日志通过这些TCP连接传输给从库的IO线程。而从库为了保证日志接收的稳定性并不会立即重演Binlog数据操作而是先将接收到的Binlog日志写入到自己的RelayLog日志当中。然后再异步的重演RelayLog中的数据操作。 MySQL的BinLog日志能够比较实时的记录主库上的所有操作因此他也被很多其他工具用来实时监控MySQL的数据变化。例如Canal框架可以模拟一个slave节点同步MySQL的Binlog然后将具体的数据操作按照定制的逻辑进行转发。例如转发到Redis实现缓存一致转发到Kafka实现数据实时流转等。甚至像ClickHouse还支持将自己模拟成一个MySQL的从节点接收MySQL的Binlog日志实时同步MySQL的数据。接下来我们就在这两个MySQL服务的基础上搭建一个主从集群。 1》配置master服务首先配置主节点的mysql配置文件 /etc/my.cnf(没有的话就手动创建一个) 这一步需要对master进行配置主要是需要打开binlog日志以及指定severId。我们打开MySQL主服务的my.cnf文件在文件中一行server-id以及一个关闭域名解析的配置。然后重启服务。 [mysqld] server-id47 #开启binlog log_binmaster-bin log_bin-indexmaster-bin.index skip-name-resolve # 设置连接端口 port3306 # 设置mysql的安装目录 basedir/usr/local/mysql # 设置mysql数据库的数据的存放目录 datadir/usr/local/mysql/mysql-files # 允许最大连接数 max_connections200 # 允许连接失败的次数。 max_connect_errors10 # 服务端使用的字符集默认为UTF8 character-set-serverutf8 # 创建新表时将使用的默认存储引擎 default-storage-engineINNODB # 默认使用“mysql_native_password”插件认证 #mysql_native_password default_authentication_pluginmysql_native_password 配置说明主要需要修改的是以下几个属性 server-id服务节点的唯一标识。需要给集群中的每个服务分配一个单独的ID。 log_bin打开Binlog日志记录并指定文件名。 log_bin-indexBinlog日志文件重启MySQL服务 service mysqld restart 然后我们需要给root用户分配一个replication slave的权限。 #登录主数据库 mysql -u root -p GRANT REPLICATION SLAVE ON *.* TO root%; flush privileges; #查看主节点同步状态 show master status; 在实际生产环境中通常不会直接使用root用户而会创建一个拥有全部权限的用户来负责主从同步。这个指令结果中的File和Position记录的是当前日志的binlog文件以及文件中的索引。而后面的Binlog_Do_DB和Binlog_Ignore_DB这两个字段是表示需要记录binlog文件的库以及不需要记录binlog文件的库。目前我们没有进行配置就表示是针对全库记录日志。这两个字段如何进行配置会在后面进行介绍。开启binlog后数据库中的所有操作都会被记录到datadir当中以一组轮询文件的方式循环记录。而指令查到的File和Position就是当前日志的文件和位置。而在后面配置从服务时就需要通过这个File和Position通知从服务从哪个地方开始记录binLog。 2》配置slave从服务下一步我们来配置从服务mysqls。我们打开mysqls的配置文件my.cnf修改配置文件 mysqld] #主库和从库需要不一致 server-id48 #打开MySQL中继日志 relay-log-indexslave-relay-bin.index relay-logslave-relay-bin #打开从服务二进制日志 log-binmysql-bin #使得更新的数据写进二进制日志中 log-slave-updates1 # 设置3306端口 port3306 # 设置mysql的安装目录 basedir/usr/local/mysql # 设置mysql数据库的数据的存放目录 datadir/usr/local/mysql/mysql-files # 允许最大连接数 max_connections200 # 允许连接失败的次数。 max_connect_errors10 # 服务端使用的字符集默认为UTF8 character-set-serverutf8 # 创建新表时将使用的默认存储引擎 default-storage-engineINNODB # 默认使用“mysql_native_password”插件认证 #mysql_native_password default_authentication_pluginmysql_native_password 配置说明主要需要关注的几个属性 server-id服务节点的唯一标识 relay-log打开从服务的relay-log日志。 log-bin打开从服务的bin-log日志记录。然后我们启动mysql的服务并设置他的主节点同步状态。 #登录从服务 mysql -u root -p; #设置同步主节点 CHANGE MASTER TO MASTER_HOST192.168.232.128, MASTER_PORT3306, MASTER_USERroot, MASTER_PASSWORDroot, MASTER_LOG_FILEmaster-bin.000004, MASTER_LOG_POS156, GET_MASTER_PUBLIC_KEY1; #开启slave start slave; #查看主从同步状态 show slave status; 或者用 show slave status \G; 这样查看比较简洁注意CHANGE MASTER指令中需要指定的MASTER_LOG_FILE和MASTER_LOG_POS必须与主服务中查到的保持一致。并且后续如果要检查主从架构是否成功也可以通过检查主服务与从服务之间的File和Position这两个属性是否一致来确定。我们重点关注其中红色方框的两个属性与主节点保持一致就表示这个主从同步搭建是成功的。从这个指令的结果能够看到有很多Replicate_开头的属性这些属性指定了两个服务之间要同步哪些数据库、哪些表的配置。只是在我们这个示例中全都没有进行配置就标识是全库进行同步。后面我们会补充如何配置需要同步的库和表。 3》主从集群测试测试时我们先用showdatabases查看下两个MySQL服务中的数据库情况然后我们在主服务器上创建一个数据库 mysql create database syncdemo; Query OK, 1 row affected (0.00 sec) 然后我们再用show databases来看下这个syncdemo的数据库是不是已经同步到了从服务。接下来我们继续在syncdemo这个数据库中创建一个表并插入一条数据。 mysql use syncdemo; Database changed mysql create table demoTable(id int not null); Query OK, 0 rows affected (0.02 sec)mysql insert into demoTable value(1); Query OK, 1 row affected (0.01 sec) 然后我们也同样到主服务与从服务上都来查一下这个demoTable是否同步到了从服务。从上面的实验过程看到我们在主服务中进行的数据操作就都已经同步到了从服务上。这样我们一个主从集群就搭建完成了。另外这个主从架构是有可能失败的如果在slave从服务上查看slave状态发现Slave_SQL_Runningno就表示主从同步失败了。这有可能是因为在从数据库上进行了写操作与同步过来的SQL操作冲突了也有可能是slave从服务重启后有事务回滚了。如果是因为slave从服务事务回滚的原因可以按照以下方式重启主从同步 mysql stop slave ; mysql set GLOBAL SQL_SLAVE_SKIP_COUNTER1; mysql start slave ; 而另一种解决方式就是重新记录主节点的binlog文件消息 mysql stop slave ; mysql change master to ..... mysql start slave ; 但是这种方式要注意binlog的文件和位置如果修改后和之前的同步接不上那就会丢失部分数据。所以不太常用。 4》全库同步与部分同步在完成这个基本的MySQL主从集群后我们还可以进行后续的实验之前提到我们目前配置的主从同步是针对全库配置的而实际环境中一般并不需要针对全库做备份而只需要对一些特别重要的库或者表来进行同步。那如何针对库和表做同步配置呢首先在Master端在my.cnf中可以通过以下这些属性指定需要针对哪些库或者哪些表记录binlog #需要同步的二进制数据库名 binlog-do-dbmasterdemo #只保留7天的二进制日志以防磁盘被日志占满(可选) expire-logs-days 7 #不备份的数据库 binlog-ignore-dbinformation_schema binlog-ignore-dbperformation_schema binlog-ignore-dbsys 然后在Slave端在my.cnf中需要配置备份库与主服务的库的对应关系。 #如果salve库名称与master库名相同使用本配置 replicate-do-db masterdemo #如果master库名[mastdemo]与salve库名[mastdemo01]不同使用以下配置[需要做映射] replicate-rewrite-db masterdemo - masterdemo01 #如果不是要全部同步[默认全部同步]则指定需要同步的表 replicate-wild-do-tablemasterdemo01.t_dict replicate-wild-do-tablemasterdemo01.t_num 配置完成了之后在show master status指令中就可以看到Binlog_Do_DB和Binlog_Ignore_DB两个参数的作用了。 5》GTID同步集群上面我们搭建的集群方式是基于Binlog日志记录点的方式来搭建的这也是最为传统的MySQL集群搭建方式。而在这个实验中可以看到有一个Executed_Grid_Set列暂时还没有用上。实际上这就是另外一种搭建主从同步的方式即GTID搭建方式。这种模式是从MySQL5.6版本引入的。 GTID的本质也是基于Binlog来实现主从同步只是他会基于一个全局的事务ID来标识同步进度。GTID即全局事务ID全局唯一并且趋势递增他可以保证为每一个在主节点上提交的事务在复制集群中可以生成一个唯一的ID 。在基于GTID的复制中首先从服务器会告诉主服务器已经在从服务器执行完了哪些事务的GTID值然后主库会有把所有没有在从库上执行的事务发送到从库上进行执行并且使用GTID的复制可以保证同一个事务只在指定的从库上执行一次这样可以避免由于偏移量的问题造成数据不一致。他的搭建方式跟我们上面的主从架构整体搭建方式差不多。只是需要在my.cnf中修改一些配置。在主节点上 gtid_modeon enforce_gtid_consistencyon log_binon server_id单独设置一个 binlog_formatrow 在从节点上 gtid_modeon enforce_gtid_consistencyon log_slave_updates1 server_id单独设置一个然后分别重启主服务和从服务就可以开启GTID同步复制方式。 3集群扩容与MySQL数据迁移我们现在已经搭建成功了一主一从的MySQL集群架构那要扩展到一主多从的集群架构其实就比较简单了只需要增加一个binlog复制就行了。但是如果我们的集群是已经运行过一段时间这时候如果要扩展新的从节点就有一个问题之前的数据没办法从binlog来恢复了。这时候在扩展新的slave节点时就需要增加一个数据复制的操作。 MySQL的数据备份恢复操作相对比较简单可以通过SQL语句直接来完成。具体操作可以使用mysql的bin目录下的mysqldump工具。 mysqldump -u root -p --all-databases backup.sql #输入密码通过这个指令就可以将整个数据库的所有数据导出成backup.sql然后把这个backup.sql分发到新的MySQL服务器上并执行下面的指令将数据全部导入到新的MySQL服务中。 mysql -u root -p backup.sql #输入密码这样新的MySQL服务就已经有了所有的历史数据然后就可以再按照上面的步骤配置Slave从服务的数据同步了。 4搭建半同步复制 1》理解半同步复制到现在为止我们已经可以搭建MySQL的主从集群互主集群但是我们这个集群有一个隐患就是有可能会丢数据。这是为什么呢这要从MySQL主从数据复制分析起。 MySQL主从集群默认采用的是一种异步复制的机制。主服务在执行用户提交的事务后写入binlog日志然后就给客户端返回一个成功的响应了。而binlog会由一个dump线程异步发送给Slave从服务。由于这个发送binlog的过程是异步的。主服务在向客户端反馈执行结果时是不知道binlog是否同步成功了的。这时候如果主服务宕机了而从服务还没有备份到新执行的binlog那就有可能会丢数据。那怎么解决这个问题呢这就要靠MySQL的半同步复制机制来保证数据安全。半同步复制机制是一种介于异步复制和全同步复制之前的机制。主库在执行完客户端提交的事务后并不是立即返回客户端响应而是等待至少一个从库接收并写到relay log中才会返回给客户端。MySQL在等待确认时默认会等10秒如果超过10秒没有收到ack就会降级成为异步复制。这种半同步复制相比异步复制能够有效的提高数据的安全性。但是这种安全性也不是绝对的他只保证事务提交后的binlog至少传输到了一个从库并且并不保证从库应用这个事务的binlog是成功的。另一方面半同步复制机制也会造成一定程度的延迟这个延迟时间最少是一个TCP/IP请求往返的时间。整个服务的性能是会有所下降的。而当从服务出现问题时主服务需要等待的时间就会更长要等到从服务的服务恢复或者请求超时才能给用户响应。 2》搭建半同步复制集群半同步复制需要基于特定的扩展模块来实现。而mysql从5.5版本开始往上的版本都默认自带了这个模块。这个模块包含在mysql安装目录下的lib/plugin目录下的semisync_master.so和semisync_slave.so两个文件中。需要在主服务上安装semisync_master模块在从服务上安装semisync_slave模块。首先我们登陆主服务安装semisync_master模块 mysql install plugin rpl_semi_sync_master soname semisync_master.so; Query OK, 0 rows affected (0.01 sec)mysql show global variables like rpl_semi%; ------------------------------------------------------- | Variable_name | Value | ------------------------------------------------------- | rpl_semi_sync_master_enabled | OFF | | rpl_semi_sync_master_timeout | 10000 | | rpl_semi_sync_master_trace_level | 32 | | rpl_semi_sync_master_wait_for_slave_count | 1 | | rpl_semi_sync_master_wait_no_slave | ON | | rpl_semi_sync_master_wait_point | AFTER_SYNC | ------------------------------------------------------- 6 rows in set, 1 warning (0.02 sec)mysql set global rpl_semi_sync_master_enabledON; Query OK, 0 rows affected (0.00 sec) 这三行指令中第一行是通过扩展库来安装半同步复制模块需要指定扩展库的文件名。第二行查看系统全局参数rpl_semi_sync_master_timeout就是半同步复制时等待应答的最长等待时间默认是10秒可以根据情况自行调整。第三行则是打开半同步复制的开关。在第二行查看系统参数时最后的一个参数rpl_semi_sync_master_wait_point其实表示一种半同步复制的方式。半同步复制有两种方式一种是我们现在看到的这种默认的AFTER_SYNC方式。这种方式下主库把日志写入binlog并且复制给从库然后开始等待从库的响应。从库返回成功后主库再提交事务接着给客户端返回一个成功响应。而另一种方式是叫做AFTER_COMMIT方式。他不是默认的。这种方式在主库写入binlog后等待binlog复制到从库主库就提交自己的本地事务再等待从库返回给自己一个成功响应然后主库再给客户端返回响应。然后我们登陆从服务安装smeisync_slave模块 mysql install plugin rpl_semi_sync_slave soname semisync_slave.so; Query OK, 0 rows affected (0.01 sec)mysql show global variables like rpl_semi%; ---------------------------------------- | Variable_name | Value | ---------------------------------------- | rpl_semi_sync_slave_enabled | OFF | | rpl_semi_sync_slave_trace_level | 32 | ---------------------------------------- 2 rows in set, 1 warning (0.01 sec)mysql set global rpl_semi_sync_slave_enabled on; Query OK, 0 rows affected (0.00 sec)mysql show global variables like rpl_semi%; ---------------------------------------- | Variable_name | Value | ---------------------------------------- | rpl_semi_sync_slave_enabled | ON | | rpl_semi_sync_slave_trace_level | 32 | ---------------------------------------- 2 rows in set, 1 warning (0.00 sec)mysql stop slave; Query OK, 0 rows affected (0.01 sec)mysql start slave; Query OK, 0 rows affected (0.01 sec) slave端的安装过程基本差不多不过要注意下安装完slave端的半同步插件后需要重启下slave服务。我们要注意目前我们的这个MySQL主从集群是单向的也就是只能从主服务同步到从服务而从服务的数据表更是无法同步到主服务的。所以在这种架构下为了保证数据一致通常会需要保证数据只在主服务上写而从服务只进行数据读取。这个功能就是大名鼎鼎的读写分离。但是这里要注意下mysql主从本身是无法提供读写分离的服务的需要由业务自己来实现。这也是我们后面要学的ShardingSphere的一个重要功能。到这里可以看到在MySQL主从架构中是需要严格限制从服务的数据写入的一旦从服务有数据写入就会造成数据不一致。并且从服务在执行事务期间还很容易造成数据同步失败。如果需要限制用户写数据我们可以在从服务中将read_only参数的值设为1( set global read_only1; )。这样就可以限制用户写入数据。但是这个属性有两个需要注意的地方 1、read_only1设置的只读模式不会影响slave同步复制的功能。所以在MySQL slave库中设定了read_only1后通过 show slave status\G 命令查看salve状态可以看到salve仍然会读取master上的日志并且在slave库中应用日志保证主从数据库同步一致 2、read_only1设置的只读模式限定的是普通用户进行数据修改的操作但不会限定具有super权限的用户的数据修改操作。在MySQL中设置read_only1后普通的应用用户进行insert、update、delete等会产生数据变化的DML操作时都会报出数据库处于只读模式不能发生数据变化的错误但具有super权限的用户例如在本地或远程通过root用户登录到数据库还是可以进行数据变化的DML操作如果需要限定super权限的用户写数据可以设置super_read_only0。另外如果要想连super权限用户的写操作也禁止就使用flush tables with read lock;这样设置也会阻止主从同步复制 5扩展 MySQL高可用方案我们之前的MySQL服务集群都是使用MySQL自身的功能来搭建的集群。但是这样的集群不具备高可用的功能。即如果是MySQL主服务挂了从服务是没办法自动切换成主服务的。而如果要实现MySQL的高可用需要借助一些第三方工具来实现。这一部分方案只需要了解即可因为一方面这些高可用方案通常都是运维需要考虑的事情作为开发人员没有必要花费太多的时间精力偶尔需要用到的时候能够用起来就够了。另一方面随着业界技术的不断推进也会冒出更多的新方案。例如ShardingSphere的5.x版本的目标实际上就是将ShardingSphere由一个数据库中间件升级成一个独立的数据库平台而将MySQL、PostGreSql甚至是RocksDB这些组件作为数据库的后端支撑。等到新版本成熟时又会冒出更多新的高可用方案。常见的MySQL集群方案有三种: MMM、MHA、MGR。这三种高可用框架都有一些共同点对主从复制集群中的Master节点进行监控自动的对Master进行迁移通过VIP。重新配置集群中的其它slave对新的Master进行同步 1》MMM MMM(Master-Master replication managerfor MysqlMysql主主复制管理器)是一套由Perl语言实现的脚本程序可以对mysql集群进行监控和故障迁移。他需要两个Master同一时间只有一个Master对外提供服务可以说是主备模式。他是通过一个VIP(虚拟IP)的机制来保证集群的高可用。整个集群中在主节点上会通过一个VIP地址来提供数据读写服务而当出现故障时VIP就会从原来的主节点漂移到其他节点由其他节点提供服务。优点提供了读写VIP的配置使读写请求都可以达到高可用工具包相对比较完善不需要额外的开发脚本完成故障转移之后可以对MySQL集群进行高可用监控缺点故障简单粗暴容易丢失事务建议采用半同步复制方式减少失败的概率目前MMM社区已经缺少维护不支持基于GTID的复制适用场景读写都需要高可用的基于日志点的复制方式 2》MHA Master High Availability Manager and Tools for MySQL。是由日本人开发的一个基于Perl脚本写的工具。这个工具专门用于监控主库的状态当发现master节点故障时会提升其中拥有新数据的slave节点成为新的master节点在此期间MHA会通过其他从节点获取额外的信息来避免数据一致性方面的问题。MHA还提供了mater节点的在线切换功能即按需切换master-slave节点。MHA能够在30秒内实现故障切换并能在故障切换过程中最大程度的保证数据一致性。在淘宝内部也有一个相似的TMHA产品。 MHA是需要单独部署的分为Manager节点和Node节点两种节点。其中Manager节点一般是单独部署的一台机器。而Node节点一般是部署在每台MySQL机器上的。 Node节点得通过解析各个MySQL的日志来进行一些操作。 Manager节点会通过探测集群里的Node节点去判断各个Node所在机器上的MySQL运行是否正常如果发现某个Master故障了就直接把他的一个Slave提升为Master然后让其他Slave都挂到新的Master上去完全透明。优点 MHA除了支持日志点的复制还支持GTID的方式同MMM相比MHA会尝试从旧的Master中恢复旧的二进制日志只是未必每次都能成功。如果希望更少的数据丢失场景建议使用MHA架构。缺点 MHA需要自行开发VIP转移脚本。 MHA只监控Master的状态未监控Slave的状态 3》MGR MGRMySQL Group Replication。是MySQL官方在5.7.17版本正式推出的一种组复制机制。主要是解决传统异步复制和半同步复制的数据一致性问题。由若干个节点共同组成一个复制组一个事务提交后必须经过超过半数节点的决议并通过后才可以提交。引入组复制主要是为了解决传统异步复制和半同步复制可能产生数据不一致的问题。MGR依靠分布式一致性协议(Paxos协议的一个变体)实现了分布式下数据的最终一致性提供了真正的数据高可用方案(方案落地后是否可靠还有待商榷)。支持多主模式但官方推荐单主模式多主模式下客户端可以随机向MySQL节点写入数据单主模式下MGR集群会选出primary节点负责写请求primary节点与其它节点都可以进行读请求处理. 优点高一致性基于原生复制及paxos协议的组复制技术并以插件的方式提供提供一致数据安全保证高容错性只要不是大多数节点坏掉就可以继续工作有自动检测机制当不同节点产生资源争用冲突时不会出现错误按照先到者优先原则进行处理并且内置了自动化脑裂防护机制高扩展性节点的新增和移除都是自动的新节点加入后会自动从其他节点上同步状态直到新节点和其他节点保持一致如果某节点被移除了其他节点自动更新组信息自动维护新的组信息高灵活性有单主模式和多主模式单主模式下会自动选主所有更新操作都在主上进行多主模式下所有server都可以同时处理更新操作。缺点: 仅支持InnoDB引擎并且每张表一定要有一个主键用于做write set的冲突检测必须打开GTID特性二进制日志格式必须设置为ROW用于选主与write set主从状态信息存于表中--master-info-repositoryTABLE 、--relay-log-info-repositoryTABLE--log-slave-updates打开COMMIT可能会导致失败类似于快照事务隔离级别的失败场景目前一个MGR集群最多支持9个节点不支持外键于save point特性无法做全局间的约束检测与部分事务回滚适用的业务场景对主从延迟比较敏感希望对对写服务提供高可用又不想安装第三方软件数据强一致的场景 2、应用层提供管理多个数据源的能力当我们有了集群化的后端数据库之后接下来在应用层面就需要能够随意访问多个数据库的能力。多数据源访问的实现方式有很多例如基于Spring提供的AbstractRoutingDataSource组件我们就可以快速切换后端访问的实际数据库。具体代码详见课程配套示例的DynamicDS模块。在示例中我们可以配置两个不同的目标数据库然后通过DynamicDataSource组件中的一个ThreadLocal变量实现快速切换目标数据库从而让CreateCourse创建课程信息接口与QueryCourse查询课程接口分别操作两个不同的数据库。 3、数据库与应用结合实现数据库集群管理将DynamicDS模块后端的数据库指向我们之前搭建的数据库主从集群就可以实现这样一种很有趣的实现方式由于主库与从库之间可以同步数据虽然CreateCourse创建课程接口与QueryCourse查询课程接口是访问的不同的数据库但是由于两个数据库之间可以通过主从集群进行数据同步所以看起来课程管理的两个接口就像是访问同一个数据库一样。这其实就是对于数据库非常常见的一种分布式的优化方案读写分离。数据库读写分离是一种常见的数据库优化方案其基础思想是将对数据的读请求和写请求分别分配到不同的数据库服务器上以提高系统的性能和可扩展性。一般情况下数据库的读操作比写操作更为频繁而且读操作并不会对数据进行修改因此可以将读请求分配到多个从数据库服务器上进行处理。这样即使一个从数据库服务器故障或者过载仍然可以使用其他从数据库服务器来处理读请求保证系统的稳定性和可用性。同时将写操作分配到主数据库服务器上可以保证数据的一致性和可靠性。主数据库服务器负责所有的写操作而从数据库服务器只需要从主数据库服务器同步数据即可。由于主数据库服务器是唯一的写入点可以保证数据的正确性和一致性。读写分离只是数据库由单机服务升级为集群服务后带来的一个比较简单的业务场景。在这个过程中只需要考虑切换数据库而并不需要关注SQL以及数据是什么样子的。未来如果再涉及到对表数据的拆分就会遇到更多更复杂的业务场景。 4、将多个数据源抽象成一个统一的数据源在之前的示例中我们已经实现了读写分离这样一个集群化场景下最为常见的数据库管理方案。但是你会觉得之前的实现方式其实对开发方式的侵入是挺大的每次进行数据库操作之前都需要先选择要操作那个数据库。有没有更为自然的多数据源管理方式呢就是让业务真正像操作单数据源一样访问多个数据。这问题其实也已经有人帮我们想到了。MyBatis-Plus框架的开发者就开发了这样的一个框架DynamicDataSource可以简化多数据源访问的过程。具体参见课程配套示例的DynamicDataSource模块。这个开源的DynamicDataSource小框架会自行在Spring容器当中注册一个具备多数据源切换能力的DataSource数据源这样在应用层面只需要按照DynamicDataSource框架的要求修改配置接口其他地方几乎感知不到与传统操作单数据源有什么区别。这也就是说应用只需要像访问单个数据源一样访问DynamicDataSource框架提供的一个逻辑数据库。而这个逻辑数据库会帮我们将实际的SQL语句转发到后面的真实数据库当中去执行。这种通过逻辑库来简化应用访问逻辑的方式其实也是ShardingSphere需要做的事情。只不过ShardingSphere提供的逻辑库功能会比我们这个简单的示例要强大很多也复杂很多。四、章节总结-重要这一章节我们做了大量的实验同时也构建了两个小应用来访问多个数据源。但是这些都不是这一章节的重点。我们真正的重点是希望你能通过这一系列的试验来理解我们即将要面对的分库分表到底是一个什么样复杂的场景。其实谈到分库分表往往很难在一开始引起程序员们的注意。大家往往会更关注于微服务、分布式缓存等这一类应用层的设计而数据库不过只是一个存储数据的工具而已。而这也造成了很多人即便用上了ShardingSphere这样的强大的分库分表工具但是也不敢用得太深。往往就把数据简单的拆分一下就结束了。但是实际上从我们这次的几个简单的示例中就能看到就只说读写分离这样一个最为简单的数据库集群化的业务场景也需要结合数据库产品以及应用层面一起做大量的调整以及优化才能形成一个很基础的解决方案。再结合一开始分析的分库分表需要面临的其他更复杂的问题你可能更容易理解真实的分库分表是一个什么样的业务场景。后续的章节我将会带你学习ShardingSphere这个非常强大的分库分表框架。但是希望你能够明白框架虽然很强大但是我们需要面对的问题也非常复杂。与MQ、微服务等场景不同在分库分表这个业务场景下ShardingSphere只是一个基础的工具他能帮我们解决很多应用中最为常见的问题。但是这并不是全部。后续学习ShardingSphere的时候我不希望你只是把他当成是一个框架来学习而更希望他是你的一个工具一个你解决分库分表各种稀奇古怪的问题时的一个可选项。并且做好一个思想准备当你在复杂业务场景下需要使用ShardingSphere进行分库分表时你遇到的很多问题大概率是无法直接用ShardingSphere解决的很多时候还是需要你自己对ShardingSphere做出扩展。

查看全文

http://www.pierceye.com/news/746706/