企业展示网站模板,兰州市城市建设设计院官方网站,网站后台怎么上传表格,网站规划与设计案例Ceph分布式存储系统 一、存储基础1、单机存储设备2、单机存储的问题 二、分布式存储#xff08;软件定义的存储SDS#xff09;1、分布式存储介绍2、分布式存储的类型3、Ceph简介4、Ceph优势5、Ceph架构6、Ceph核心组件7、OSD存储后端8、Ceph 数据的存储过程9、Ceph 版本发行生… Ceph分布式存储系统 一、存储基础1、单机存储设备2、单机存储的问题 二、分布式存储软件定义的存储SDS1、分布式存储介绍2、分布式存储的类型3、Ceph简介4、Ceph优势5、Ceph架构6、Ceph核心组件7、OSD存储后端8、Ceph 数据的存储过程9、Ceph 版本发行生命周期10、Ceph集群部署 三、 基于 ceph-deploy 部署 Ceph 集群1、Ceph 生产环境推荐2、Ceph 环境规划3、环境准备4、Ceph初始化部署5、 Ceph 集群部署6、资源池 Pool 管理 一、存储基础
1、单机存储设备 DAS直接附加存储是直接接到计算机的主板总线上去的存储 IDE、SATA、SCSI、SAS、USB接口的磁盘所谓接口就是一种存储设备驱动下的磁盘设备提供块级别的存储 NAS网络附加存储是通过网络附加到当前主机文件系统之上的存储 NFS、CIFS、FTP文件系统级别的存储本身就是一个做好的文件系统通过nfs接口在用户空间输出后客户端基于内核模块与远程主机进行网络通信把它转为好像本地文件系统一样来使用这种存储服务是没办法对它再一次格式化创建文件系统块的 SAN存储区域网络 SCSI协议只是用来传输数据的存取操作物理层使用SCSI线缆来传输、FCSAN物理层使用光纤来传输、ISCSI物理层使用以太网传输也是一种网络存储但不同之处在于SAN提供给客户端主机使用的接口是块级别的存储
2、单机存储的问题 存储处理能力不足 传统的IDE的IO值是100次/秒SATA固态磁盘500次/秒。固态硬盘达到2000-4000次/秒。即使磁盘的IO能力再扩大数十倍也不够抗住网站访问高峰期数十万、数百万甚至上亿用户的同时访问这同时还要受到主机网络IO能力的限制。 存储空间能力不足 单块磁盘的容量再大也无法满足用户的正常访问所需的数据容量限制 单点故障问题 单机存储数据存在单点故障问题
二、分布式存储软件定义的存储SDS
1、分布式存储介绍
Ceph、TFS、FastDFS、MooseFSMFS、HDFS、GlusterFSGFS存储机制会把数据分散存储到多个节点上具有高扩展性、高性能、高可用性等。
2、分布式存储的类型
块存储例如硬盘、一般是一个存储被一个服务器挂载使用适用于容器或虚拟机存储卷分配、日志存储、文件存储就是一个裸设备用于提供没有被组织过的存储空间底层以分块的方式来存储数据文件存储例如NFS解决块存储无法共享的问题可以一个存储被多个服务器同时挂载适用于目录结构的存储、日志存储是一种数据的组织存放接口一般是建立在块级别的存储结构上以文件形式来存储数据而文件的元数据和实际数据是分开存储的对象存储例如OSS。一个存储可以被多个服务同时访问具有块存储的高速读写能力也具有文件存储共享的特性。适用图片存储、视频存储基于API接口提供的文件存储每一个文件都是一个对象且文件大小各不相同的文件的元数据和实际数据是存放在一起的
3、Ceph简介
Ceph使用C语言开发是一个开放、自我修复和自我管理的开源分布式存储系统。具有高扩展性、高性能、高可靠性的优点。 Ceph目前已得到众多云计算厂商的支持并被广泛应用。RedHat及OpenStackKubernetes都可与Ceph整合以支持虚拟机镜像的后端存储 粗略估计我国70%-80%的云平台都将Ceph作为底层的存储平台由此可见Ceph俨然成为了开源云平台的标配。目前国内使用Ceph搭建分布式存储系统较为成功的企业有华为、阿里、中兴、华三、浪潮、中国移动、网易、360、星辰天合存储、杉岩数据等。
4、Ceph优势
高扩展性去中心化支持使用普通x86服务器支持上千个存储节点的规模支持TB到EB的扩展。高可靠性没有单点故障多数据副本自动管理自动修复。高性能摒弃了传统的集中式存储元数据寻址的方案采用CRUSH算法数据分布均衡并行度高。功能强大Ceph是个大一统的存储刺痛集块存储接口RBD、文件存储接口CephFS、对象存储接口RadosGW于一身因而适用于不同的应用场景。
5、Ceph架构
自下而上可以将Ceph系统分为四个层次
RADOS基础存储系统Reliab1eAutonomicDistributed object store即可靠的、自动化的、分布式的对象存储是Ceph最底层的功能模块是一个无线可扩容的对象存储服务能将文件拆解成无数个对象碎片存放在硬盘中大大提高了数据的稳定性。它主要由OSD和Monitor两个组件组成OSD和Monitor都可以部署在多台服务器中这就是ceph分布式的由来高扩展性的由来。LIBRADOS基础库提供了与RADOS进行交互的方式并向上层应用提供Ceph服务的API接口因此上层的RDB、RGW和CephFS都是通过Librados访问的目前提供PHP、Ruby、Java、Python、Go、C和C支持以便直接基于RADOS而不是整个Ceph进行客户端应用开发。高层应用接口包括了三个部分 对象存储接口 RGWRADOS Gateway网关接口基于Librados开发的对象存储系统提供S3和Swift兼容的RESTful API接口。块存储接口 RBDReliable Block Device基于Librados提供块设备接口主要用于Host/VM。文件存储接口 CephFSCeph File SystemCeph文件系统提供了一个符合POSIX标准的文件系统它使用Ceph存储集群在文件系统上存储用户数据。基于Librados提供的分布式文件系统接口。 应用层基于高层接口或者基础库Librados开发出来的各种APP或者Host、VM等诸多客户端
6、Ceph核心组件
Ceph是一个对象式存储系统它把每一个待管理的数据流如文件等数据切分为一到多个固定大小默认4兆的对象数据Object并以其为原子单元原子是构成元素的最小单元完成数据的读写。 OSDObject Storage Daemon守护进程 ceph-osd 是负责物理存储的进程一般配置成和磁盘一一对应一块磁盘启动一个OSD进程。主要功能是存储数据、复制数据、平衡数据、恢复数据以及与其它OSD间进行心跳检查负责响应客户端请求返回具体数据的进程等。通常至少需要3个OSD来实现冗余和高可用性。 PGPlacement Group 归置组 PG 是一个虚拟的概念而已物理上不真实存在。它在数据寻址时类似于数据库中的索引Ceph 先将每个对象数据通过HASH算法固定映射到一个 PG 中然后将 PG 通过 CRUSH 算法映射到 OSD。 Pool Pool 是存储对象的逻辑分区它起到 namespace 的作用。每个 Pool 包含一定数量可配置的 PG。Pool 可以做故障隔离域根据不同的用户场景统一进行隔离。 Pool中数据保存方式支持两种类型 多副本replicated类似 raid1一个对象数据默认保存 3 个副本放在不同的 OSD纠删码Erasure Code类似 raid5对 CPU 消耗稍大但是节约磁盘空间对象数据保存只有 1 个副本。由于Ceph部分功能不支持纠删码池此类型存储池使用不多 Pool、PG 和 OSD 的关系 一个Pool里有很多个PG一个PG里包含一堆对象一个对象只能属于一个PGPG有主从之分一个PG分布在不同的OSD上针对多副本类型 Monitor守护进程 ceph-mon 用来保存OSD的元数据。负责维护集群状态的映射视图Cluster MapOSD Map、Monitor Map、PG Map 和 CRUSH Map维护展示集群状态的各种图表 管理集群客户端认证与授权。一个Ceph集群通常至少需要 3 或 5 个奇数个Monitor 节点才能实现冗余和高可用性它们通过 Paxos 协议实现节点间的同步数据。 Manager守护进程 ceph-mgr 负责跟踪运行时指标和 Ceph 集群的当前状态包括存储利用率、当前性能指标和系统负载。为外部监视和管理系统提供额外的监视和接口例如 zabbix、prometheus、 cephmetrics 等。一个 Ceph 集群通常至少需要 2 个 mgr 节点实现高可用性基于 raft 协议实现节点间的信息同步。 MDSMetadata Server守护进程 ceph-mds 是 CephFS 服务依赖的元数据服务。负责保存文件系统的元数据管理目录结构。对象存储和块设备存储不需要元数据服务如果不使用 CephFS 可以不安装。
7、OSD存储后端
OSD 有两种方式管理它们存储的数据。在 Luminous 12.2.z 及以后的发行版中默认也是推荐的后端是 BlueStore。在 Luminous 发布之前 默认是 FileStore 也是唯一的选项。 Filestore FileStore是在Ceph中存储对象的一个遗留方法。它依赖于一个标准文件系统只能是XFS)并结合一个键/值数据库传统上是LevelDB现在BlueStore是RocksDB用于保存和管理元数据。 FileStore经过了良好的测试在生产中得到了广泛的应用。然而由于它的总体设计和对传统文件系统的依赖使得它在性能上存在许多不足。 Bluestore BlueStore是一个特殊用途的存储后端专门为OSD工作负载管理磁盘上的数据而设计。BlueStore 的设计是基于十年来支持和管理 Filestore 的经验。BlueStore 相较于 Filestore具有更好的读写性能和安全性。
BlueStore 的主要功能包括
BlueStore直接管理存储设备即直接使用原始块设备或分区管理磁盘上的数据。这样就避免了抽象层的介入例如本地文件系统如XFS)因为抽象层会限制性能或增加复杂性。BlueStore使用RocksDB进行元数据管理。RocksDB的键/值数据库是嵌入式的以便管理内部元数据包括将对象名称映射到磁盘上的块位置。写入BlueStore的所有数据和元数据都受一个或多个校验和的保护。未经验证不会从磁盘读取或返回给用户任何数据或元数据。支持内联压缩。数据在写入磁盘之前可以选择性地进行压缩。支持多设备元数据分层。BlueStore允许将其内部日志WAL预写日志写入单独的高速设备如SSD、NVMe或NVDIMM)以提高性能。如果有大量更快的可用存储则可以将内部元数据存储在更快的设备上。支持高效的写时复制。RBD和CephFS快照依赖于在BlueStore中有效实现的即写即复制克隆机制。这将为常规快照和擦除编码池依赖克隆实现高效的两阶段提交带来高效的I/O。
8、Ceph 数据的存储过程 客户端从 mon 获取最新的 Cluster Map 在 Ceph 中一切皆对象。Ceph 存储的数据都会被切分成为一到多个固定大小的对象Object。Object size 大小可以由管理员调整通常为 2M 或 4M。 每个对象都会有一个唯一的 OID由 ino 与 ono 组成 ino 即是文件的 FileID用于在全局唯一标识每一个文件ono 则是分片的编号 比如一个文件 FileID 为 A它被切成了两个对象一个对象编号0另一个编号1那么这两个文件的 oid 则为 A0 与 A1。 OID 的好处是可以唯一标示每个不同的对象并且存储了对象与文件的从属关系。由于 Ceph 的所有数据都虚拟成了整齐划一的对象所以在读写时效率都会比较高。 通过对 OID 使用 HASH 算法得到一个16进制的特征码用特征码与 Pool 中的 PG 总数取余得到的序号则是 PGID 。 即 Pool_ID HASH(OID) % PG_NUM 得到 PGID PG 会根据设置的副本数量进行复制通过对 PGID 使用 CRUSH 算法算出 PG 中目标主和次 OSD 的 ID存储到不同的 OSD 节点上其实是把 PG 中的所有对象存储到 OSD 上。 即通过 CRUSH(PGID) 得到将 PG 中的数据存储到各个 OSD 组中 CRUSH 是 Ceph 使用的数据分布算法类似一致性哈希让数据分配到预期的地方。
9、Ceph 版本发行生命周期
Ceph从Nautilus版本14.2.0开始每年都会有一个新的稳定版发行预计是每年的3月份发布每年的新版本都会起一个新的名称例如“Mimic”和一个主版本号例如13代表Mimic因为“M”是字母表的第13个字母。
版本号的格式为 x.y.zx 表示发布周期例如13 代表 Mimic17 代表 Quincyy 表示发布版本类型即
x.0.z y等于 0表示开发版本x.1.z y等于 1表示发布候选版本用于测试集群x.2.z y等于 2表示稳定/错误修复版本针对用户
10、Ceph集群部署
目前 Ceph 官方提供很多种部署 Ceph 集群的方法常用的分别是 ceph-deploycephadm 和 二进制 ceph-deploy 一个集群自动化部署工具使用较久成熟稳定被很多自动化工具所集成可用于生产部署。 cephadm 从 Octopus 和较新的版本版本后使用 cephadm 来部署 ceph 集群使用容器和 systemd 安装和管理 Ceph 集群。目前不建议用于生产环境。 二进制手动部署一步步部署 Ceph 集群支持较多定制化和了解部署细节安装难度较大。
三、 基于 ceph-deploy 部署 Ceph 集群
1、Ceph 生产环境推荐
存储集群全采用万兆网络集群网络cluster-network用于集群内部通讯与公共网络public-network用于外部访问Ceph集群分离mon、mds 与 osd 分离部署在不同主机上测试环境中可以让一台主机节点运行多个组件OSD 使用 SATA 亦可根据容量规划集群至强E5 2620 V3或以上 CPU64GB或更高内存集群主机分散部署避免机柜的电源或者网络故障
2、Ceph 环境规划
主机名 Public网络 Cluster网络 角色 admin 192.168.154.11 admin管理节点负责集群整体部署、client node01 192.168.154.12 192.168.100.12 mon、mgr、osd/dev/sdb、/dev/sdc、/dev/sdd node02 192.168.154.13 192.168.100.13 mon、mgr、osd/dev/sdb、/dev/sdc、/dev/sdd node03 192.168.154.14 192.168.100.14 mon、osd/dev/sdb、/dev/sdc、/dev/sdd client 192.168.154.15 client
3、环境准备
可选步骤创建 Ceph 的管理用户 useradd cephadm passwd cephadm
visudo cephadm ALL(root) NOPASSWD:ALL
4、Ceph初始化部署
关闭 selinux 与防火墙
systemctl disable --now firewalld
setenforce 0
sed -i s/enforcing/disabled/ /etc/selinux/config根据规划设置主机名
hostnamectl set-hostname admin
hostnamectl set-hostname node01
hostnamectl set-hostname node02
hostnamectl set-hostname node03
hostnamectl set-hostname client配置 hosts 解析
cat /etc/hosts EOF
192.168.154.11 admin
192.168.154.12 node01
192.168.154.13 node02
192.168.154.14 node03
192.168.154.15 client
EOF安装常用软件和依赖包三个节点
yum -y install epel-release
yum -y install yum-plugin-priorities yum-utils ntpdate python-setuptools python-pip gcc gcc-c autoconf libjpeg libjpeg-devel libpng libpng-devel freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel glibc glibc-devel glib2 glib2-devel bzip2 bzip2-devel zip unzip ncurses ncurses-devel curl curl-devel e2fsprogs e2fsprogs-devel krb5-devel libidn libidn-devel openssl openssh openssl-devel nss_ldap openldap openldap-devel openldap-clients openldap-servers libxslt-devel libevent-devel ntp libtool-ltdl bison libtool vim-enhanced python wget lsof iptraf strace lrzsz kernel-devel kernel-headers pam-devel tcl tk cmake ncurses-devel bison setuptool popt-devel net-snmp screen perl-devel pcre-devel net-snmp screen tcpdump rsync sysstat man iptables sudo libconfig git bind-utils tmux elinks numactl iftop bwm-ng net-tools expect snappy leveldb gdisk python-argparse gperftools-libs conntrack ipset jq libseccomp socat chrony sshpass在 admin 管理节点配置 ssh 免密登录所有节点
ssh-keygen -t rsa -P -f ~/.ssh/id_rsa
sshpass -p abc1234 ssh-copy-id -o StrictHostKeyCheckingno rootadmin
sshpass -p abc1234 ssh-copy-id -o StrictHostKeyCheckingno rootnode01
sshpass -p abc1234 ssh-copy-id -o StrictHostKeyCheckingno rootnode02
sshpass -p abc1234 ssh-copy-id -o StrictHostKeyCheckingno rootnode03配置时间同步
systemctl enable --now chronyd
timedatectl set-ntp true #开启 NTP
timedatectl set-timezone Asia/Shanghai #设置时区
chronyc -a makestep #强制同步下系统时钟
timedatectl status #查看时间同步状态
chronyc sources -v #查看 ntp 源服务器信息
timedatectl set-local-rtc 0 #将当前的UTC时间写入硬件时钟#重启依赖于系统时间的服务
systemctl restart rsyslog
systemctl restart crond#关闭无关服务
systemctl disable --now postfix配置 Ceph yum源
wget https://download.ceph.com/rpm-nautilus/el7/noarch/ceph-release-1-1.el7.noarch.rpm --no-check-certificaterpm -ivh ceph-release-1-1.el7.noarch.rpm --force执行完上面所有的操作之后重启所有主机可选
sync
reboot5、 Ceph 集群部署
为所有节点都创建一个 Ceph 工作目录后续的工作都在该目录下进行
mkdir -p /etc/ceph安装 ceph-deploy 部署工具
cd /etc/ceph
yum install -y ceph-deployceph-deploy --version在管理节点为其它节点安装 Ceph 软件包
#ceph-deploy 2.0.1 默认部署的是 mimic 版的 Ceph若想安装其他版本的 Ceph可以用 --release 手动指定版本
cd /etc/ceph
ceph-deploy install --release nautilus node0{1..3} admin#ceph-deploy install 本质就是在执行下面的命令
yum clean all
yum -y install epel-release
yum -y install yum-plugin-priorities
yum -y install ceph-release ceph ceph-radosgw#也可采用手动安装 Ceph 包方式在其它节点上执行下面的命令将 Ceph 的安装包都部署上
sed -i s#download.ceph.com#mirrors.tuna.tsinghua.edu.cn/ceph# /etc/yum.repos.d/ceph.repo
yum install -y ceph-mon ceph-radosgw ceph-mds ceph-mgr ceph-osd ceph-common ceph生成初始配置
#在管理节点运行下述命令告诉 ceph-deploy 哪些是 mon 监控节点
cd /etc/ceph
ceph-deploy new --public-network 192.168.80.0/24 --cluster-network 192.168.100.0/24 node01 node02 node03#命令执行成功后会在 /etc/ceph 下生成配置文件
ls /etc/ceph
ceph.conf #ceph的配置文件
ceph-deploy-ceph.log #monitor的日志
ceph.mon.keyring #monitor的密钥环文件在管理节点初始化 mon 节点
cd /etc/ceph
ceph-deploy mon create node01 node02 node03 #创建 mon 节点由于 monitor 使用 Paxos 算法其高可用集群节点数量要求为大于等于 3 的奇数台ceph-deploy --overwrite-conf mon create-initial #配置初始化 mon 节点并向所有节点同步配置# --overwrite-conf 参数用于表示强制覆盖配置文件ceph-deploy gatherkeys node01 #可选操作向 node01 节点收集所有密钥#命令执行成功后会在 /etc/ceph 下生成配置文件
ls /etc/ceph
ceph.bootstrap-mds.keyring #引导启动 mds 的密钥文件
ceph.bootstrap-mgr.keyring #引导启动 mgr 的密钥文件
ceph.bootstrap-osd.keyring #引导启动 osd 的密钥文件
ceph.bootstrap-rgw.keyring #引导启动 rgw 的密钥文件
ceph.client.admin.keyring #ceph客户端和管理端通信的认证密钥拥有ceph集群的所有权限
ceph.conf
ceph-deploy-ceph.log
ceph.mon.keyring#在 mon 节点上查看自动开启的 mon 进程
ps aux | grep ceph
root 1823 0.0 0.2 189264 9216 ? Ss 19:46 0:00 /usr/bin/python2.7 /usr/bin/ceph-crash
ceph 3228 0.0 0.8 501244 33420 ? Ssl 21:08 0:00 /usr/bin/ceph-mon -f --cluster ceph --id node03 --setuser ceph --setgroupceph
root 3578 0.0 0.0 112824 988 pts/1 R 21:24 0:00 grep --colorauto ceph#在管理节点查看 Ceph 集群状态
cd /etc/ceph
ceph -scluster:id: 7e9848bb-909c-43fa-b36c-5805ffbbeb39health: HEALTH_WARNmons are allowing insecure global_id reclaimservices:mon: 3 daemons, quorum node01,node02,node03mgr: no daemons activeosd: 0 osds: 0 up, 0 indata:pools: 0 pools, 0 pgsobjects: 0 objects, 0 Busage: 0 B used, 0 B / 0 B availpgs:#查看 mon 集群选举的情况
ceph quorum_status --format json-pretty | grep leader
quorum_leader_name: node01,#扩容 mon 节点
ceph-deploy mon add 节点名称部署能够管理 Ceph 集群的节点可选
#可实现在各个节点执行 ceph 命令管理集群
cd /etc/ceph
ceph-deploy --overwrite-conf config push node01 node02 node03 #向所有 mon 节点同步配置确保所有 mon 节点上的 ceph.conf 内容必须一致ceph-deploy admin node01 node02 node03 #本质就是把 ceph.client.admin.keyring 集群认证文件拷贝到各个节点#在 mon 节点上查看
ls /etc/ceph
ceph.client.admin.keyring ceph.conf rbdmap tmpr8tzyccd /etc/ceph
ceph -s部署 osd 存储节点
#主机添加完硬盘后不要分区直接使用
lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 60G 0 disk
├─sda1 8:1 0 500M 0 part /boot
├─sda2 8:2 0 4G 0 part [SWAP]
└─sda3 8:3 0 55.5G 0 part /
sdb 8:16 0 20G 0 disk
sdc 8:32 0 20G 0 disk
sdd 8:48 0 20G 0 disk #如果是利旧的硬盘则需要先擦净删除分区表磁盘可选无数据的新硬盘可不做
cd /etc/ceph
ceph-deploy disk zap node01 /dev/sdb
ceph-deploy disk zap node02 /dev/sdb
ceph-deploy disk zap node03 /dev/sdb#添加 osd 节点
ceph-deploy --overwrite-conf osd create node01 --data /dev/sdb
ceph-deploy --overwrite-conf osd create node02 --data /dev/sdb
ceph-deploy --overwrite-conf osd create node03 --data /dev/sdb#查看 ceph 集群状态
ceph -scluster:id: 7e9848bb-909c-43fa-b36c-5805ffbbeb39health: HEALTH_WARNno avtive mgrservices:mon: 3 daemons, quorum node01,node02,node03 (age 119m)mgr: no daemons activeosd: 3 osds: 3 up (since 35s), 3 in (since 35s)data:pools: 0 pools, 0 pgsobjects: 0 objects, 0 Busage: 3.0 GiB used, 57 GiB / 60 GiB availpgs: ceph osd stat
ceph osd tree
rados df
ssh rootnode01 systemctl status ceph-osd0
ssh rootnode02 systemctl status ceph-osd1
ssh rootnode03 systemctl status ceph-osd2ceph osd status #查看 osd 状态需部署 mgr 后才能执行
-----------------------------------------------------------------------
| id | host | used | avail | wr ops | wr data | rd ops | rd data | state |
-----------------------------------------------------------------------
| 0 | node01 | 1025M | 18.9G | 0 | 0 | 0 | 0 | exists,up |
| 1 | node02 | 1025M | 18.9G | 0 | 0 | 0 | 0 | exists,up |
| 2 | node03 | 1025M | 18.9G | 0 | 0 | 0 | 0 | exists,up |
-----------------------------------------------------------------------ceph osd df #查看 osd 容量需部署 mgr 后才能执行
ID CLASS WEIGHT REWEIGHT SIZE RAW USE DATA OMAP META AVAIL %USE VAR PGS STATUS 0 hdd 0.01949 1.00000 20 GiB 1.0 GiB 1.8 MiB 0 B 1 GiB 19 GiB 5.01 1.00 0 up 1 hdd 0.01949 1.00000 20 GiB 1.0 GiB 1.8 MiB 0 B 1 GiB 19 GiB 5.01 1.00 0 up 2 hdd 0.01949 1.00000 20 GiB 1.0 GiB 1.8 MiB 0 B 1 GiB 19 GiB 5.01 1.00 0 up TOTAL 60 GiB 3.0 GiB 5.2 MiB 0 B 3 GiB 57 GiB 5.01
MIN/MAX VAR: 1.00/1.00 STDDEV: 0#扩容 osd 节点
cd /etc/ceph
ceph-deploy --overwrite-conf osd create node01 --data /dev/sdc
ceph-deploy --overwrite-conf osd create node02 --data /dev/sdc
ceph-deploy --overwrite-conf osd create node03 --data /dev/sdc
ceph-deploy --overwrite-conf osd create node01 --data /dev/sdd
ceph-deploy --overwrite-conf osd create node02 --data /dev/sdd
ceph-deploy --overwrite-conf osd create node03 --data /dev/sdd添加 OSD 中会涉及到 PG 的迁移由于此时集群并没有数据因此 health 的状态很快就变成 OK如果在生产环境中添加节点则会涉及到大量的数据的迁移。部署 mgr 节点
#ceph-mgr守护进程以Active/Standby模式运行可确保在Active节点或其ceph-mgr守护进程故障时其中的一个Standby实例可以在不中断服务的情况下接管其任务。根据官方的架构原则mgr至少要有两个节点来进行工作。
cd /etc/ceph
ceph-deploy mgr create node01 node02ceph -scluster:id: 7e9848bb-909c-43fa-b36c-5805ffbbeb39health: HEALTH_WARNmons are allowing insecure global_id reclaimservices:mon: 3 daemons, quorum node01,node02,node03mgr: node01(active, since 10s), standbys: node02osd: 0 osds: 0 up, 0 in#解决 HEALTH_WARN 问题mons are allowing insecure global_id reclaim问题
禁用不安全模式ceph config set mon auth_allow_insecure_global_id_reclaim false#扩容 mgr 节点
ceph-deploy mgr create 节点名称开启监控模块
#在 ceph-mgr Active节点执行命令开启
ceph -s | grep mgryum install -y ceph-mgr-dashboardcd /etc/cephceph mgr module ls | grep dashboard#开启 dashboard 模块
ceph mgr module enable dashboard --force#禁用 dashboard 的 ssl 功能
ceph config set mgr mgr/dashboard/ssl false#配置 dashboard 监听的地址和端口
ceph config set mgr mgr/dashboard/server_addr 0.0.0.0
ceph config set mgr mgr/dashboard/server_port 8000#重启 dashboard
ceph mgr module disable dashboard
ceph mgr module enable dashboard --force#确认访问 dashboard 的 url
ceph mgr services#设置 dashboard 账户以及密码
echo 12345678 dashboard_passwd.txt
ceph dashboard set-login-credentials admin -i dashboard_passwd.txt或
ceph dashboard ac-user-create admin administrator -i dashboard_passwd.txt浏览器访问http://192.168.80.11:8000 账号密码为 admin/123456786、资源池 Pool 管理
上面我们已经完成了 Ceph 集群的部署但是我们如何向 Ceph 中存储数据呢首先我们需要在 Ceph 中定义一个 Pool 资源池。Pool 是 Ceph 中存储 Object 对象抽象概念。我们可以将其理解为 Ceph 存储上划分的逻辑分区Pool 由多个 PG 组成而 PG 通过 CRUSH 算法映射到不同的 OSD 上同时 Pool 可以设置副本 size 大小默认副本数量为 3。
Ceph 客户端向 monitor 请求集群的状态并向 Pool 中写入数据数据根据 PGs 的数量通过 CRUSH 算法将其映射到不同的 OSD 节点上实现数据的存储。 这里我们可以把 Pool 理解为存储 Object 数据的逻辑单元当然当前集群没有资源池因此需要进行定义。
#创建一个 Pool 资源池其名字为 mypoolPGs 数量设置为 64设置 PGs 的同时还需要设置 PGP通常PGs和PGP的值是相同的
PG (Placement Group)pg 是一个虚拟的概念用于存放 objectPGP(Placement Group for Placement purpose)相当于是 pg 存放的一种 osd 排列组合
cd /etc/ceph
ceph osd pool create mypool 64 64#查看集群 Pool 信息
ceph osd pool ls 或 rados lspools
ceph osd lspools#查看资源池副本的数量
ceph osd pool get mypool size#查看 PG 和 PGP 数量
ceph osd pool get mypool pg_num
ceph osd pool get mypool pgp_num#修改 pg_num 和 pgp_num 的数量为 128
ceph osd pool set mypool pg_num 128
ceph osd pool set mypool pgp_num 128ceph osd pool get mypool pg_num
ceph osd pool get mypool pgp_num#修改 Pool 副本数量为 2
ceph osd pool set mypool size 2ceph osd pool get mypool size#修改默认副本数为 2
vim ceph.conf
......
osd_pool_default_size 2ceph-deploy --overwrite-conf config push node01 node02 node03#删除 Pool 资源池
1删除存储池命令存在数据丢失的风险Ceph 默认禁止此类操作需要管理员先在 ceph.conf 配置文件中开启支持删除存储池的操作
vim ceph.conf
......
[mon]
mon allow pool delete true2推送 ceph.conf 配置文件给所有 mon 节点
ceph-deploy --overwrite-conf config push node01 node02 node033所有 mon 节点重启 ceph-mon 服务
systemctl restart ceph-mon.target4执行删除 Pool 命令
ceph osd pool rm pool01 pool01 --yes-i-really-really-mean-it