分布式存储之GlusterFS

阅读原文时间：2023年07月09日阅读：2

公众号关注「开源Linux」

回复「学习」，有我为您特别筛选的学习资料~

1.glusterfs概述

GlusterFS系统是一个可扩展的网络文件系统，相比其他分布式文件系统，GlusterFS具有高扩展性、高可用性、高性能、可横向扩展等特点，并且其没有元数据服务器的设计，让整个服务没有单点故障的隐患。

当客户端访问GlusterFS存储时，首先程序通过访问挂载点的形式读写数据，对于用户和程序而言，集群文件系统是透明的，用户和程序根本感觉不到文件系统是本地还是在远程服务器上。读写操作将会被交给VFS(Virtual File System)来处理，VFS会将请求交给FUSE内核模块，而FUSE又会通过设备/dev/fuse将数据交给GlusterFS Client。最后经过GlusterFS Client的计算，并最终经过网络将请求或数据发送到GlusterFS Server上。

2.glusterfs常用分布式简介

分布式卷也成为哈希卷，多个文件以文件为单位在多个brick上，使用哈希算法随机存储。

应用场景：大量小文件

优点：读/写性能好

缺点：如果存储或服务器故障，该brick上的数据将丢失

不指定卷类型，默认是分布式卷

brick数量没有限制

创建分布式卷命令：

gluster volume create volume_name node1:/data/br1 node2:/data/br1

复制卷是将多个文件在多个brick上复制多份，brick的数目要与需要复制的份数相等，建议brick分布在不同的服务器上。

应用场景：对可靠性高和读写性能要求高的场景

优点：读写性能好

缺点：写性能差

replica = brick

创建复制卷：

gluster volume create volume_name replica 2 node1:/data/br1 node2:/data/br1

replica：文件保存的份数

条带卷是将文件分成条带，存放在多个brick上，默认条带大小128k

应用场景：大文件

优点：适用于大文件存储

缺点：可靠性低，brick故障会导致数据全部丢失

stripe = birck

创建条带卷：

gluster volume create volume_name stripe 2 node1:/data/br1 node2:/data/br1

stripe：条带个数

分布式条带卷是将多个文件在多个节点哈希存储，每个文件再多分条带在多个brick上存储

应用场景：读/写性能高的大量大文件场景

优点：高并发支持

缺点：没有冗余，可靠性差

brick数是stripe的倍数

创建分布式条带卷：

gluster volume create volume_name stripe 2 node1:/data/br1 node2:/data/br1 node3:/data/br1 node4:/data/br1

分布式复制卷是将多个文件在多个节点上哈希存储，在多个brick复制多份存储。

应用场景：大量文件读和可靠性要求高的场景

优点：高可靠，读性能高

缺点：牺牲存储空间，写性能差

brick数量是replica的倍数

gluster volume create volume_name replica 2 node1:/data/br1 node2:/data/br1 node3:/data/br1 node4:/data/br1

条带式复制卷是将一个大文件存储的时候划分条带，并且保存多份

应用场景：超大文件，并且对可靠性要求高

优点：大文件存储，可靠性高

缺点：牺牲空间写性能差

brick数量是stripe、replica的乘积

gluster volume create volume_name stripe 2 replica 2 node1:/data/br1 node2:/data/br1 node3:/data/br1 node4:/data/br1

3.glusterfs环境

日志存储集群采用的是分布式复制卷，将多个文件在多个节点上哈希存储，在多个brick复制多份存储。共有五台服务器，磁盘空间共有90T，那么采用这种分布式复制卷的方式，只有45T磁盘空间可用。并且需要采用分布式复制卷方式需要要有双数的brick，所以现采用一台服务器上创建两个brick，如上图所示，10.102.23.4:/data_01/node和10.102.23.44:/data_01/node是备份关系，其他节点均是如此，10.102.23.44作为日志存储集群的管理节点，nfs-ganesha服务只需要安装在控制节点，客户端则可以通过nfs方式挂载。

#&nbsp;sed&nbsp;-i&nbsp;'s#SELINUX=enforcing#SELINUX=disabled#'&nbsp;/etc/sysconfig/selinux&nbsp;#关闭selinux

#&nbsp;iptables&nbsp;-F&nbsp;#清除防火墙规则

安装glusterfs(01-05)

#&nbsp;yum&nbsp;install&nbsp;userspace-rcu-*

#&nbsp;yum&nbsp;install&nbsp;python2-gluster-3.13.2-2.el7.x86_64.rpm

#&nbsp;yum&nbsp;install&nbsp;tcmu-runner-*&nbsp;libtcmu-*

#&nbsp;yum&nbsp;install&nbsp;gluster*

#&nbsp;yum&nbsp;install&nbsp;nfs-ganesha-*

#这个nfs只要需要对外挂载的哪台服务器需要安装（10.102.23.44）

#&nbsp;systemctl&nbsp;start&nbsp;glusterd.service&nbsp;#所有服务器启动glusterd

#&nbsp;systemctl&nbsp;start&nbsp;rpcbind

#&nbsp;systemctl&nbsp;enable&nbsp;glusterd.service

#&nbsp;systemctl&nbsp;enable&nbsp;rpcbind

#&nbsp;ss&nbsp;-lnt&nbsp;#查询端口是否有为24007，如果有则服务正常运行

创建集群(在10.102.23.44节点上执行一下操作，向集群中添加节点):

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;peer&nbsp;probe&nbsp;10.102.23.44

peer&nbsp;probe:&nbsp;success.&nbsp;[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;peer&nbsp;probe&nbsp;10.102.23.45

peer&nbsp;probe:&nbsp;success.

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;peer&nbsp;probe&nbsp;10.102.23.46

peer&nbsp;probe:&nbsp;success.

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;peer&nbsp;probe&nbsp;10.102.23.47

peer&nbsp;probe:&nbsp;success.

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;peer&nbsp;probe&nbsp;10.102.23.4

peer&nbsp;probe:&nbsp;success.

查看虚拟机信任状态添加结果

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;peer&nbsp;status

Number&nbsp;of&nbsp;Peers:&nbsp;4

Hostname:&nbsp;10.102.23.46

Uuid:&nbsp;31b5ecd4-c49c-4fa7-8757-c01604ffcc7e

State:&nbsp;Peer&nbsp;in&nbsp;Cluster&nbsp;(Connected)

&nbsp;&nbsp;

Hostname:&nbsp;10.102.23.47

Uuid:&nbsp;38a7fda9-ad4a-441a-b28f-a396b09606af

State:&nbsp;Peer&nbsp;in&nbsp;Cluster&nbsp;(Connected)

&nbsp;&nbsp;

Hostname:&nbsp;10.102.23.45

Uuid:&nbsp;9e3cfb56-1ed4-4daf-9d20-ad4bf2cefb37

State:&nbsp;Peer&nbsp;in&nbsp;Cluster&nbsp;(Connected)

&nbsp;&nbsp;

Hostname:&nbsp;10.102.23.4

Uuid:&nbsp;1836ae9a-eca5-444f-bb9c-20f032247bcb

State:&nbsp;Peer&nbsp;in&nbsp;Cluster&nbsp;(Connected)

在所有节点进行以下磁盘操作：

[root@admin-node&nbsp;~]#&nbsp;fdisk&nbsp;/dev/sdb

创建卷组:

[root@admin-node&nbsp;~]#&nbsp;vgcreate&nbsp;vg_data01&nbsp;/dev/sdb1&nbsp;/dev/sdc1&nbsp;/dev/sdd1&nbsp;/dev/sde1&nbsp;/dev/sdf1

[root@admin-node&nbsp;~]#&nbsp;vgcreate&nbsp;vg_data02&nbsp;/dev/sdg1&nbsp;/dev/sdh1&nbsp;/dev/sdi1&nbsp;/dev/sdj1&nbsp;/dev/sdk1

查看卷组:

[root@admin-node&nbsp;~]#&nbsp;vgdisplay

创建逻辑卷:

[root@admin-node&nbsp;~]#&nbsp;lvcreate&nbsp;-n&nbsp;lv_data01&nbsp;-L&nbsp;9TB&nbsp;vg_data01

[root@admin-node&nbsp;~]#&nbsp;lvcreate&nbsp;-n&nbsp;lv_data02&nbsp;-L&nbsp;9TB&nbsp;vg_data02

查看逻辑卷:

[root@admin-node&nbsp;~]#&nbsp;lvdisplay

格式化逻辑卷:

[root@admin-node&nbsp;~]#&nbsp;mkfs.xfs&nbsp;/dev/vg_data01/lv_data01

[root@admin-node&nbsp;~]#&nbsp;mkfs.xfs&nbsp;/dev/vg_data02/lv_data02

挂载逻辑卷:

[root@admin-node&nbsp;~]#&nbsp;mkdir&nbsp;-p&nbsp;/data_01/node&nbsp;/data_02/node

[root@admin-node&nbsp;~]#&nbsp;vim&nbsp;/etc/fstab

/dev/vg_data01/lv_data01&nbsp;/data_01&nbsp;xfs&nbsp;defaults&nbsp;0&nbsp;0

/dev/vg_data02/lv_data02&nbsp;/data_02&nbsp;xfs&nbsp;defaults&nbsp;0&nbsp;0

[root@admin-node&nbsp;~]#&nbsp;mount&nbsp;/data_01

[root@admin-node&nbsp;~]#&nbsp;mount&nbsp;/data_02

分布式复制模式（组合型）, 最少需要4台服务器才能创建。

创建卷:

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;volume&nbsp;create&nbsp;data-volume&nbsp;replica&nbsp;2&nbsp;&nbsp;&nbsp;10.102.23.4:/data_01/node&nbsp;&nbsp;10.102.23.44:/data_01/node&nbsp;&nbsp;10.102.23.44:/data_02/node&nbsp;10.102.23.45:/data_02/node&nbsp;&nbsp;10.102.23.45:/data_01/node&nbsp;&nbsp;10.102.23.4:/data_02/node&nbsp;10.102.23.46:/data_01/node&nbsp;&nbsp;10.102.23.47:/data_01/node&nbsp;&nbsp;10.102.23.46:/data_02/node&nbsp;&nbsp;10.102.23.47:/data_02/node&nbsp;force

启动创建的卷:

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;volume&nbsp;start&nbsp;data-volume

volume start: data-volume: success所有机器都可以查看:

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;volume&nbsp;info

查看分布式卷的状态：

[root@admin-node&nbsp;~]#&nbsp;gluster&nbsp;volume&nbsp;status

基于以上glusterfs部署，glusterfs分布式复制卷已经完成

4.nfs-ganesha环境搭建

glusterfs服务本身也是支持nfs挂载，由于现有生产环境存在多个网段，并且有些网段与glusterfs存储服务器网段是不通，所以需要通过nginx代理nfs来实现nfs挂载。Glusterfs服务只是支持nfs3版本的挂载，在通过nginx代理方面也不是那么方便，端口繁多，所以glusterfs与NFSs-Ganesha是完美组合。NFSs-Ganesha 通过FSAL(文件系统抽象层)将一个后端存储抽象成一个统一的API，提供给Ganesha服务端，然后通过NFS协议将其挂载到客户端。在客户端上对挂出来的空间进行操作。并且NFSs-Ganesha 可以指定nfs的版本。

在管理节点10.102.23.44上安装nfs-ganesha，在一开始部署glusterfs已在管理节点上安装，这里就不重复说明了，直接简要说明配置文件

[root@admin-node&nbsp;~]#&nbsp;vim&nbsp;/etc/ganesha/ganesha.conf

.....................................

EXPORT

{

##&nbsp;Export&nbsp;Id&nbsp;(mandatory,&nbsp;each&nbsp;EXPORT&nbsp;must&nbsp;have&nbsp;a&nbsp;unique&nbsp;Export_Id)

#Export_Id&nbsp;=&nbsp;12345;

Export_Id&nbsp;=&nbsp;10;

&nbsp;&nbsp;

##&nbsp;Exported&nbsp;path&nbsp;(mandatory)

#Path&nbsp;=&nbsp;/nonexistant;

Path&nbsp;=&nbsp;/data01;

&nbsp;&nbsp;

##&nbsp;Pseudo&nbsp;Path&nbsp;(required&nbsp;for&nbsp;NFSv4&nbsp;or&nbsp;if&nbsp;mount_path_pseudo&nbsp;=&nbsp;true)

#Pseudo&nbsp;=&nbsp;/nonexistant;

Pseudo&nbsp;=&nbsp;/data01;&nbsp;#客户端通过nfs挂载的根目录

&nbsp;&nbsp;

##&nbsp;Restrict&nbsp;the&nbsp;protocols&nbsp;that&nbsp;may&nbsp;use&nbsp;this&nbsp;export.&nbsp;This&nbsp;cannot&nbsp;allow

##&nbsp;access&nbsp;that&nbsp;is&nbsp;denied&nbsp;in&nbsp;NFS_CORE_PARAM.

#Protocols&nbsp;=&nbsp;3,4;

Protocols&nbsp;=&nbsp;4;&nbsp;#客户端nfs挂载的版本

&nbsp;&nbsp;

##&nbsp;Access&nbsp;type&nbsp;for&nbsp;clients.&nbsp;Default&nbsp;is&nbsp;None,&nbsp;so&nbsp;some&nbsp;access&nbsp;must&nbsp;be

##&nbsp;given.&nbsp;It&nbsp;can&nbsp;be&nbsp;here,&nbsp;in&nbsp;the&nbsp;EXPORT_DEFAULTS,&nbsp;or&nbsp;in&nbsp;a&nbsp;CLIENT&nbsp;block

#Access_Type&nbsp;=&nbsp;RW;

Access_Type&nbsp;=&nbsp;RW;&nbsp;#权限问题

&nbsp;&nbsp;

##&nbsp;Whether&nbsp;to&nbsp;squash&nbsp;various&nbsp;users.

#Squash&nbsp;=&nbsp;root_squash;

Squash&nbsp;=&nbsp;No_root_squash;&nbsp;#root降级

&nbsp;&nbsp;

##&nbsp;Allowed&nbsp;security&nbsp;types&nbsp;for&nbsp;this&nbsp;export

#Sectype&nbsp;=&nbsp;sys,krb5,krb5i,krb5p;

Sectype&nbsp;=&nbsp;sys;&nbsp;#类型

&nbsp;&nbsp;

##&nbsp;Exporting&nbsp;FSAL

#FSAL&nbsp;{

#Name&nbsp;=&nbsp;VFS;

#}

FSAL&nbsp;{

Name&nbsp;=&nbsp;GLUSTER;

hostname&nbsp;=&nbsp;"10.102.23.44";&nbsp;#glusterfs管理节点IP

volume&nbsp;=&nbsp;"data-volume";&nbsp;#glusterfs卷名

}

}

...................

[root@admin-node&nbsp;~]#&nbsp;systemctl&nbsp;restart&nbsp;nfs-ganesha

[root@admin-node&nbsp;~]#&nbsp;systemctl&nbsp;enable&nbsp;nfs-ganesha

[root@admin-node&nbsp;~]#&nbsp;showmount&nbsp;-e&nbsp;10.102.23.44

Export&nbsp;list&nbsp;for&nbsp;10.102.23.44:&nbsp;#nfs-ganesha搭建成功

5.客户端挂载

以glusterfs方式挂载:

[root@admin-node&nbsp;~]#&nbsp;mkdir&nbsp;/logs

[root@admin-node&nbsp;~]#&nbsp;mount&nbsp;-t&nbsp;glusterfs&nbsp;10.102.23.44:data-volume&nbsp;/logs/

以NFS方式进行挂载：

在客户端(10.1.99段):

[root@moban-00&nbsp;~]#yum&nbsp;-y&nbsp;install&nbsp;nfs-utils&nbsp;rpcbind

[root@moban-00&nbsp;~]#&nbsp;systemctl&nbsp;start&nbsp;rpcbind

[root@moban-00&nbsp;~]#&nbsp;systemctl&nbsp;enable&nbsp;rpcbind

[root@moban-00&nbsp;~]#&nbsp;mkdir&nbsp;/home/dwweiyinwen/logs/

[root@moban-00&nbsp;~]#&nbsp;mount&nbsp;-t&nbsp;nfs&nbsp;-o&nbsp;vers=4,proto=tcp,port=2049&nbsp;10.102.23.44:/data01&nbsp;/home/dwweiyinwen/logs/

_原文链接：https://www.jianshu.com/p/4b7d7a262980_

关注「开源Linux」加星标，提升IT技能

手机扫一扫

移动阅读更方便

你可能感兴趣的文章

[kubernetes]二进制部署k8s集群

K8s部署轻量级日志收集系统EFK（elasticsear + filebeat + kibana）

cephadm快速部署指定版本ceph集群及生产问题处理

prometheus 监控实战篇

文心一言 VS 讯飞星火 VS chatgpt （87）-- 算法导论8.2 4题

K8S 证书详解(认证)

云原生 | 企业内使用 CoreDNS 构建高性能、插件化的DNS服务器

基于velero及minio实现etcd数据备份与恢复

Ceph-部署

【NestJS系列】连接数据库及优雅地处理响应