云原生分布式文件存储 MinIO 教程
阅读原文时间:2023年07月09日阅读:2

文章转载自:https://mp.weixin.qq.com/s/_52kZ5jil1Cec98P5oozoA

MinIO 提供开源、高性能、兼容 s3 的对象存储,为每个公共云、每个 Kubernetes 发行版、私有云和边缘云中无缝运行,使其成为混合云和多云对象存储的领导者。

1. MinIO 的应用场景

MinIO 是一个基于 Apache License v2.0 开源协议的对象存储服务。它兼容亚马逊 S3 云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,而一个对象文件可以是任意大小,从 KB 到最大 TB 不等。

  • 网盘 : 海量文件
  • 社交网站:海量图片
  • 电商网站:海量商品图片
  • 视频网站:海量视频文件

对于中小型企业,如果不选择存储上云,那么 MinIO 是个不错的选择,麻雀虽小,五脏俱全。当然 MinIO 除了直接作为对象存储使用,还可以作为云上对象存储服务的网关层,无缝对接到 Amazon S3 等。

2. MinIO 的系统特点

  • MinIO 是全球领先的对象存储先锋,在标准硬件上,读/写速度上高达 183GB/s 和171GB/s,已经成为 Hadoop HDFS 的替代品。

  • MinIO 用作云原生应用程序的主要存储,与传统对象存储相比,云原生应用程序需要更高的吞吐量和更低的延迟。而这些都是 MinIO 能够达成的性能指标。

  • MinIO 一直秉承着 “简单可扩展” 的理念,为对象存储带来了一个简单的缩放模型。借助在此基础之上,可以实现 MinIO 从单个群集到其他 MinIO 群集联合使用的情况,并且在需要时可以跨越多个不同的数据中心。

  • MinIO 基于 Apache V2 license 的 100% 开放源代码的产品。

  • 客户能够自动的、无限制、自由免费使用和集成 MinIO、自由的创新和创造、 自由的去修改、自由的再次发行新的版本和软件。其部署的多样性使软件变得更加坚固,这是专有软件无法提供的。

  • 亚马逊云的 S3 API 是在全球范围内达到共识的对象存储的协议。

  • 当添加到数以百万计的私有云实例和广泛的边缘部署时,MinIO 是混合云的领导者。

  • 极简主义是 MinIO 的指导性设计原则。简单性减少了出错的机会,提高了正常运行时间,提供了可靠性,同时简单性又是性能的基础。

  • 只需下载一个二进制文件然后执行,即可在几分钟内安装和配置 MinIO。MinIO 升级是通过一个简单命令完成的,这个命令可以无中断的完成 MinIO 的升级,并且不需要停机即可完成升级操作。

3. MinIO 的基础概念

  • 一个对象存储在一个 Set
  • 一个集群划分为多个 Set
  • 一个 Set 中的 Drive 尽可能分布在不同的节点上
  • 一个 Set 包含的 Drive 数量是固定的,默认由系统根据集群规模自动计算

MinIO 使用 纠删码和校验和 机制来保证高可靠性,即便丢失一半数量(N/2)的硬盘,仍然可以恢复数据。纠删码是一种恢复丢失和损坏数据的数学算法,MinIO 采用 Reed-Solomon code 将对象拆分成 N/2 数据和 N/2 奇偶校验块。这就意味着如果是 12 块盘,一个对象会被分成 6 个数据块、6 个奇偶校验块,你可以丢失任意 6 块盘,仍可以从剩下的盘中的数据进行恢复。

纠删码的工作原理和 RAID 或者复制不同,像 RAID6 可以在损失两块盘的情况下不丢数据,而 MinIO 纠删码可以在丢失一半的盘的情况下,仍可以保证数据安全。而且 MinIO 纠删码是作用在对象级别,可以一次恢复一个对象,而 RAID 是作用在卷级别,数据恢复时间很长。MinIO 对每个对象单独编码,存储服务一经部署,通常情况下是不需要更换硬盘或者修复。MinIO 纠删码的设计目标是为了性能和尽可能的使用硬件加速。

文件对象上传到 MinIO 上面,会在对应的磁盘当中,以 Bucket 名称为目录,文件名称为下一级目录,文件名下是 part.1 和 xl.meta,前者是编码数据块及检验块,后者是元数据文件。

4. MinIO 的安装部署 - 单机

建议使用容器化安装和部署方式 - 简单和好用

需要注意的是,单机版本无法使用,版本控制、对象锁定和存储桶复制等功能。如果需要使用,是需要部署 带有纠删码的分布式 MinIO。对于扩展的开发和生产,请在启用擦除编码的情况下部署 MinIO - 特别是, 每个 MinIO 服务器最少 4 个驱动器。

  • 9000 端口为自带的 Web 网页入库

  • 9001 端口为使用 API 和客户端的连接口

    内嵌了一个MinIO的对象服务

    http://127.0.0.1:9000 (默认用户名和密码:minioadmin:minioadmin)

    $ docker run -d --name=minio-test <br /> -p 9000:9000 -p 9001:9001 <br /> quay.io/minio/minio server /data --console-address ":9001"

    启动时自定义用户和密码

    $ docker run -d --name=minio-test <br /> -p 9000:9000 -p 9001:9001 <br /> -e "MINIO_ROOT_USER=admin" <br /> -e "MINIO_ROOT_PASSWORD=12345678" <br /> quay.io/minio/minio server /data --console-address ":9001"

    MINIO_ROOT_USER length should be at least 3, and MINIO_ROOT_PASSWORD length at least 8 characters

    Windows系统启动

    $ docker run -d --name=minio-test <br /> -p 9000:9000 -p 9001:9001 <br /> -v D:\data:/data <br /> -e "MINIO_ROOT_USER=admin" <br /> -e "MINIO_ROOT_PASSWORD=12345678" <br /> quay.io/minio/minio server /data --console-address ":9001"

    在设置安全密钥的时候报错:Error response from daemon: This node is not a swarm manager. Use "docker swarm init" or "docker swarm join" to connect this node to swarm and try again.

    设置安全秘钥启动

    $ echo "admin" | docker secret create access_key -
    $ echo "123456" | docker secret create secret_key -

    使用docker-service的安全秘钥启动,

    $ docker service create --name="minio-service" <br /> --secret="access_key" --secret="secret_key" <br /> --env="MINIO_ROOT_USER_FILE=my_access_key" <br /> --env="MINIO_ROOT_PASSWORD_FILE=my_secret_key" <br /> quay.io/minio/minio server /data

  • 9000 端口为自带的 Web 网页入库

  • 9001 端口为使用 API 和客户端的连接口

    命令行启动

    $ mkdir -p /{data1,data2,data3,data4,data5,data6,data7,data8}

    $ minio server /data1 /data2 /data3 /data4 /data5 /data6 /data7 /data8

    容器启动

    $ docker run -d --name=minio-test <br /> -p 9000:9000 -p 9001:9001 <br /> -v /mnt/data1:/data1 <br /> -v /mnt/data2:/data2 <br /> -v /mnt/data3:/data3 <br /> -v /mnt/data4:/data4 <br /> -v /mnt/data5:/data5 <br /> -v /mnt/data6:/data6 <br /> -v /mnt/data7:/data7 <br /> -v /mnt/data8:/data8 <br /> quay.io/minio/minio server /data{1…8} --console-address ":9001"

  • 9000 端口为自带的 Web 网页入库

  • 9001 端口为使用 API 和客户端的连接口

    MacOS

    $ brew install minio/stable/minio
    $ minio server /data

    linux

    $ apt install minio
    $ minio server /data

  • 9000 端口为自带的 Web 网页入库

  • 9001 端口为使用 API 和客户端的连接口

    MacOS

    $ wget https://dl.min.io/server/minio/release/darwin-amd64/minio
    $ chmod +x minio
    $ ./minio server /data

    Windows

    $ wget https://dl.min.io/server/minio/release/windows-amd64/minio.exe
    $ minio.exe server D:</p>

    Linux

    $ wget https://dl.min.io/server/minio/release/linux-amd64/minio
    $ chmod +x minio
    $ ./minio server /data

    $ ufw allow 9000:9010/tcp
    $ firewall-cmd --get-active-zones
    $ firewall-cmd --zone=public --add-port=9000/tcp --permanent
    $ firewall-cmd --reload

5. MinIO 的安装部署 - 分布式

在大数据领域,通常的设计理念都是无中心和分布式。MinIO 也提供了分布式部署的方式,其好处在于,可以提供一个高可用的对象存储服务,确保数据不会丢失和一致。MinIO 在分布式和单机模式下,所有读写操作都严格遵守 read-after-write 一致性模型。

# 设置变量
$ export MINIO_ROOT_USER=<ACCESS_KEY>
$ export MINIO_ROOT_PASSWORD=<SECRET_KEY>

# 命令行启动方式格式
$ minio server http://host{1...n}/export{1...m}
$ minio server http://host{1...n}/export{1...m} http://host{o...z}/export{1...m}

# 命令行启动方式示例
minio server http://192.168.1.11/export1 http://192.168.1.12/export2 \
             http://192.168.1.13/export3 http://192.168.1.14/export4 \
             http://192.168.1.15/export5 http://192.168.1.16/export6 \
             http://192.168.1.17/export7 http://192.168.1.18/export8


version: '3.7'

services:
  minio:
    restart: on-failure
    container_name: app_minio
    image: quay.io/minio/minio:RELEASE.2021-11-09T03-21-45Z
    command: server /data --console-address ":9001"
    ports:
      - "80:9000"
      - "81:9001"
    volumes:
      - "/app_minio/data:/data"
    environment:
      MINIO_ROOT_USER: admin
      MINIO_ROOT_PASSWORD: 12345678
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:9000/minio/health/live"]
      interval: 30s
      timeout: 20s
      retries: 3
    networks:
      - app_minio_network

networks:
  app_minio_network:
  • helm minio charts

    安装MinIO的chart

    $ helm install stable/minio

    容器平台上面启动服务 - 单机

    $ helm install --name minio-release <br /> --namespace minio
    --set rootUser=rootuser,rootPassword=rootpass123
    --set persistence.size=100Gi <br /> stable/minio

    容器平台上面启动服务 - 分布式

    $ helm install --set mode=distributed stable/minio
    $ helm install --set mode=distributed,numberOfNodes=8 stable/minio
    $ helm install --set mode=shared,numberOfNodes=8 stable/minio
    $ helm install --set persistence.enabled=false stable/minio

6. MinIO 的安装部署 - 多租户

$ minio server --address :9001 /data/tenant1
$ minio server --address :9002 /data/tenant2
$ minio server --address :9003 /data/tenant3

$ minio server --address :9001 /disk{1...4}/data/tenant1
$ minio server --address :9002 /disk{1...4}/data/tenant2
$ minio server --address :9003 /disk{1...4}/data/tenant3

$ export MINIO_ROOT_USER=<TENANT1_ACCESS_KEY>
$ export MINIO_ROOT_PASSWORD=<TENANT1_SECRET_KEY>
$ minio server --address :9001 http://192.168.10.1{1...4}/data/tenant1

$ export MINIO_ROOT_USER=<TENANT2_ACCESS_KEY>
$ export MINIO_ROOT_PASSWORD=<TENANT2_SECRET_KEY>
$ minio server --address :9002 http://192.168.10.1{1...4}/data/tenant2

$ export MINIO_ROOT_USER=<TENANT3_ACCESS_KEY>
$ export MINIO_ROOT_PASSWORD=<TENANT3_SECRET_KEY>
$ minio server --address :9003 http://192.168.10.1{1...4}/data/tenant3

7. MinIO 的网页使用

  • docker-compose.yaml

  • nginx.conf

    version: "3.7"

    x-minio-common: &minio-common
    image: quay.io/minio/minio:RELEASE.2021-11-24T23-19-33Z
    command: server --console-address ":9001" http://minio{1…4}/data{1…2}
    expose:
    - "9000"
    - "9001"
    environment:
    MINIO_ROOT_USER: minio
    MINIO_ROOT_PASSWORD: minio123
    healthcheck:
    test: ["CMD", "curl", "-f", "http://localhost:9000/minio/health/live"]
    interval: 30s
    timeout: 20s
    retries: 3

    services:
    minio1:
    <<: *minio-common
    hostname: minio1
    volumes:
    - data1-1:/data1
    - data1-2:/data2

    minio2:
    <<: *minio-common
    hostname: minio2
    volumes:
    - data2-1:/data1
    - data2-2:/data2

    minio3:
    <<: *minio-common
    hostname: minio3
    volumes:
    - data3-1:/data1
    - data3-2:/data2

    minio4:
    <<: *minio-common
    hostname: minio4
    volumes:
    - data4-1:/data1
    - data4-2:/data2

    nginx:
    image: nginx:1.19.2-alpine
    hostname: nginx
    volumes:
    - ./nginx.conf:/etc/nginx/nginx.conf:ro
    ports:
    - "9000:9000"
    - "9001:9001"
    depends_on:
    - minio1
    - minio2
    - minio3
    - minio4

    volumes:
    data1-1:
    data1-2:
    data2-1:
    data2-2:
    data3-1:
    data3-2:
    data4-1:
    data4-2:

[2] 启动服务

# docker-compose
$ docker stack deploy --compose-file docker-compose.yaml minio

8. MinIO 客户端使用

# 容器安装
$ docker pull minio/mc
$ docker run minio/mc ls play
$ docker run -it --entrypoint=/bin/sh minio/mc

# MacOS
brew install minio/stable/mc

# Linux
$ wget https://dl.min.io/client/mc/release/linux-amd64/mc
chmod +x mc

# 自动补全
mc --autocompletion
  • mc xxx

    alias 设置/移除/列出自定义的别名
    ls 列出文件和文件夹
    mb 创建一个存储桶或一个文件夹
    rb 移除一个桶
    cp 拷贝文件和对象
    mirror 给存储桶和文件夹做镜像
    cat 显示文件和对象内容
    head 显示对象的第n行
    pipe 将一个STDIN重定向到一个对象或者文件或者STDOUT
    share 生成用于共享的URL
    find 基于参数查找文件
    sql 在对象上运行SQL查询
    stat 显示对象元信息
    mv 移动文件和对象
    tree 以树的格式列出桶和对象
    du 统计磁盘使用情况
    retention 设置对象和桶的保留
    legalhold 设置对象的合法持有
    diff 对两个文件夹或者存储桶比较差异
    rm 删除文件和对象
    encrypt 管理桶加密配置
    events 管理对象通知
    watch 监听文件和对象的事件
    undo 取消PUT/DELETE操作
    policy 管理访问策略
    tag 管理桶和对象的标签
    ilm 管理桶的生命周期
    version 输出版本信息
    replicate 配置服务器端桶复制
    admin 管理Minio服务器
    update 检查软件更新

  • mc admin xxx

    service 服务重启并停止所有MinIO服务器
    update 更新更新所有MinIO服务器
    info 信息显示MinIO服务器信息
    user 管理用户
    group 管理小组
    policy MinIO服务器中定义的策略管理策略
    config 配置管理MinIO服务器配置
    heal 修复MinIO服务器上的磁盘,存储桶和对象
    profile 概要文件生成概要文件数据以进行调试
    top 顶部提供MinIO的顶部统计信息
    trace 跟踪显示MinIO服务器的http跟踪
    console 控制台显示MinIO服务器的控制台日志
    prometheus Prometheus管理Prometheus配置
    kms kms执行KMS管理操作
    bucket 管理MinIO服务器中定义的存储桶

    MinIO云存储配置,默认使用80端口,其他端口需要单独加上,具体看实际操作

    mc alias set minio http://192.168.1.51 admin 123456
    mc alias set s3 https://s3.amazonaws.com admin 123456
    mc alias set gcs https://storage.googleapis.com admin 123456

    实际操作:

    mc alias set minio http://192.168.20.102:9001 admin 12345678

    Added minio successfully.

    开始操作云存储 - 列出所有存储桶

    mc ls play

    创建一个桶

    mc mb play.min.io/mybucket

    Bucket created successfully play.min.io/mybucket.

    上传东西

    mc cp myobject.txt play/mybucket

9. MinIO Python SDK (未实践)

Python 代码操作 MinIO 服务

  • MinIO Python SDK for Amazon S3 Compatible Cloud Storage Slack

  • Python Client API Reference

  • MinIO Python SDK Examples

    安装pip包

    pip3 install minio

    file_uploader.py

    from minio import Minio
    from minio.error import S3Error

    def main():
    # Create a client with the MinIO server playground, its access key
    # and secret key.
    client = Minio(
    "play.min.io",
    access_key="Q3AM3UQ867SPQQA43P2F",
    secret_key="zuf+tfteSlswRu7BJ86wekitnifILbZam1KYY3TG",
    )

    # Make 'asiatrip' bucket if not exist.
    found = client.bucket_exists("asiatrip")
    if not found:
        client.make_bucket("asiatrip")
    else:
        print("Bucket 'asiatrip' already exists")
    
    # Upload '/home/user/Photos/asiaphotos.zip' as object name
    # 'asiaphotos-2015.zip' to bucket 'asiatrip'.
    client.fput_object(
        "asiatrip", "asiaphotos-2015.zip", "/home/user/Photos/asiaphotos.zip",
    )
    print(
        "'/home/user/Photos/asiaphotos.zip' is successfully uploaded as "
        "object 'asiaphotos-2015.zip' to bucket 'asiatrip'."
    )

    if name == "main":
    try:
    main()
    except S3Error as exc:
    print("error occurred.", exc)