前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >分布式文件系统FastDfs

分布式文件系统FastDfs

作者头像
公众号 IT老哥
修改2020-09-21 15:26:21
8410
修改2020-09-21 15:26:21
举报

本文源自 公-众-号 IT老哥 的分享

IT老哥,一个在大厂做高级Java开发的程序员,每天分享技术干货文章

目录

⊙什么是分布式文件系统

⊙为什么要使用分布式文件系统

⊙FastDFS 与 HDFS比较

⊙什么是FastDFS

⊙常见术语

⊙FastDFS架构

⊙FastDFS上传过程

⊙FastDFS下载过程

⊙Linux上FastDFS安装

1. 什么是分布式文件系统

随着文件数据的越来越多,通过tomcat或nginx虚拟化的静态资源文件在单一的一个服务器节点内是存不下的,如果用多个节点来存储也可以,但是不利于管理和维护,所以我们需要一个系统来管理多台计算机节点上的文件数据,这就是分布式文件系统。

分布式文件系统是一个允许文件通过网络在多台节点上分享的文件系统,多台计算机节点共同组成一个整体,为更多的用户提供分享文件和存储空间。比如常见的网盘,本质就是一个分布式的文件存储系统。虽然我们是一个分布式的文件系统,但是对用户来说是透明的,用户使用的时候,就像是访问本地磁盘一样。

分布式文件系统可以提供冗余备份,所以容错能力很高。系统中有某些节点宕机,但是整体文件服务不会停止,还是能够为用户提供服务,整体还是运作的,数据也不会丢失。分布式文件系统的可扩展性强,增加或减少节点都很简单,不会影响线上服务,增加完毕后会发布到线上,加入到集群中为用户提供服务。

分布式文件系统可以提供负载均衡能力,在读取文件副本的时候可以由多个节点共同提供服务,而且可以通过横向扩展来确保性能的提升与负载。

2. 为什么要使用分布式文件系统

  • 海量文件数据存储
  • 文件数据高可用(冗余备份)
  • 读写性能和负载均衡

以上3点都是我们之前使用tomcat或nginx所不能够实现的,这也是我们为什么要使用分布式文件系统的原因

3. FastDFS 与 HDFS比较

说到分布式文件存储,肯定会有人想到HDFS,他们两者主要定位和应用场景是不一样的。

  • Hadoop中的文件系统HDFS主要解决并行计算中分布式存储数据的问题。其单个数据文件通常很大,采用了分块(切分)存储的方式,所以是大数据大文件存储来使用的场景。
  • FastDFS主要用于互联网网站,为文件上传和下载提供在线服务。所以在负载均衡、动态扩容等方面都支持得比较好,FastDFS不会对文件进行分快存储。FastDFS用于存储中小文件都是不错的,比如用户头像啊,一些较小的音视频文件啊等等都行。

4. 什么是FastDFS

FastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。

特别适合以文件为载体的在线服务,如相册网站、视频网站等等。FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。

FastDFS服务端有两个角色:跟踪器(tracker)和存储节点(storage)。跟踪器主要做调度工作,在访问上起负载均衡的作用。

存储节点存储文件,完成文件管理的所有功能:就是这样的存储、同步和提供存取接口,FastDFS同时对文件的metadata进行管理。所谓文件的meta data就是文件的相关属性,以键值对(key value)方式表示,如:width=1024,其中的key为width,value为1024。文件metadata是文件属性列表,可以包含多个键值对。

跟踪器和存储节点都可以由一台或多台服务器构成。跟踪器和存储节点中的服务器均可以随时增加或下线而不会影响线上服务。其中跟踪器中的所有服务器都是对等的,可以根据服务器的压力情况随时增加或减少。

为了支持大容量,存储节点(服务器)采用了分卷(或分组)的组织方式。存储系统由一个或多个卷组成,卷与卷之间的文件是相互独立的,所有卷的文件容量累加就是整个存储系统中的文件容量。一个卷可以由一台或多台存储服务器组成,一个卷下的存储服务器中的文件都是相同的,卷中的多台存储服务器起到了冗余备份和负载均衡的作用。

在卷中增加服务器时,同步已有的文件由系统自动完成,同步完成后,系统自动将新增服务器切换到线上提供服务。

当存储空间不足或即将耗尽时,可以动态添加卷。只需要增加一台或多台服务器,并将它们配置为一个新的卷,这样就扩大了存储系统的容量。

FastDFS中的文件标识分为两个部分:卷名和文件名,二者缺一不可。

5. 常见术语

  • tracker:追踪者服务器,主要用于协调调度,可以起到负载均衡的作用,记录storage的相关状态信息。
  • storage:存储服务器,用于保存文件以及文件的元数据信息。
  • group:组,同组节点提供冗余备份,不同组用于扩容。
  • mata data:文件的元数据信息,比如长宽信息,图片后缀,视频的帧数等。

6. FastDFS架构

7. FastDFS上传过程

  • Storage会定时的向Tracker发送心跳,告诉Tracker自己还还活着,这样Fastdfs就可以工作了
  • 客户端发送上传请求给Tracker,Tracker会检查是否有可用Storage
  • 如果有可用的,客户端就可以上传文件数据到Storage上
  • Storage将文件写入磁盘后,会返回路径信息给客户端
  • 客户端就可以根据这个路径信息找到上传的文件

8. FastDFS下载过程

  • Storage会定时的向Tracker安装发送心跳,告诉Tracker自己还还活着,这样Fastdfs就可以工作了
  • 客户端发送下载请求到Tracker上,Tracker查找到存储的Storage地址后返回给客户端
  • 客户端拿到Storage地址后,去Storage上找到文件
  • 把文件返回给客户端

9. Linux上FastDFS安装

注:一定要先启动Tracker,在启动Storage

9.1 基础环境安装

注:如果Tracker和Storage是配置在不同的服务器上,那么基础环境要在两个服务器上都安装。

1.下载安装包

  • libfatscommon:FastDFS分离出的一些公用函数包
  • FastDFS:FastDFS本体
  • fastdfs-nginx-module:FastDFS和nginx的关联模块
  • nginx:发布访问服务

2. 安装基础环境

  • yum install -y gcc gcc-c++
  • yum -y install libevent
  • yum -y install zlib zlib-devel pcre pcre-devel gcc gcc-c++ openssl openssl-devel libevent libevent-devel perl unzip net-tools wget

3. 安装libfatscommon函数库

  • tar -zxvf libfastcommon-1.0.42.tar.gz

4. 进入libfastcommon文件夹,编译并且安装

  • ./make.sh
  • ./make.sh install

5. 安装fastdfs主程序文件

  • tar -zxvf fastdfs-6.04.tar.gz

6. 安装fastdfs

  • ./make.sh
  • ./make.sh install

7. 拷贝配置文件

  • cp /home/software/FastDFS/fastdfs-6.04/conf/* /etc/fdfs/

停止tracker

  • /usr/bin/stop.sh /etc/fdfs/tracker.con

9.2 配置tracker服务

注:tracker和storage都是同一个fastdfs的主程序的两个不同概念,配置不同的配置文件就可以设定为tracker或者storage

1. 进入到配置文件目录

  • cd /etc/fdfs

2. 修改tracker配置文件

  • vim tracker.conf
代码语言:javascript
复制
#修改tracker配置文件,此为tracker的工作目录,保存数据以及日志
base_path=/usr/local/fastdfs/tracker

3. 创建工作目录

  • mkdir /usr/local/fastdfs/tracker -p

4. 启动进程

  • /usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf

9.3 配置storage服务

1. 进入到配置文件目录

  • cd /etc/fdfs

2. 修改storage配置文件

  • vim storage.conf
代码语言:javascript
复制
# 修改组名 可以不修改
group_name=test 
# 修改storage的工作空间 
base_path=/usr/local/fastdfs/storage 
# 修改storage的存储空间 
store_path0=/usr/local/fastdfs/storage 
# 修改tracker的地址和端口号,用于心跳 
tracker_server=192.168.1.153:22122 
# 后续结合nginx的一个对外服务端口号 
http.server_port=8888

3. 创建工作目录

  • mkdir /usr/local/fastdfs/storage -p

4. 启动进程

  • 前提:必须首先启动tracker
  • /usr/bin/fdfs_storaged /etc/fdfs/storage.conf

9.4 利用client测试上传

1. 进入到配置文件目录

  • cd /etc/fdfs

2. 修改client配置文件

  • vim client.conf
代码语言:javascript
复制
# 修改client的工作空间 
base_path=/usr/local/fastdfs/client 
# 修改tracker的地址和端口号,用于心跳 
tracker_server=192.168.1.153:22122

3. 创建工作目录

  • mkdir /usr/local/fastdfs/client

4. 随便找一张图片测试测试

  • cd /usr/bin/
  • ./fdfs_test /etc/fdfs/client.conf upload /home/logo.png

9.5 配置 nginx fastdfs 实现文件服务器

注:fastdfs安装好以后是无法通过http访问的,这个时候就需要借助nginx了,所以需要安装fastdfs的第三方模块到nginx中,就能使用了。

注:nginx需要和storage在同一个节点。

1. 解压nginx的fastdfs压缩包

  • tar -zxvf fastdfs-nginx-module-1.22.tar.gz

2. 复制配置文件:

  • cd /fastdfs-nginx-module-1.22/src
  • cp mod_fastdfs.conf /etc/fdfs

3. 修改/fastdfs-nginx-module/src/config文件

主要是修改路径,把local删除,因为fastdfs安装的时候我们没有修改路径,原路径是/usr:

4. 安装nginx

1、安装依赖环境

(1)安装gcc环境

yum install gcc-c++

(2)安装PCRE库,用于解析正则表达式

yum install -y pcre pcre-devel

(3)zlib压缩和解压缩依赖,

yum install -y zlib zlib-devel

(4)SSL 安全的加密的套接字协议层,用于HTTP安全传输,也就是https

yum install -y openssl openssl-devel

2、解压,需要注意,解压后得到的是源码,源码需要编译后才能安装

tar -zxvf nginx-1.16.1.tar.gz

3.编译之前,先创建nginx临时目录,如果不创建,在启动nginx的过程中会报错

mkdir /var/temp/nginx -p

2、配置改一下

./configure

–prefix=/usr/local/nginx

–pid-path=/var/run/nginx/nginx.pid

–lock-path=/var/lock/nginx.lock

–error-log-path=/var/log/nginx/error.log

–http-log-path=/var/log/nginx/access.log

–with-http_gzip_static_module

–http-client-body-temp-path=/var/temp/nginx/client

–http-proxy-temp-path=/var/temp/nginx/proxy

–http-fastcgi-temp-path=/var/temp/nginx/fastcgi

–http-uwsgi-temp-path=/var/temp/nginx/uwsgi

–http-scgi-temp-path=/var/temp/nginx/scgi

–add-module=/home/software/fdfs/fastdfs-nginx-module- 1.22/src

5.make编译

  • make

6.安装

  • make install

7.进入sbin目录启动

  • nginx./nginx

8. 修改 mod_fastdfs.conf 配置文件

  • cd /etc/fdfs
代码语言:javascript
复制
# 修改mod_fastdfs的工作空间 
base_path=/usr/local/fastdfs/tmp 
 # 修改tracker的地址和端口号,用于心跳 
tracker_server=192.168.1.153:22122 
# 修改组名 可以不修改
group_name=imooc 
# 在url上拼接组名
url_have_group_name = true 
# 文件存储空间
store0_path=/usr/local/fastdfs/storage

9. 创建工作空间

  • mkdir /usr/local/fastdfs/tmp

10. 修改nginx.conf,添加如下虚拟主机

代码语言:javascript
复制
server {
   listen 8888;
   server_name localhost;
   #如果自己修改组名了,这块配自己修改的组名
   location /group1/M00
   {
      ngx_fastdfs_module;
   }
}

11. 启动nginx

12. 浏览器访问

云服务器云硬盘数据库(包括MySQL、Redis、MongoDB、SQL Server),CDN流量包,短信流量包,cos资源包,消息队列ckafka,点播资源包,实时音视频套餐,网站管家(WAF),大禹BGP高防(包含高防包及高防IP),云解析SSL证书,手游安全MTP移动应用安全云直播等等。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 IT老哥 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 本文源自 公-众-号 IT老哥 的分享
相关产品与服务
负载均衡
负载均衡(Cloud Load Balancer,CLB)提供安全快捷的流量分发服务,访问流量经由 CLB 可以自动分配到云中的多台后端服务器上,扩展系统的服务能力并消除单点故障。负载均衡支持亿级连接和千万级并发,可轻松应对大流量访问,满足业务需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档