Redis 代理服务Twemproxy

1、twemproxy explore

当我们有大量 Redis 或 Memcached 的时候,通常只能通过客户端的一些数据分配算法(比如一致性哈希),来实现集群存储的特性。虽然Redis 2.6版本已经发布Redis Cluster,但还不是很成熟适用正式生产环境。 Redis 的 Cluster 方案还没有正式推出之前,我们通过 Proxy 的方式来实现集群存储。

Twitter,世界最大的Redis集群之一部署在Twitter用于为用户提供时间轴数据。Twitter Open Source部门提供了Twemproxy。

Twemproxy,也叫nutcraker。是一个twtter开源的一个redis和memcache代理服务器。 redis作为一个高效的缓存服务器,非常具有应用价值。但是当使用比较多的时候,就希望可以通过某种方式 统一进行管理。避免每个应用每个客户端管理连接的松散性。同时在一定程度上变得可以控制。

Twemproxy是一个快速的单线程代理程序,支持Memcached ASCII协议和更新的Redis协议:

它全部用C写成,使用Apache 2.0 License授权。项目在Linux上可以工作,而在OSX上无法编译,因为它依赖了epoll API.

Twemproxy 通过引入一个代理层,可以将其后端的多台 Redis 或 Memcached 实例进行统一管理与分配,使应用程序只需要在 Twemproxy 上进行操作,而不用关心后面具体有多少个真实的 Redis 或 Memcached 存储。

2、twemproxy特性:

  • 支持失败节点自动删除
    • 可以设置重新连接该节点的时间
    • 可以设置连接多少次之后删除该节点
    • 该方式适合作为cache存储
  • 支持设置HashTag
    • 通过HashTag可以自己设定将两个KEYhash到同一个实例上去。
  • 减少与redis的直接连接数
    • 保持与redis的长连接
    • 可设置代理与后台每个redis连接的数目
  • 自动分片到后端多个redis实例上
    • 多种hash算法:能够使用不同的策略和散列函数支持一致性hash。
    • 可以设置后端实例的权重
  • 避免单点问题
    • 可以平行部署多个代理层.client自动选择可用的一个
  • 支持redis pipelining request 支持请求的流式与批处理,降低来回的消耗
  • 支持状态监控
    • 可设置状态监控ip和端口,访问ip和端口可以得到一个json格式的状态信息串
    • 可设置监控信息刷新间隔时间
  • 高吞吐量
    • 连接复用,内存复用。
    • 将多个连接请求,组成reids pipelining统一向redis请求。

另外可以修改redis的源代码,抽取出redis中的前半部分,作为一个中间代理层。最终都是通过linux下的epoll 事件机制提高并发效率,其中nutcraker本身也是使用epoll的事件机制。并且在性能测试上的表现非常出色。

3、twemproxy问题与不足

Twemproxy 由于其自身原理限制,有一些不足之处,如:

  • 不支持针对多个值的操作,比如取sets的子交并补等(MGET 和 DEL 除外)
  • 不支持Redis的事务操作
  • 出错提示还不够完善
  • 也不支持select操作

4、安装与配置

具体的安装步骤可用查看github:https://github.com/twitter/twemproxy

Twemproxy 的安装,主要命令如下:

  1. apt-get install automake
  2. apt-get install libtool
  3. git clone git://github.com/twitter/twemproxy.git
  4. cd twemproxy
  5. autoreconf -fvi
  6. ./configure --enable-debug=log
  7. make
  8. src/nutcracker -h

通过上面的命令就算安装好了,然后是具体的配置,下面是一个典型的配置

  1. redis1:
  2. listen: 127.0.0.1:6379 #使用哪个端口启动Twemproxy
  3. redis: true #是否是Redis的proxy
  4. hash: fnv1a_64 #指定具体的hash函数
  5. distribution: ketama #具体的hash算法
  6. auto_eject_hosts: true #是否在结点无法响应的时候临时摘除结点
  7. timeout: 400 #超时时间(毫秒)
  8. server_retry_timeout: 2000 #重试的时间(毫秒)
  9. server_failure_limit: 1 #结点故障多少次就算摘除掉
  10. servers: #下面表示所有的Redis节点(IP:端口号:权重)
  11. - 127.0.0.1:6380:1
  12. - 127.0.0.1:6381:1
  13. - 127.0.0.1:6382:1
  14. redis2:
  15. listen: 0.0.0.0:10000
  16. redis: true
  17. hash: fnv1a_64
  18. distribution: ketama
  19. auto_eject_hosts: false
  20. timeout: 400
  21. servers:
  22. - 127.0.0.1:6379:1
  23. - 127.0.0.1:6380:1
  24. - 127.0.0.1:6381:1
  25. - 127.0.0.1:6382:1

你可以同时开启多个 Twemproxy 实例,它们都可以进行读写,这样你的应用程序就可以完全避免所谓的单点故障。

原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2014-06-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏blackheart的专栏

[认证授权] 5.OIDC(OpenId Connect)身份认证授权(扩展部分)

在上一篇[认证授权] 4.OIDC(OpenId Connect)身份认证授权(核心部分)中解释了OIDC的核心部分的功能,即OIDC如何提供id token来...

2888
来自专栏云计算教程系列

如何在服务器上更改MySQL数据库目录

数据库的大小将会随着时间的推移而增长,有时会超出文件系统的空间。当它们与其余操作系统的部分位于同一分区时,您也可能会遇到I / O争用的问题。RAID,网络块存...

3096
来自专栏生信技能树

linux系统环境变量一文就够

Linux是一个多用户的操作系统。每个用户登录系统后,都会有一个专用的运行环境。 通常每个用户默认的环境都是相同的,这个默认环境实际上就是一组环境变量的定义。 ...

4085
来自专栏晨星先生的自留地

django(1)初次见面-我叫姜哥

1465
来自专栏FreeBuf

如何通过Emond在macOS上实现持久化访问

在这篇文章中,我们会介绍如何通过emond在macOS上实现持久化访问。根据苹果公司的说法,事件监视进程(emond)会“接受来自各种服务的事件,通过一个简单的...

2039
来自专栏从零开始学自动化测试

pytest文档22-pytest分布式执行(pytest-xdist)

平常我们手工测试用例非常多时,比如有1千条用例,假设每个用例执行需要1分钟。如果一个测试人员执行需要1000分钟才能执行完,当项目非常紧急的时候, 我们会用测试...

3854
来自专栏java一日一条

Maven 扫盲(上)

写这个maven的入门篇是因为之前在一个开发者会的动手实验中发现挺多人对于maven不是那么了解,所以就有了这个想法。这个入门篇分上下两篇。本文着重动手,用ma...

1012
来自专栏JavaEdge

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFSHDFS Shell 操作Java 操作 HDFS 开发环境搭建

1795
来自专栏后端云

Raft算法和Gossip协议

raft 集群中的每个节点都可以根据集群运行的情况在三种状态间切换:follower, candidate 与 leader。leader 向 follower...

4003
来自专栏小狼的世界

Fedora 10 下rsync的配置和使用

rsync是一个提供快速增量文件传输的开源工具。其基于GNU General Public License 发布,目前主要有 Wayne Davison (ht...

772

扫码关注云+社区

领取腾讯云代金券