前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何在Ubuntu 14.04上使用Cassandra运行多节点群集数据库

如何在Ubuntu 14.04上使用Cassandra运行多节点群集数据库

原创
作者头像
温浪
修改2018-10-12 18:24:43
1.2K0
修改2018-10-12 18:24:43
举报

介绍

Apache Cassandra是一个高度可扩展的开源数据库系统,在多节点设置上实现了出色的性能。

在本教程中,您将学习如何安装和使用Cassandra在Ubuntu 14.04上运行多节点集群。

准备

因为您即将构建一个多节点Cassandra集群,所以您必须确定您希望在集群中拥有多少台服务器并配置它们。建议但不要求它们具有相同或相似的规格。

要完成本教程,您需要以下内容:

  • 至少两个初始设置的Ubuntu 14.04服务器。没有服务器的同学可以在这里购买,不过我个人更推荐您使用免费的腾讯云开发者实验室进行试验,学会安装后再购买服务器
  • 必须使用防火墙保护每台服务器。如果您使用的是腾讯云的CVM服务器,您可以直接在腾讯云控制台中的安全组进行设置启用。
  • 每个服务器还必须安装Cassandra。

第1步 - 删除默认数据

Cassandra集群中的服务器称为节点。您现在在每台服务器上拥有的是单节点Cassandra集群。在此步骤中,我们将设置节点以用作多节点Cassandra集群。

必须在群集中的每个节点上重复此步骤和后续步骤中的所有命令,因此请确保打开的终端数与群集中的节点数一样多。

您将在每个节点上运行的第一个命令将停止Cassandra守护程序。

sudo service cassandra stop

完成后,删除默认数据集。

sudo rm -rf /var/lib/cassandra/data/system/*

第2步 - 配置群集

Cassandra的配置文件位于/etc/cassandra目录中。该配置文件cassandra.yaml包含许多指令,并且评论很好。在此步骤中,我们将修改该文件以设置群集。

只需修改以下指令即可设置多节点Cassandra集群:

  • cluster_name:这是您的群集的名称。
  • -seeds:这是以逗号分隔的群集中每个节点的IP地址列表。
  • listen_address:这是群集中的其他节点将用于连接到此节点的IP地址。它默认为localhost,需要更改为节点的IP地址。
  • rpc_address:这是远程过程调用的IP地址。它默认为localhost。如果正确配置了服务器的主机名,请保持原样。否则,请更改为服务器的IP地址或环回地址(127.0.0.1)。
  • endpoint_snitch:snitch的名字,这是告诉Cassandra它的网络是什么样的。默认为SimpleSnitch,用于一个数据中心的网络。在我们的例子中,我们将其更改为GossipingPropertyFileSnitch,这是生产设置的首选。
  • auto_bootstrap:该指令不在配置文件中,因此必须添加并设置为false。这使新节点自动使用正确的数据。如果要将节点添加到现有群集,则它是可选的,但在初始化新群集(即没有数据的群集)时需要。

使用nano或您喜欢的文本编辑器打开配置文件进行编辑。

sudo nano /etc/cassandra/cassandra.yaml

在文件中搜索以下指令,并按如下所示修改它们以匹配您的群集。替换your_server_ip为您当前正在处理的服务器的IP地址。每个服务器上的列表- seeds:应该相同,并且将包含用逗号分隔的每个服务器的IP地址。

. . .
​
cluster_name: 'CassandraDOCluster'
​
. . .
​
seed_provider:
  - class_name: org.apache.cassandra.locator.SimpleSeedProvider
    parameters:
         - seeds: "your_server_ip,your_server_ip_2,...your_server_ip_n"
​
. . .
​
listen_address: your_server_ip
​
. . .
​
rpc_address: your_server_ip
​
. . .
​
endpoint_snitch: GossipingPropertyFileSnitch
​
. . .

在文件的底部,auto_bootstrap通过粘贴此行添加指令:

auto_bootstrap: false

完成修改文件后,保存并关闭它。对要包含在群集中的所有服务器重复此步骤。

第3步 - 配置防火墙

此时,已配置群集,但节点未进行通信。在此步骤中,我们将配置防火墙以允许Cassandra流量。

首先,重新启动Cassandra守护程序。

sudo service cassandra start

如果检查群集的状态,您将发现只列出了本地节点,因为它还无法与其他节点通信。

sudo nodetool status
Datacenter: datacenter1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address      Load       Tokens       Owns    Host ID                               Rack
UN  192.168.1.4  147.48 KB  256          ?       f50799ee-8589-4eb8-a0c8-241cd254e424  rack1
​
Note: Non-system keyspaces don't have the same replication settings, effective ownership information is meaningless

为了允许通信,我们需要为每个节点打开以下网络端口:

  • 7000,这是命令和数据的TCP端口。
  • 9042,这是本机传输服务器的TCP端口。Cassandra命令行实用程序cqlsh将通过此端口连接到群集。

要修改防火墙规则,请打开IPv4的规则文件。

sudo nano /etc/iptables/rules.v4

在INPUT链中复制并粘贴以下行,这将允许上述端口上的流量。如果您正在使用防火墙教程中的文件rules.v4,则可以在# Reject anything that's fallen through to this point注释之前插入以下行。

指定的IP地址-s应该是群集中另一个节点的IP地址。如果你有一个IP地址的两个节点111.111.111.111222.222.222.222,在对规则111.111.111.111的机器应该使用的IP地址222.222.222.222

新防火墙规则

-A INPUT -p tcp -s your_other_server_ip -m multiport --dports 7000,9042 -m state --state NEW,ESTABLISHED -j ACCEPT

添加规则后,保存并关闭文件,然后重新启动IPTables。

sudo service iptables-persistent restart

步骤4 - 检查群集状态

我们现在已经完成了将节点变为多节点集群所需的所有步骤。您可以通过检查其状态来验证他们是否都在进行通信。

sudo nodetool status
Datacenter: datacenter1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address      Load       Tokens       Owns    Host ID                               Rack
UN  192.168.1.4  147.48 KB  256          ?       f50799ee-8589-4eb8-a0c8-241cd254e424  rack1
UN  192.168.1.6  139.04 KB  256          ?       54b16af1-ad0a-4288-b34e-cacab39caeec  rack1
​
Note: Non-system keyspaces don't have the same replication settings, effective ownership information is meaningless

如果您可以看到您配置的所有节点,那么您刚刚成功设置了一个多节点Cassandra集群。

您还可以使用cqlshCassandra命令行客户端检查是否可以连接到群集。请注意,您可以为此命令指定群集中任何节点的IP地址。

cqlsh your_server_ip 9042

你会看到它连接:

Connected to My DO Cluster at 192.168.1.6:9042.
[cqlsh 5.0.1 | Cassandra 2.2.3 | CQL spec 3.3.1 | Native protocol v4]
Use HELP for help.
cqlsh>

然后你可以退出CQL终端。

exit

结论

恭喜!您现在在Ubuntu 14.04上运行了一个多节点Cassandra集群。如果需要对群集进行故障排除,则首先查找线索位于/var/log/cassandra目录中的日志文件。

想要了解更多关于使用Cassandra运行多节点群集数据库的相关教程,请前往腾讯云+社区学习更多知识。


参考文献:《How To Run a Multi-Node Cluster Database with Cassandra on Ubuntu 14.04》

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 介绍
  • 准备
  • 第1步 - 删除默认数据
  • 第2步 - 配置群集
  • 第3步 - 配置防火墙
  • 步骤4 - 检查群集状态
  • 结论
相关产品与服务
云服务器
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档