【 ES 私房菜】ElasticSearch 详细部署教程

一、环境准备

1、挂载分区

Ps:通用方法,此处略过,以下为示例挂载配置,方便直接复制粘贴。

/dev/sdb1               /data1                  ext4    noatime,acl,user_xattr  1 2
/dev/sdc1               /data2                  ext4    noatime,acl,user_xattr  1 2
/dev/sdd1               /data3                  ext4    noatime,acl,user_xattr  1 2
/dev/sde1               /data4                  ext4    noatime,acl,user_xattr  1 2
/dev/sdf1               /data5                  ext4    noatime,acl,user_xattr  1 2
/dev/sdg1               /data6                  ext4    noatime,acl,user_xattr  1 2
/dev/sdi1               /data7                  ext4    noatime,acl,user_xattr  1 2
/dev/sdj1               /data8                  ext4    noatime,acl,user_xattr  1 2
/dev/sdk1               /data9                  ext4    noatime,acl,user_xattr  1 2
/dev/sdl1               /data10                 ext4    noatime,acl,user_xattr  1 2
/dev/sdm1               /data11                 ext4    noatime,acl,user_xattr  1 2

2、根据分区数批量创建目录

mkdir -p /data{1..11}/esdata
chown -R nobody.nobody /data{1..11}/esdata

3、安装jdk

tar zxf jdk-8u131-linux-x64.tar.gz -C /usr/local
ln -sf /usr/local/jdk1.8.0_131 /usr/local/jdk
cat >>/etc/profile <<EOF
export JAVA_HOME=/usr/local/jdk
export PATH=\$JAVA_HOME/bin:\$PATH
EOF
. /etc/profile

4、其他

cat >> /etc/security/limits.conf <<EOF
* soft nofile 65536
* hard nofile 131072
* soft nproc 2048
* hard nproc 4096
EOF

cat >> /etc/sysctl.conf <<EOF
vm.max_map_count=655360
EOF

二、安装ES

1、解压安装包

tar zxf elasticsearch-5.5.1.tar.gz -C /data/
chown -R nobody:nobody /data/elasticsearch-5.5.1
ln -sf /data/elasticsearch-5.5.1 /data/elasticsearch

2、修改配置

i. 编辑配置文件,添加如下选项:

[root@x.x.x.x:~]# vim /data/elasticsearch/config/elasticsearch.yml 
cluster.name: iyunwei 
node.name: es-205
node.attr.rack: 0302-J08
path.data: /data1/esdata,/data2/esdata,/data4/esdata,/data5/esdata,/data6/esdata,/data7/esdata,/data8/esdata,/data9/esdata
bootstrap.memory_lock: false
bootstrap.system_call_filter: false
discovery.zen.ping.unicast.hosts: ["x.x.x.x", "x.x.x.x", "x.x.x.x"]
network.host: 0.0.0.0 
http.port: 9200
indices.fielddata.cache.size: 25%
  • cluster.name : 项目名称
  • node.name : 节点名称,约定为es+${IP最后一段}
  • node.attr.rack:机架,按照CMDB机架填写
  • path.data :文件分布目录,默认9个盘,形式约定为 /data$i/esdata
  • boostrap.***: 因为Centos6不支持SecComp,而ES5.2.0默认bootstrap.system_call_filter为true进行检测,所以导致检测失败,失败后直接导致ES不能启动;
  • discovery.zen.ping.unicast.hosts:集群节点
  • network.host: 对外服务地址,用于数据写入和读取
  • indices.fielddata.cache.size:限制内存使用

ii.修改启动文件

[root@x.x.x.x~]# vim /data/elasticsearch/bin/elasticsearch
# 在#/bin/bash之后 添加
ES_JAVA_OPTS="-Xms5g -Xmx5g"

3、启动ES

sudo -u nobody /data/elasticsearch/bin/elasticsearch -d

三、安装Kibana

1、解压安装包

tar zxf kibana-5.5.1-linux-x86_64.tar.gz -C /data/
mkdir -p /data/kibana-5.5.1-linux-x86_64/logs
chown -R nobody:nobody /data/kibana-5.5.1-linux-x86_64
ln -sf /data/kibana-5.5.1-linux-x86_64 /data/kibana

2、修改配置

[root@x.x.x.x:~]# vim /data/kibana/config/kibana.yml
server.port: 8000  
server.host: "0.0.0.0"
elasticsearch.url: "http://localhost:9200"
# 以下为可选配置
pid.file: /data/kibana/logs/kibana.pid
logging.dest: /data/kibana/logs/kibana-stdout.log

3、启动Kibana

sudo -u nobody nohup /data/kibana/bin/kibana >> ../logs/kibana.log 2>&1 &

四、自拉起

1、自拉起脚本

#!/bin/bash
. /etc/profile
Report()
{
   echo "[$(date +%Y%m%d-%H:%M)]: $*"
}
process_mon()
{
    NAME=$1
    PIDNUM=$2
    BIN="$3"
    RUNPID=`ps aux | grep -v grep | grep -w $NAME | wc -l`
    if [[ $RUNPID  -ge $PIDNUM ]]
    then
        :
        #Report "$NAME running correctly."
    else
        Report "$NAME running error,restart now."
        eval $BIN
        echo alarm "$NAME restart"
    fi
}

process_mon org.elasticsearch.bootstrap.Elasticsearch 1 "sudo -unobody /data/elasticsearch/bin/elasticsearch -d"
process_mon kibana 1 "sudo -unobody /usr/bin/nohup /data/kibana/bin/kibana >>/data/kibana/logs/kibana.log 2>&1 &"

2、添加crontab

* * * * *  /data/satools/scripts/monitor.sh >>/data/satools/scripts/monitor.log 2>&1

五、Nginx反代

1、创建Ngx认证文件

echo "admin:$(openssl passwd -crypt 123456)" >> /usr/local/nginx/conf/xlogauthfile

2、配置Nginx反向代理

server {
 listen 80;
 server_name xxxx.oa.com;
 location / {
            auth_basic "Please Login";
            auth_basic_user_file /usr/local/nginx/conf/xlogauthfile;
            proxy_pass http://x.x.x.x:8000;

    }
 #以下略

3、访问Kibana

http://xxxx.oa.com/

六、附录

1、附录一:部署问题记录

问题①、虚拟内存区域报错

[2017-07-31T09:23:40,335][ERROR][o.e.b.Bootstrap          ] [es-205] node validation exception
[2] bootstrap checks failed
[1]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
[2]: system call filters failend fix d to install; check the logs ayour configuration or disable system call filters at your own risk

临时修复:sudo sysctl -w vm.max_map_count=262144

永久修改:

修改/etc/sysctl.conf 文件,添加 “vm.max_map_count”设置

并执行:sysctl -p

问题②、系统不支持SecComp而报错

[2017-07-31T09:28:46,791][ERROR][o.e.b.Bootstrap          ] [es-205] node validation exception
[1] bootstrap checks failed
[1]: system call filters failed to install; check the logs and fix your configuration or disable system call filters at your own risk

原因:

这是在因为Centos6不支持SecComp,而ES5.2.0默认bootstrap.system_call_filter为true进行检测,所以导致检测失败,失败后直接导致ES不能启动(我们系统是tlinux 2.2也有这个问题)。

解决:

在elasticsearch.yml中配置bootstrap.system_call_filter为false,注意要在Memory下面:

bootstrap.memory_lock: false

bootstrap.system_call_filter: false

可以查看issues

https://github.com/elastic/elasticsearch/issues/22899

Ps:更多问题会持续补充。

2、附录二:elasticsearch 详细配置

lasticsearch的config文件夹里面有两个配置文 件:elasticsearch.yml和logging.yml,第一个是es的基本配置文件,第二个是日志配置文件,es也是使用log4j来记录日 志的,所以logging.yml里的设置按普通log4j配置文件来设置就行了。下面主要讲解下elasticsearch.yml这个文件中可配置的 东西。

cluster.name: elasticsearch
配置es的集群名称,默认是elasticsearch,es会自动发现在同一网段下的es,如果在同一网段下有多个集群,就可以用这个属性来区分不同的集群。

node.name: "Franz Kafka"
节点名,默认随机指定一个name列表中名字,该列表在es的jar包中config文件夹里name.txt文件中,其中有很多作者添加的有趣名字。

node.master: true
指定该节点是否有资格被选举成为node,默认是true,es是默认集群中的第一台机器为master,如果这台机挂了就会重新选举master。

node.data: true
指定该节点是否存储索引数据,默认为true。

index.number_of_shards: 5
设置默认索引分片个数,默认为5片。

index.number_of_replicas: 1
设置默认索引副本个数,默认为1个副本。

path.conf: /path/to/conf
设置配置文件的存储路径,默认是es根目录下的config文件夹。

path.data: /path/to/data
设置索引数据的存储路径,默认是es根目录下的data文件夹,可以设置多个存储路径,用逗号隔开,例:
path.data: /path/to/data1,/path/to/data2

path.work: /path/to/work
设置临时文件的存储路径,默认是es根目录下的work文件夹。

path.logs: /path/to/logs
设置日志文件的存储路径,默认是es根目录下的logs文件夹

path.plugins: /path/to/plugins
设置插件的存放路径,默认是es根目录下的plugins文件夹

bootstrap.mlockall: true
设置为true来锁住内存。因为当jvm开始swapping时es的效率 会降低,所以要保证它不swap,可以把ES_MIN_MEM和ES_MAX_MEM两个环境变量设置成同一个值,并且保证机器有足够的内存分配给es。 同时也要允许elasticsearch的进程可以锁住内存,linux下可以通过`ulimit -l unlimited`命令。

network.bind_host: 192.168.0.1
设置绑定的ip地址,可以是ipv4或ipv6的,默认为0.0.0.0。

network.publish_host: 192.168.0.1
设置其它节点和该节点交互的ip地址,如果不设置它会自动判断,值必须是个真实的ip地址。

network.host: 192.168.0.1
这个参数是用来同时设置bind_host和publish_host上面两个参数。

transport.tcp.port: 9300
设置节点间交互的tcp端口,默认是9300。

transport.tcp.compress: true
设置是否压缩tcp传输时的数据,默认为false,不压缩。

http.port: 9200
设置对外服务的http端口,默认为9200。

http.max_content_length: 100mb
设置内容的最大容量,默认100mb

http.enabled: false
是否使用http协议对外提供服务,默认为true,开启。

gateway.type: local
gateway的类型,默认为local即为本地文件系统,可以设置为本地文件系统,分布式文件系统,hadoop的HDFS,和amazon的s3服务器,其它文件系统的设置方法下次再详细说。

gateway.recover_after_nodes: 1
设置集群中N个节点启动时进行数据恢复,默认为1。

gateway.recover_after_time: 5m
设置初始化数据恢复进程的超时时间,默认是5分钟。

gateway.expected_nodes: 2
设置这个集群中节点的数量,默认为2,一旦这N个节点启动,就会立即进行数据恢复。

cluster.routing.allocation.node_initial_primaries_recoveries: 4
初始化数据恢复时,并发恢复线程的个数,默认为4。

cluster.routing.allocation.node_concurrent_recoveries: 2
添加删除节点或负载均衡时并发恢复线程的个数,默认为4。

indices.recovery.max_size_per_sec: 0
设置数据恢复时限制的带宽,如入100mb,默认为0,即无限制。

indices.recovery.concurrent_streams: 5
设置这个参数来限制从其它分片恢复数据时最大同时打开并发流的个数,默认为5。

discovery.zen.minimum_master_nodes: 1
设置这个参数来保证集群中的节点可以知道其它N个有master资格的节点。默认为1,对于大的集群来说,可以设置大一点的值(2-4)

discovery.zen.ping.timeout: 3s
设置集群中自动发现其它节点时ping连接超时时间,默认为3秒,对于比较差的网络环境可以高点的值来防止自动发现时出错。

discovery.zen.ping.multicast.enabled: false
设置是否打开多播发现节点,默认是true。

discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]
设置集群中master节点的初始列表,可以通过这些节点来自动发现新加入集群的节点。

下面是一些查询时的慢日志参数设置
index.search.slowlog.level: TRACE
index.search.slowlog.threshold.query.warn: 10s
index.search.slowlog.threshold.query.info: 5s
index.search.slowlog.threshold.query.debug: 2s
index.search.slowlog.threshold.query.trace: 500ms

index.search.slowlog.threshold.fetch.warn: 1s
index.search.slowlog.threshold.fetch.info: 800ms
index.search.slowlog.threshold.fetch.debug:500ms
index.search.slowlog.threshold.fetch.trace: 200ms

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT笔记

Docker学习之搭建JavaWeb环境进阶篇

上一篇文章中,简单了学习了一下在Docker环境中搭建JavaWeb环境,其实这时候已经是一个全新的镜像了,就是我们的Ghost系统一样,装配了各式各样的软件一...

3167
来自专栏王磊的博客

Redis在win7上的可视化应用

Redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(...

2403
来自专栏趣谈编程

互联网协议入门(下)

上一篇文章(互联网协议入门(上))分析了互联网的总体构思,从下至上,每一层协议的设计思想。

1440
来自专栏杂烩

elasticsearch2.3.1 集群安装

    ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elastic...

683
来自专栏阮一峰的网络日志

互联网协议入门(二)

上一篇文章分析了互联网的总体构思,从下至上,每一层协议的设计思想。 这是从设计者的角度看问题,今天我想切换到用户的角度,看看用户是如何从上至下,与这些协议互动的...

3478
来自专栏微信公众号:Java团长

互联网协议入门(二)

这是从设计者的角度看问题,今天我想切换到用户的角度,看看用户是如何从上至下,与这些协议互动的。

562
来自专栏用户2442861的专栏

Nginx工作原理和优化、漏洞。

http://blog.csdn.net/hguisu/article/details/8930668 (排名100多bolg写的很好)

441
来自专栏后端技术探索

nginx+memcached构建页面缓存应用

nginx的memcached_module模块可以直接从memcached服务器中读取内容后输出,后续的请求不再经过应用程序处理,如php-fpm、djang...

752
来自专栏北京马哥教育

超级系统工具Sysdig,比 strace、tcpdump、lsof 加起来还强大

可以用sysdig命令做很多很酷的事情 网络 查看占用网络带宽最多的进程 sysdig -c topprocs_net 显示主机192.168.0.1的网络...

31911
来自专栏重庆的技术分享区

五(七)层互联网协议(计算机网络)深入浅出,看完必懂【图文三】

1353

扫码关注云+社区