服务器搬迁之后的准备工作和应对

服务器搬迁后不是简单能连接上服务器就可以了,还有许多的事情需要考虑,否则服务器不可用还是白搭。

我大体碰到了如下的一些问题,也能够反应出来对于系统的各种潜在隐患。

1

批量检测服务器的可用状态

如果有大批量的服务器搬迁,有些能够连通,有些不可以,使用telnet本身就有硬伤,我们直接设置个超时时间,对于服务是否可用一目了然。这个时候还是推荐使用nc命令。比如测试服务器10.129.128.37的22端口是否可通,超时时间为2秒,则可以使用如下的命令。

nc -z -v -n -w 2 10.129.128.37 22

2

检查ILO的连接情况

如果ILO(iDRAC)都不可用,那么基本上可以保证你的这个服务器就不可用了。没有了终极控制权,即使可以连接,但是一旦服务器出现异常就完全不可控,这个时候尤其注意的是密码,要知道密码。

3

检查root密码的情况

检查root密码的重要性不言而喻,如果能够访问到服务器,但是你压根登录不了,没有任何预想准备的用户,那么这个也可以给服务器“判刑”了。修改root密码本身不是件容易的事情,通过各种设置,如果在关键步骤还需要密码呢。

4

防火墙信息丢失

这样的情况碰到了几次,服务器重启之后原本能连接的连不上了,这个时候的解决方法还是ILO的连接到服务器端,然后手工开启,或者给自己留点余地,给主库或者备库开启访问的权限,这样即使中控权限丢失,也还能保证能够连接。

5

使用硬IP绑定而非主机域名绑定

有些系统会设置自动启动监听,很可能服务器无法开启自启动,其中的一个主要原因就是使用了硬IP绑定,在listener.ora里面如果使用主机域名解析就会省事很多。

或者对于mysql而言,这个问题就会被放大,比如下面的一个slave服务器启动之后,无法连接到主库应用binlog,经过排查,主要的一个原因就是对于用户权限的配置使用了硬IP配置,如果使用域名绑定就会方便多了。

slave的错误信息如下:

2017-07-26 03:55:34 2490 [ERROR] Slave I/O: error connecting to master 'rep_live800@live800.test.com:3306' - retry-time: 5 retries: 5, Error_code: 1130 2017-07-26 03:55:39 2490 [ERROR] Slave I/O: error connecting to master 'rep_live800@live800.test.com:3306' - retry-time: 5 retries: 6, Error_code: 1130 update mysql.user set host='xxxx' where user='xxx';

这个时候刷新权限就能够正常连接了。

--flush privileges

查看slave的日志如下:

2017-07-26 03:55:44 2490 [Note] Slave I/O thread: connected to master 'rep_live800@live800.test.com:3306',replication started in log 'binlog.000019' at position 818554844

6

工具的配置问题

如果使用oracle的DG broker配置,如果本身存在一些配置的问题或者就是DG Broker在早期版本不够强大,很可能会出现一些问题。

比如下面的DG Broker配置总是失败,就是的问题,最后重新配置DG Broker就可以了。

Data Guard Broker terminating NSV3, timed out waiting for a response from database s3accdb0 07/26/2017 09:13:18 Data Guard Broker terminating NSV3, timed out waiting for a response from database s3accdb0 07/26/2017 09:13:37

7

数据库无法启动

数据库在启动时很可能失败,可能因为僵尸进程,可能因为内核参数配置的问题。比如下面的这个问题。

idle> startup mount ORA-27102: out of memory Linux-x86_64 Error: 28: No space left on device 而错误的原因就在于内存中的僵尸进程依旧存在,还没有释放。

$ ps -ef|grep smon oracle 5374 4967 0 12:58 pts/0 00:00:00 grep smon oracle 24710 1 0 Jul25 ? 00:00:00 ora_smon_statdb1

手工释放,重启就可以了。

8

数据库文件丢失

数据库如果你启动服务器之后,突然发现数据全都丢失了,sqlplus,mysql完全不可用,先不要着急,你可以看看是不是分区没有挂载。

本文分享自微信公众号 - 杨建荣的学习笔记(jianrong-notes)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-07-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云计算教程系列

如何在Debian 9上安装和配置ownCloud

ownCloud是一个开源文件共享服务器和协作平台,可以将您的个人内容(如文档和图片)存储在一个集中的位置。这使您可以通过不依赖Dropbox等第三方内容托管服...

75330
来自专栏安智客

GP规范中定义的四种SE访问控制架构

GP规范给人的感觉好像有点晦涩难懂,由于是规范,所以比较抽象,而且GP这个组织的专家们来自世界各地,大家都用英语文档交流,所以不同的文档风格不同,难免大家阅读起...

25420
来自专栏北京马哥教育

Linux 服务器安全简明指南

现在让我们强化你的服务器以防止未授权访问。 -- Phil Zona 本文导航 -经常升级系统00% -自动安全更新02% -添加一个受限用户账户07% -Ce...

55160
来自专栏landv

金蝶开k3wise客户端访问中间层不时提示远程服务器不存在或不可用

11520
来自专栏优启梦

利用Nginx反向代理绕过腾讯云黑洞隔离

我这里备用机用的是windows phpstudy nginx 环境,其他环境请自行测试!

32540
来自专栏FreeBuf

运维请注意:”非常危险“的Linux命令大全

Linux命令是一种很有趣且有用的东西,但在你不知道会带来什么后果的时候,它又会显得非常危险。所以,在输入某些命令前,请多多检查再敲回车。 rm –rf rm...

33460
来自专栏FreeBuf

HUNT:一款可提升漏洞扫描能力的BurpSuite漏洞扫描插件

今天给大家介绍的是一款BurpSuite插件,这款插件名叫HUNT。它不仅可以识别指定漏洞类型的常见攻击参数,而且还可以在BurpSuite中组织测试方法。 ?...

43690
来自专栏实用工具入门教程

如何部署 ftp 文件服务

文件传输协议(英文:File Transfer Protocol,缩写:FTP)是用于在网络上进行文件传输的一套标准协议,使用客户/服务器模式。它属于网络传输协...

90130
来自专栏外文翻译

如何使用您系统里的主机(hosts)文件

Linux 系统的hosts文件存储在/etc/hosts下,它在IP地址、主机名、域名和机器别名之间创建静态关联。然后,您的Linode会为这些关联提供比必须...

56130

解决Postfix,Dovecot和MySQL的问题

本指南是Postfix,Dovecot和MySQL安装指南的配套文件。由于设置邮件服务器非常棘手,因此我们创建了这套指南来帮助您解决可能遇到的任何问题。到本指南...

50720

扫码关注云+社区

领取腾讯云代金券