运行容器的虚拟机SSH远程无法连接

序言

最近碰到一个诡异的问题,ssh登陆的时候,显示无法Permission denied,是不是很熟悉。。。

诡异的问题最好玩了,所以。。。。故障排查玩玩

排查SSH无法登陆问题

1、背景介绍

无法登陆的是一个虚拟机,使用用户名密码,进行登陆,在登陆的时候报错如下:

2、 确认密码正确

由于使用的是虚拟机,先使用VNC的方式登陆,确认密码是正确的,发现能正确登陆虚拟机。

3、 查看sshd进程

在使用VNC登陆之后,查看相关的进程,发现都存在,如下:

4、 查看配置

进程都存在,那就说明sshd的服务配置没问题,而且在进行登陆验证的时候,都是可以登陆的,只能看看相关的配置是不是禁止了root登陆。。。

默认情况下都是可以允许root用户登陆的,那么还有一种情况就是sshd的配置权限不对,从而对比相关的权限。

相关的权限也没问题,例如700,600等权限。。。

5、 对比

有两个相同的虚拟机做的负载均衡,两者的配置相同,从而对比一下两者的区别,在查看sshd服务的时候,如下:

发现在正常的虚拟机中监听了两个端口,但是有问题的虚拟机就监听了一个端口,也就是22端口。--如果你足够细心,你就能在这一步解决问题。。。

6、 怀疑服务未重启,导致服务未生效(毕竟重启是万能的)

重启的时候,发现服务无法启动。。。

7、 查看服务状态

进入坏的虚拟机中,查看sshd服务状态:

发现服务端口已经被占用。。。什么鬼,居然还有服务占用。。。

8、 查看登陆日志

在登陆的时候,会将用户登陆的请求写入到messages中,从而进行监控:

然后在客户端再次发送登陆请求,什么鬼。。。。居然没有日志显示,也能登陆失败。。。都没有连接,何来失败。。。

9、 重启容器(重启一次不够,重启两次试试)

在这个时候,进行了一个猜测,如果这个ssh服务是容器的sshd服务,那么。。。如果有了容器的密码,那我应该就能正常登陆了。。。毕竟是端口占用,应该就是容器的sshd服务占用了虚拟机的监听端口,从而导致不能正常登陆。。。

重启之后,服务恢复正常,端口正常监听。。。

10、 总结:

当看到服务端口被占用的时候,其实可以可以看看进程树,然后看看到底是哪个服务启动的sshd服务,能清楚的看到是虚拟机启动的,还是容器启动的,如下:

这种时候,你可以直接ssh到容器,然后直接使用容器的root密码登陆就可以登陆容器了。。。

为什么重启一下就好了呢?执行的顺序流有问题,导致先启动了容器的sshd进程,而虚拟机的sshd未启动,当然,这不符合常理。。。并发冲突而已。。

容器,虚拟机,物理机,傻傻分不清楚,其实。。。你并不知道你运行在物理机上,还是虚拟机上,还是容器中。。。毕竟都是资源的一种分配方式。。。

你要是问,为啥端口会冲突呢?

对,这个容器用的是主机网络,冲突。。。端口竞争太激烈,竞争总是会产生的。。。

风言风语

诡异的问题最好玩了。。。毕竟靠运气也是一种战略,问题会以前所未见的方式出现。。。

表象-判断-假设-判断-解决,其实整体的问题处理流程就是这么简单。。。

猜猜下面这个问题怎么发生的。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181216B0G0JK00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券