首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Kubernetes 运维遇到的问题记录(1)

问题:老应用不能通过kubectl exec进入,新应用不能创建 ssh进入集群节点,telnet 本机的 kubelete 的 服务端口 10250,可以。...删除旧的IP pool calicoctl delete pool default-ipv4-ippool 问题:Failed to mount API filesystems, freezing....使用的80端口,与haproxy冲突 问题:不同节点的pod间无法通讯 /proc/sys/net/ipv4/ip_forward为0,ip转发功能关闭导致无法访问pod,改成1解决。...ok,有的环境有问题(从客户端curl服务端) 通过抓取sidecar的15001端口,有问题的环境15001端口tcp握手会失败,不会有ack响应,但ok的环境tcp握手成功,请求正常处理。...有问题的环境内核版本不支持ipv6的iptables转发。ok的环境内核支持。所以可以通过升级内核版本解决。

1.3K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Kubernetes 运维遇到的问题记录(4)

    本篇的内容都基于 https://github.com/imroc/kubernetes-guide 整理 偶现 DNS 解析失败 Kubernetes 集群网络有很多种实现,有很大一部分都用到了 Linux...但是 Linux 网桥是一个虚拟的二层转发设备,而 iptables conntrack 是在三层上,所以如果直接访问同一网桥内的地址,就会直接走二层转发,不经过 conntrack: Pod 访问 Service...常见的问题现象就是偶现 DNS 解析失败,当 coredns 所在节点上的 pod 解析 dns 时,dns 请求落到当前节点的 coredns pod 上时,就可能发生这个问题。...前面一种方案实际是用脚本实现了一个极简的 init 系统 (或 supervisor) 来管理所有子进程,只不过它的逻辑很简陋,仅仅简单的透传指定信号给子进程,其实社区有更完善的方案,dumb-init...,当它收到信号时会将其传递给所有的子进程,从而也能完美解决 SHELL 无法传递信号问题,并且还有回收僵尸进程的能力。

    96720

    Linux系统运维问题解决(一)

    [TOC] 主要记录工作和学习中遇到的一些问题; Q:挂载的目录进行卸载挂载繁忙,如:umount: /var: device is busy A:解决方法 fuser -m -v /dev/mapper...验证是否删除干净 whereis python whereis yum Step4.重新安装python和yum #在以下链接的镜像站中找到你系统对应版本的python rpm包,选择系统对应的位数..., (2) 当安装依赖包错误的时候进行一起安装即可(不知道谁与谁有依赖关系,就都一起安装就好了,亲测有效)) Q:Centos6.x安装/升级到python2.7 A:因为在linux机器上用yum安装的默认是...原因是mac地址的问题 systemctl status network。 #解决方案如下: 1....答:有先决条件,就是在进程中被打开,在内存中被分配资源; 恢复原理: 在Linux系统中,每个运行中的程序都有一个宿主进程彼此隔离,以/proc/进程号来体现(Linux本质上就是一个文件系统) 比如:

    3K10

    Linux 系统运维工具 OpenLMI

    OpenLMI(全称 Open Linux Management Infrastructure)顾名思义就是开放式的 Linux 管理基础架构。...OpenLMI 是开源项目,旨在提高使用 WBEM 标准的 Linux 系统管理。OpenLMI 项目为管理 Linux 系统提供常用的基础设施。它还可让用户配置、管理并监控硬件、操作系统及系统服务。...OpenLMI 是开源项目使用 WBEM 标准的 Linux 系统管理。...oenlmi 项目为管理 Linux 系统提供常用的基础设施。它还可让用户配置、管理并监控硬件、操作系统及系统服务。OpenLMI 旨在简化任务配置及产品服务器管理。...查看运程主机服务运行情况,使用如下命令: lmi> service show httpd.service Name=httpd Caption=The Apache HTTP Server Enabled

    9.7K40

    系统运维|用 Netdata 监控 Linux

    通过每个图表的右下方的按钮,Netdata还能让你控制图表的显示,重置,缩放。 Netdata图表控制 Netdata并不会占用多少系统资源,它占用的内存不会超过40MB。...当然,你的系统需要安装git。Git在Fedora系统是默认安装的。如果没有安装,你可以用下面的命令在命令行里安装git。...$sudodnfinstallgit安装好git后,你要把仓库“clone”到你的系统里。运行下面的命令。...Netdata的安装 如果一切顺利,你的系统上就已经安装并且运行了Netdata。安装脚本还会在相应的文件夹里添加一个卸载脚本,叫做netdata-uninstaller.sh。...如果你以后不想使用Netdata,运行这个脚本可以从你的系统里面卸载掉Netdata。 你可以通过systemctl查看它的运行状态。

    7.1K30

    linux运维

    浅析操作系统的进程、线程区别 为了实现多任务系统,现代操作系统提出了进程的概念,在linux系统初期,进程作为 CPU 调度的基本单位,后来由于操作系统普遍引入了线程的概念,线程成为了CPU调度的基本单位...,但是随着团队经验的丰富和人员的扩张,我会适时地更新本文,分享我们在使用 GIT 开发流程中遇到的问题和解决方案。...Linux服务器被黑遭敲诈,如何在3小时内紧急逆袭 作者介绍:陈浩,北信源研发工程师,五年Linux运维工作经验,热衷运维技术研究、实践和团队分享。...看完就会用的 GIT 操作图解分析 无论你是前端还是后台,无论是运维还是移动端研发,GIT 是逃避不了的东西,当然你说你要用 SVN,那不在这次的讨论范围之内。...Linux常用命令使用 系统基础相关 使用root用户的环境变量切换到root用户 su - 显示当前工作路径 pwd 显示当前系统默认语言及键盘布局 localectl 显示系统中能支持的所有语言

    14.1K30

    Linux系统运维之修炼秘法

    那唯有将Linux运维这部功法修炼到至高境界。才有拿到高薪的机会。而本期讨论的就是如何修炼Linux运维。 首先先给大家看一下Linux运维工程师必备技能: 1. Linux系统基础 2....经常看到许多新手一遇到问题就论坛上去发帖,向高手求教。而且许多时候这些人似乎要求所谓的高手拥有灵丹妙药,对于他们的问题给出详细的解决方法甚至完善的步骤。其实这是最要不得的对待问题的态度。...当我们每次遇到问题时,都能记录当时的场景以及解决方法,随着我们学习的不断深入,那么我们所积累的知识也就越来越丰富。 5、要有很强的责任心和使命感。 基本上运维是系统对外提供服务的最后的把关者。...因此,一个系统对用户来说是不是稳定跟运维有很大的关系。特别是,当系统不出现问题的时候,许多运维都不重视容灾备份和数据安全,这样一旦系统出现了故障,系统的恢复就需要花很长的时间。...7、要有精益求精的精神 应该说运维的工作的弹性还是很大的。即可以非常粗造的运维一个系统,也可以持续改进、优化系统,使系统越来越高效的运行。

    3K00

    Linux系统运维之修炼秘法

    那唯有将Linux运维这部功法修炼到至高境界。才有拿到高薪的机会。而本期讨论的就是如何修炼Linux运维。...经常看到许多新手一遇到问题就论坛上去发帖,向高手求教。而且许多时候这些人似乎要求所谓的高手拥有灵丹妙药,对于他们的问题给出详细的解决方法甚至完善的步骤。其实这是最要不得的对待问题的态度。...当我们每次遇到问题时,都能记录当时的场景以及解决方法,随着我们学习的不断深入,那么我们所积累的知识也就越来越丰富。 5、要有很强的责任心和使命感。 基本上运维是系统对外提供服务的最后的把关者。...因此,一个系统对用户来说是不是稳定跟运维有很大的关系。特别是,当系统不出现问题的时候,许多运维都不重视容灾备份和数据安全,这样一旦系统出现了故障,系统的恢复就需要花很长的时间。...7、要有精益求精的精神 应该说运维的工作的弹性还是很大的。即可以非常粗造的运维一个系统,也可以持续改进、优化系统,使系统越来越高效的运行。

    2.6K00

    谈谈最近ES运维中遇到的几个有意思的问题

    一、Kibana 上无法正常Discovery 日志的问题 问题描述: 客户同一个集群,同一个索引里的某些文档,用API能直接搜出来,但是在discovery上不能正常搜索,换另外一个id又能正常展示....image.png image.png 问题产生背景: 客户该索引的数据来自2部分,1个是filebeat产生的带时间戳的,一个是客户自己用代码自己手动写入的忘记带时间戳字段。...二、Reindex 复制索引数据报错导致复制失败 问题描述: 客户将存量索引通过reindex的方式拷贝到新生产的索引上,ES 集群版本为:6.4.3 POST _reindex { "source":...当然,上面的问题,我们可以指定源索引的特定type进行复制迁移,这样就不必要求2个索引type一致了。参数如下: POST _reindex?...db_contentgram_test1", "type":"t_article_om_server" //新索引type } 以上,也能解决reindex报错的问题

    1.3K41

    谈谈最近ES运维中遇到的几个有意思的问题

    二、冷热集群索引生命周期策略不生效问题 客户问题: 申请了一个冷热集群,原意是热数据上的存储空间只能存1天,然后根据ILM自动挪动到warm节点上。...客户问题 客户在同一个节点上,运行了多个Logstash事件,一个接收filebeat发送过来的日志,然后过滤输出到ES,这个是正常的。...四、客户将mysql中的数据经JAVA转换后导入ES中数据解析失败问题 问题描述: 客户将mysql中的数据经JAVA转换后导入ES中存储,结果为0或者1的bool值结果,但是ES日志出现如下错误解析...ES侧重新修改索引字段类型为byte,reindex数据后,问题解决。 五、总结 以上4个是最近遇到的比较奇葩的ES问题,跟进耗时比较长,这里一并记录共享。...后续将持续更新有意思的运维问题。

    2.2K80

    77%的Linux运维都不懂的内核问题

    来源:高效运维 ID:greatops 前言 之前在实习时,听了 OOM 的分享之后,就对 Linux 内核内存管理充满兴趣,但是这块知识非常庞大,没有一定积累,不敢写下,担心误人子弟,所以经过一个一段时间的积累...这篇文章主要是分析了单个进程空间的内存布局与分配,是从全局的视角分析下内核对内存的管理; 下面主要从以下方面介绍 Linux 内存管理: 进程的内存申请与分配; 内存耗尽之后 OOM; 申请的内存都在哪...4、系统回收内存 当系统内存不足时,有两种方式进行内存释放,一种是手动的方式,另一种是系统自己触发的内存回收,先来看下手动触发方式。...简单说下 linux 内核自动回收内存原理,内核有一个 kswapd 会周期性的检查内存使用情况,如果发现空闲内存定于 pages_low,则 kswapd 会对 lru_list 前四个 lru 队列进行扫描...5、总结 这篇文章主要是写了 linux 内存管理相关的东西: 首先是回顾了进程地址空间; 其次当进程消耗大量内存而导致内存不足时,我们可以有两种方式:第一是手动回收 cache;另一种是系统后台线程

    2K80

    Linux系统安装Redis遇到的问题及解决

    Redis用处很广泛,我不再详细说了,按照这里的教程在Linux上安装Redis,开始了踩坑过程,网上买了一个Linux CentOS 7.3,某云的,巨坑无比啊, Redis 为4.0。...2.开始启动 如果你linux没什么问题可能就直接启动成功了,但有些时候会报3个警告,比如我就碰到了,2.8不会,4.0会,猜想可能是4.0对内存要求高了 第一个警告:The TCP backlog setting...意思是:你使用的是透明大页,可能导致redis延迟和内存使用问题。执行 echo never > /sys/kernel/mm/transparent_hugepage/enabled 修复该问题。...这个解决方案也是网上的,但是根本没用,至少我这里是没用的,所以我采取的是这个,修改etc/default/grub  里值,GRUB_CMDLINE_LINUX="console=tty0 crashkernel...systemctl disable firewalld.service #禁止firewall开机启动 init 6 #重启虚拟机,然后再输入第一条命令查看防火墙状态 在centos7.2里这样操作防火墙是没问题的

    2.1K20

    Centos7服务器运维服务系统安装过程中遇到的问题总结

    1.1 操作系统 ? centos服务器运维 由于我们Sinesafe的客户要求网站的服务器要装Centos7版本所以给大家分享下安装的过程与经验,如果需要深入的服务器运维服务也可以找我们。...fastestmirror.conf enabled = 0 vim /etc/yum.conf plugins=0 yum clean dbcache 如果发现还是不可以使用yum命令安装各种软件,这时候说明是DNS的配置有问题...-6.2.2.rpm ES之Linux rpm安装包 elasticsearch-6.2.2.tar.gz ES值Linux tar安装包 logstash-6.2.2.rpm ELK之logstash...Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题 1.3 上传安装包 将安装文件上传到:/home/bigdata/software 1.4 3...上的时间和网络时间保持一致,避免一些时间不一致的问题(必须在root命令下执行) [root@bigdata1 ~]# yum install -y ntp [root@bigdata1 ~]# ntpdate

    1.1K20

    运维审计系统

    6、集中访问控制 内网运维综合审计管理系统能够提供细粒度的访问控制,最大限度保护用户资源的安全。...8、工单审批 内网运维综合审计管理系统支持工单审批模式,第三方运维人员或普通运维用户访问特定的服务器设备必须经过管理员的临时审批授权才能进行运维操作,更好的提高运维流程简单并记录相应操作。...9、计划任务 内网运维综合审计管理系统支持建立计划任务,对被管资源进行口令修改(手动指定/随机生成)、账号同步、脚本执行等任务配置,方便运维人员对资源的维护,减少重复工作,提高运维效率。...7、操作还原技术 操作还原技术是指将用户在系统中的操作行为在真实的环境中模拟显现出来,审计管理员可以根据操作还原技术还原出真实的操作,以判定问题出在哪里。...遇到特殊情况需要执行高权命令时则可以通过工单系统进行申请。 9、数据库运维审计和控制技术 基于数据库协议精确解析能力,提供高精准度的事中管控。

    4.4K11
    领券