首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Kubernetes 运维遇到的问题记录(1)

问题:老应用不能通过kubectl exec进入,新应用不能创建 ssh进入集群节点,telnet 本机的 kubelete 的 服务端口 10250,可以。...删除旧的IP pool calicoctl delete pool default-ipv4-ippool 问题:Failed to mount API filesystems, freezing....使用的80端口,与haproxy冲突 问题:不同节点的pod间无法通讯 /proc/sys/net/ipv4/ip_forward为0,ip转发功能关闭导致无法访问pod,改成1解决。...ok,有的环境有问题(从客户端curl服务端) 通过抓取sidecar的15001端口,有问题的环境15001端口tcp握手会失败,不会有ack响应,但ok的环境tcp握手成功,请求正常处理。...有问题的环境内核版本不支持ipv6的iptables转发。ok的环境内核支持。所以可以通过升级内核版本解决。

1.3K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Kubernetes 运维遇到的问题记录(4)

    本篇的内容都基于 https://github.com/imroc/kubernetes-guide 整理 偶现 DNS 解析失败 Kubernetes 集群网络有很多种实现,有很大一部分都用到了 Linux...但是 Linux 网桥是一个虚拟的二层转发设备,而 iptables conntrack 是在三层上,所以如果直接访问同一网桥内的地址,就会直接走二层转发,不经过 conntrack: Pod 访问 Service...常见的问题现象就是偶现 DNS 解析失败,当 coredns 所在节点上的 pod 解析 dns 时,dns 请求落到当前节点的 coredns pod 上时,就可能发生这个问题。...前面一种方案实际是用脚本实现了一个极简的 init 系统 (或 supervisor) 来管理所有子进程,只不过它的逻辑很简陋,仅仅简单的透传指定信号给子进程,其实社区有更完善的方案,dumb-init...,当它收到信号时会将其传递给所有的子进程,从而也能完美解决 SHELL 无法传递信号问题,并且还有回收僵尸进程的能力。

    96720

    Linux系统运维问题解决(一)

    [TOC] 主要记录工作和学习中遇到的一些问题; Q:挂载的目录进行卸载挂载繁忙,如:umount: /var: device is busy A:解决方法 fuser -m -v /dev/mapper...验证是否删除干净 whereis python whereis yum Step4.重新安装python和yum #在以下链接的镜像站中找到你系统对应版本的python rpm包,选择系统对应的位数..., (2) 当安装依赖包错误的时候进行一起安装即可(不知道谁与谁有依赖关系,就都一起安装就好了,亲测有效)) Q:Centos6.x安装/升级到python2.7 A:因为在linux机器上用yum安装的默认是...原因是mac地址的问题 systemctl status network。 #解决方案如下: 1....答:有先决条件,就是在进程中被打开,在内存中被分配资源; 恢复原理: 在Linux系统中,每个运行中的程序都有一个宿主进程彼此隔离,以/proc/进程号来体现(Linux本质上就是一个文件系统) 比如:

    3K10

    在直播系统开发中经常会遇见的那些技术难题?

    于是市场上每个人都想来分一杯羹,但是在整个直播系统开发过程中,并不容易,因为每个环节都会涉及很多细节,其中就会遇到很多的问题。那么在直播系统开发过程中,我们常见的技术难点问题有哪些呢?...所以在视频直播的过程中,视频上传、处理、播放、CDN推流要在短时间内近乎同时完成,否则将严重影响用户的体验,而且直播系统的功能越多,对系统的兼容性、运行速度和流畅度都会造成影响,甚至出现Bug问题。...由于直播还会使用到硬件编解码,所以搭建直播时需要考虑到各类手机以及手机系统对客户端的兼容性,现在智能手机多种多样,主要还是安卓和IOS系统,但IOS的机型比较少,所以对于规格尺寸等问题的代码编写相对比较省力...因此在接入美颜SDK后,如何保证系统稳定,而且美颜各方面效果都俱佳,这也是技术人员需要重点考虑的问题。在这个产品为王的时代,拥有优质的产品是企业在市场竞争中立于不败之地的根本。...而直播系统开发的技术,是决定直播app的根本。要解决以上经常遇到的难题,就需要一个强大的直播系统技术开发团队。

    1.3K50

    Linux 系统运维工具 OpenLMI

    OpenLMI(全称 Open Linux Management Infrastructure)顾名思义就是开放式的 Linux 管理基础架构。...OpenLMI 是开源项目,旨在提高使用 WBEM 标准的 Linux 系统管理。OpenLMI 项目为管理 Linux 系统提供常用的基础设施。它还可让用户配置、管理并监控硬件、操作系统及系统服务。...OpenLMI 是开源项目使用 WBEM 标准的 Linux 系统管理。...oenlmi 项目为管理 Linux 系统提供常用的基础设施。它还可让用户配置、管理并监控硬件、操作系统及系统服务。OpenLMI 旨在简化任务配置及产品服务器管理。...查看运程主机服务运行情况,使用如下命令: lmi> service show httpd.service Name=httpd Caption=The Apache HTTP Server Enabled

    9.7K40

    开发中经常遇到的JavaScript问题整理(超实用)

    360 面试过程遇到一个很有趣的问题,是关于函数的 length 属性的,题简写如下 (() => 1).length === 0; // 输出什么 我所理解的拥有 length 的对象一般都是数组或者类数组对象...JSON.stringify 在对象中遇到这些不安全的 JSON 值的时候会自动将其忽略,在数组中遇到则会返回 null,以保证数组成员位置不变 JSON.stringify(undefined); /...,反正我遇到了,一句话搞定 const isEven = num => num % 2 === 0; 格式化金钱 项目中我们经常会遇到金钱格式化需求,或者说数字格式化一下,方便阅读(数字比较大的情况下...list 配置,首先根据权限过滤出所有有权限的菜单项,然后每八个一分组,处理成一个二维数据来遍历菜单 const arrayGroupBySize = (arr, size = 2) => { const...len; i += size) { result.push(arr.slice(i, i + size)); } return result; }; 下划线与驼峰 做一些数据持久化的工作的时候经常会出现下划线命名和驼峰命名的转化

    1.6K10

    系统运维|用 Netdata 监控 Linux

    通过每个图表的右下方的按钮,Netdata还能让你控制图表的显示,重置,缩放。 Netdata图表控制 Netdata并不会占用多少系统资源,它占用的内存不会超过40MB。...当然,你的系统需要安装git。Git在Fedora系统是默认安装的。如果没有安装,你可以用下面的命令在命令行里安装git。...$sudodnfinstallgit安装好git后,你要把仓库“clone”到你的系统里。运行下面的命令。...Netdata的安装 如果一切顺利,你的系统上就已经安装并且运行了Netdata。安装脚本还会在相应的文件夹里添加一个卸载脚本,叫做netdata-uninstaller.sh。...如果你以后不想使用Netdata,运行这个脚本可以从你的系统里面卸载掉Netdata。 你可以通过systemctl查看它的运行状态。

    7.1K30

    Linux系统运维之修炼秘法

    那唯有将Linux运维这部功法修炼到至高境界。才有拿到高薪的机会。而本期讨论的就是如何修炼Linux运维。 首先先给大家看一下Linux运维工程师必备技能: 1. Linux系统基础 2....经常看到许多新手一遇到问题就论坛上去发帖,向高手求教。而且许多时候这些人似乎要求所谓的高手拥有灵丹妙药,对于他们的问题给出详细的解决方法甚至完善的步骤。其实这是最要不得的对待问题的态度。...当我们每次遇到问题时,都能记录当时的场景以及解决方法,随着我们学习的不断深入,那么我们所积累的知识也就越来越丰富。 5、要有很强的责任心和使命感。 基本上运维是系统对外提供服务的最后的把关者。...因此,一个系统对用户来说是不是稳定跟运维有很大的关系。特别是,当系统不出现问题的时候,许多运维都不重视容灾备份和数据安全,这样一旦系统出现了故障,系统的恢复就需要花很长的时间。...7、要有精益求精的精神 应该说运维的工作的弹性还是很大的。即可以非常粗造的运维一个系统,也可以持续改进、优化系统,使系统越来越高效的运行。

    3K00

    Linux系统运维之修炼秘法

    那唯有将Linux运维这部功法修炼到至高境界。才有拿到高薪的机会。而本期讨论的就是如何修炼Linux运维。...经常看到许多新手一遇到问题就论坛上去发帖,向高手求教。而且许多时候这些人似乎要求所谓的高手拥有灵丹妙药,对于他们的问题给出详细的解决方法甚至完善的步骤。其实这是最要不得的对待问题的态度。...当我们每次遇到问题时,都能记录当时的场景以及解决方法,随着我们学习的不断深入,那么我们所积累的知识也就越来越丰富。 5、要有很强的责任心和使命感。 基本上运维是系统对外提供服务的最后的把关者。...因此,一个系统对用户来说是不是稳定跟运维有很大的关系。特别是,当系统不出现问题的时候,许多运维都不重视容灾备份和数据安全,这样一旦系统出现了故障,系统的恢复就需要花很长的时间。...7、要有精益求精的精神 应该说运维的工作的弹性还是很大的。即可以非常粗造的运维一个系统,也可以持续改进、优化系统,使系统越来越高效的运行。

    2.6K00

    谈谈最近ES运维中遇到的几个有意思的问题

    一、Kibana 上无法正常Discovery 日志的问题 问题描述: 客户同一个集群,同一个索引里的某些文档,用API能直接搜出来,但是在discovery上不能正常搜索,换另外一个id又能正常展示....image.png image.png 问题产生背景: 客户该索引的数据来自2部分,1个是filebeat产生的带时间戳的,一个是客户自己用代码自己手动写入的忘记带时间戳字段。...二、Reindex 复制索引数据报错导致复制失败 问题描述: 客户将存量索引通过reindex的方式拷贝到新生产的索引上,ES 集群版本为:6.4.3 POST _reindex { "source":...当然,上面的问题,我们可以指定源索引的特定type进行复制迁移,这样就不必要求2个索引type一致了。参数如下: POST _reindex?...db_contentgram_test1", "type":"t_article_om_server" //新索引type } 以上,也能解决reindex报错的问题

    1.3K41

    谈谈最近ES运维中遇到的几个有意思的问题

    二、冷热集群索引生命周期策略不生效问题 客户问题: 申请了一个冷热集群,原意是热数据上的存储空间只能存1天,然后根据ILM自动挪动到warm节点上。...客户问题 客户在同一个节点上,运行了多个Logstash事件,一个接收filebeat发送过来的日志,然后过滤输出到ES,这个是正常的。...四、客户将mysql中的数据经JAVA转换后导入ES中数据解析失败问题 问题描述: 客户将mysql中的数据经JAVA转换后导入ES中存储,结果为0或者1的bool值结果,但是ES日志出现如下错误解析...ES侧重新修改索引字段类型为byte,reindex数据后,问题解决。 五、总结 以上4个是最近遇到的比较奇葩的ES问题,跟进耗时比较长,这里一并记录共享。...后续将持续更新有意思的运维问题。

    2.2K80

    77%的Linux运维都不懂的内核问题

    来源:高效运维 ID:greatops 前言 之前在实习时,听了 OOM 的分享之后,就对 Linux 内核内存管理充满兴趣,但是这块知识非常庞大,没有一定积累,不敢写下,担心误人子弟,所以经过一个一段时间的积累...这篇文章主要是分析了单个进程空间的内存布局与分配,是从全局的视角分析下内核对内存的管理; 下面主要从以下方面介绍 Linux 内存管理: 进程的内存申请与分配; 内存耗尽之后 OOM; 申请的内存都在哪...4、系统回收内存 当系统内存不足时,有两种方式进行内存释放,一种是手动的方式,另一种是系统自己触发的内存回收,先来看下手动触发方式。...简单说下 linux 内核自动回收内存原理,内核有一个 kswapd 会周期性的检查内存使用情况,如果发现空闲内存定于 pages_low,则 kswapd 会对 lru_list 前四个 lru 队列进行扫描...5、总结 这篇文章主要是写了 linux 内存管理相关的东西: 首先是回顾了进程地址空间; 其次当进程消耗大量内存而导致内存不足时,我们可以有两种方式:第一是手动回收 cache;另一种是系统后台线程

    2K80
    领券