首页
学习
活动
专区
工具
TVP
发布
您找到你想要的搜索结果了吗?
是的
没有找到

Kubernetes 遇到问题记录(1)

问题:老应用不能通过kubectl exec进入,新应用不能创建 ssh进入集群节点,telnet 本机 kubelete 服务端口 10250,可以。...删除旧IP pool calicoctl delete pool default-ipv4-ippool 问题:Failed to mount API filesystems, freezing....使用80端口,与haproxy冲突 问题:不同节点pod间无法通讯 /proc/sys/net/ipv4/ip_forward为0,ip转发功能关闭导致无法访问pod,改成1解决。...ok,有的环境有问题(从客户端curl服务端) 通过抓取sidecar15001端口,有问题环境15001端口tcp握手会失败,不会有ack响应,但ok环境tcp握手成功,请求正常处理。...有问题环境内核版本不支持ipv6iptables转发。ok环境内核支持。所以可以通过升级内核版本解决。

1.2K20

Kubernetes 遇到问题记录(4)

本篇内容都基于 https://github.com/imroc/kubernetes-guide 整理 偶现 DNS 解析失败 Kubernetes 集群网络有很多种实现,有很大一部分都用到了 Linux...但是 Linux 网桥是一个虚拟二层转发设备,而 iptables conntrack 是在三层上,所以如果直接访问同一网桥内地址,就会直接走二层转发,不经过 conntrack: Pod 访问 Service...常见问题现象就是偶现 DNS 解析失败,当 coredns 所在节点上 pod 解析 dns 时,dns 请求落到当前节点 coredns pod 上时,就可能发生这个问题。...Service 同节点通信问题,这也是为什么在 Kubernetes 环境中,大多都要求开启 bridge-nf-call-iptables 原因。...,从而也能完美解决 SHELL 无法传递信号问题,并且还有回收僵尸进程能力。

86820

linux

Linux下php-fpm进程过多导致内存耗尽问题解决 当个人博客数据库服务经常突然挂断,造成无法访问时我们能做什么?...本篇主题就是记录博主针对这一现象时发现问题,分析问题,最后解决问题过程。...,但是随着团队经验丰富和人员扩张,我会适时地更新本文,分享我们在使用 GIT 开发流程中遇到问题和解决方案。...Linux服务器被黑遭敲诈,如何在3小时内紧急逆袭 作者介绍:陈浩,北信源研发工程师,五年Linux工作经验,热衷技术研究、实践和团队分享。...看完就会用 GIT 操作图解分析 无论你是前端还是后台,无论是还是移动端研发,GIT 是逃避不了东西,当然你说你要用 SVN,那不在这次讨论范围之内。

13.9K30

谈谈最近ES遇到几个有意思问题

一、Kibana 上无法正常Discovery 日志问题 问题描述: 客户同一个集群,同一个索引里某些文档,用API能直接搜出来,但是在discovery上不能正常搜索,换另外一个id又能正常展示....image.png image.png 问题产生背景: 客户该索引数据来自2部分,1个是filebeat产生带时间戳,一个是客户自己用代码自己手动写入忘记带时间戳字段。...二、Reindex 复制索引数据报错导致复制失败 问题描述: 客户将存量索引通过reindex方式拷贝到新生产索引上,ES 集群版本为:6.4.3 POST _reindex { "source":...当然,上面的问题,我们可以指定源索引特定type进行复制迁移,这样就不必要求2个索引type一致了。参数如下: POST _reindex?...db_contentgram_test1", "type":"t_article_om_server" //新索引type } 以上,也能解决reindex报错问题

1.3K40

谈谈最近ES遇到几个有意思问题

二、冷热集群索引生命周期策略不生效问题 客户问题: 申请了一个冷热集群,原意是热数据上存储空间只能存1天,然后根据ILM自动挪动到warm节点上。...客户问题 客户在同一个节点上,运行了多个Logstash事件,一个接收filebeat发送过来日志,然后过滤输出到ES,这个是正常。...四、客户将mysql中数据经JAVA转换后导入ES中数据解析失败问题 问题描述: 客户将mysql中数据经JAVA转换后导入ES中存储,结果为0或者1bool值结果,但是ES日志出现如下错误解析...ES侧重新修改索引字段类型为byte,reindex数据后,问题解决。 五、总结 以上4个是最近遇到比较奇葩ES问题,跟进耗时比较长,这里一并记录共享。...后续将持续更新有意思问题

2K80

77%Linux都不懂内核问题

来源:高效 ID:greatops 前言 之前在实习时,听了 OOM 分享之后,就对 Linux 内核内存管理充满兴趣,但是这块知识非常庞大,没有一定积累,不敢写下,担心误人子弟,所以经过一个一段时间积累...这篇文章主要是分析了单个进程空间内存布局与分配,是从全局视角分析下内核对内存管理; 下面主要从以下方面介绍 Linux 内存管理: 进程内存申请与分配; 内存耗尽之后 OOM; 申请内存都在哪...因此 drop_caches 能释放就是当从磁盘读取文件时缓存页以及某个进程将某个文件映射到内存之后,进程退出,这时映射文件缓存页如果没有被引用,也是可以被释放。...简单说下 linux 内核自动回收内存原理,内核有一个 kswapd 会周期性检查内存使用情况,如果发现空闲内存定于 pages_low,则 kswapd 会对 lru_list 前四个 lru 队列进行扫描...5、总结 这篇文章主要是写了 linux 内存管理相关东西: 首先是回顾了进程地址空间; 其次当进程消耗大量内存而导致内存不足时,我们可以有两种方式:第一是手动回收 cache;另一种是系统后台线程

2K80

Linux系统问题解决(一)

[TOC] 主要记录工作和学习中遇到一些问题; Q:挂载目录进行卸载挂载繁忙,如:umount: /var: device is busy A:解决方法 fuser -m -v /dev/mapper..., (2) 当安装依赖包错误时候进行一起安装即可(不知道谁与谁有依赖关系,就都一起安装就好了,亲测有效)) Q:Centos6.x安装/升级到python2.7 A:因为在linux机器上用yum安装默认是...local/lib/python2.7/site-packages (python 2.7) CentOS7 Failed to start LSB: Bring up/down networking 问题...原因是mac地址问题 systemctl status network。 #解决方案如下: 1....答:有先决条件,就是在进程中被打开,在内存中被分配资源; 恢复原理: 在Linux系统中,每个运行中程序都有一个宿主进程彼此隔离,以/proc/进程号来体现(Linux本质上就是一个文件系统) 比如:

2.9K10

linux前景

薪水前景: 总的来说,薪水普遍比开发人员略低一点。这是因为上手工作比开发门槛略低,市场上有很多运人员处于“会搭建服务”状态。...但是随着你个人能力提升,金字塔效应一样会很明显。各大公司都需要技艺高超人员,开出价格并不会比你同龄开发人员明显低。...目前我所遇到薪水最高人员,薪资在40W左右,据说也有人在50W左右年薪,我目前没有见过50W,不敢妄下结论....如果有兴趣,建议大家读一下>这本书,对你做好自己职业规划有很大帮助. 学习路上,有童鞋所关注问题? 1. 行业加班多吗?...另外如果你要学Linux,最重要不是考虑你多大合不合适,好不好学问题,而是应该考虑自己要在哪个城市定居,如果在北上广深,立刻动身去学.如果是打算定居在三线四线城市,一定要先看看有没有合适你企业和工作再去学

6.7K30

工具】因为K8s,人员遇到职业危机....

点击立即体验WeOps众所周知容器(docker)是一艘航行在IT大海里“轮船”为了驶向彼岸,需要一个“船舵”(K8S)那如何更好更快地前行呢?...你需要“We Operations”统一管理,让船上“货物”井井有条统一监控,“货物”故障提前感知,更快解决问题下面正式介绍多才多艺:嘉为蓝鲸一体化平台WeOps!...全栈适配国产化+容器+传统架构软硬件全栈适配,统一管理。成熟稳定腾讯每年3亿重金打造+超10年持续迭代+支撑30w节点实践,构建成熟稳定平台。...轻量部署轻量化,支持单机部署,20+年专家经验沉淀+10万用户市场验证,内置场景,一键启用。持续研发300+高阶研发团队+公司营收20%作为研发费用,与时俱进,保持领先。...----若您对WeOps平台感兴趣,希望了解更多产品内容,欢迎去官网联系嘉为蓝鲸,我们将为您提供最新产品材料与产品试用。

65210

Zookeeper问题集锦

实际工作中用到Zookeeper集群地方很多, 也碰到过各种各样问题, 在这里作个收集整理, 后续会一直补充; 其中很多问题原因, 解决方案都是google而来, 这里只是作次搬运工; 其实很多问题都跟配置有关..., 只怪自己没好好读文档; 问题列表: 1....restart, 但问题依旧, 故查看zklog, 有大量的如下日志 2017-07-18 17:31:12,015 - INFO [WorkerReceiver Thread:FastLeaderElection...解决方案: 保持这台有问题zk现状, 按myid从小到大依次重启其他zk机器; 原因: zk是需要集群中所有机器两两建立连接, 其中配置中3555端口是用来进行选举时机器直接建立通讯端口, 大...zk服务; 深究: 关于tcp连接队列,这篇文章很不错: How TCP backlog works in Linux

1.8K10

linux平台下server问题分析与定位

结合我工作中碰到问题,总结一下linux下server常见问题以及定位方式。...逻辑server一般是自主开发,虽然在上线前大都经过功能和压力测试,但放到现网环境上部署后还是难免会出现一些问题,有些问题是在灰度发布时就可以发现,而有些问题则是一个漫长暴露过程。...编码问题导致系统处理能力较差 其实这个范畴不能算是运营问题,但是处理能力较差系统会很容易到达瓶颈。在编码过程中,一定要注意避免无谓开销,特别是系统调用等。...以上总结了常见问题和定位方法,相信大家大致有一套自已定位问题方法,这里我谈下我定位问题基本流程,供大家参考:     1....无小事,在系统过程中,出现问题可能五花八门,但系统接入和处理能力相关关键指标其实并不多,只要把握关键点,就不难定位出问题所在。更多方法、心得与体会,欢迎大家一起探讨。

1.1K10

linux中iostat命令_linux维和网络

系列专题:Linux入门教程 ---- Linux系统中iostat是I/O statistics(输入/输出统计)缩写,iostat工具将对系统磁盘操作活动进行监视。...testsuite/sadist/iostat sysstat-10.1.5-19.el7.x86_64 : Collection of performance monitoring tools for Linux...实践 3.1 常用参数 [root@devvm ~]$ iostat -x Linux... avg-cpu: %user %nice %system %iowait %steal %idle...举例子:如果util达到100%,那么此时svctm=1000/(r/s+w/s),假设IOPS是1000,那么svctm大概在1毫秒左右,如果长时间大于这个数值,说明系统出了问题。...这个时间包括了队列时间和服务时间,也就是说,一般情况下,await大于svctm,它们差值越小,则说明队列时间越短,反之差值越大,队列时间越长,说明系统出了问题

9.7K30

开发中期潜在问题

整体看起来,整个开发项目是活跃。 ? 随着后期建立了一些明确项目有了公司明确支持,开发更新频率也提高了不少。显然之前不是问题问题也逐渐出现了。...这也算是平台化建设过程中到了中期会发现很多潜在问题。...首先就是对于问题和需求管理,现在已经有一种快失控状态,需求有很多,bug也有很多,能够收到反馈,对于产品改进是极好,所以大多数情况下我会把问题都记录下来,同时在解决问题过程中会产生很多改进需求...自己规划和设计思路,现在和实践能力已经开始脱钩了,这就导致了一个问题,那就是功能有了雏形,但是还没有精力去细化和打造,所以会成为一个两难境地,设计的人想明白了,可以预见到高大上功能,但是开发小组同学在这个阶段还没法理解...对于上面的问题,随着使用程度和数据量增长,这些潜在问题影响力会逐步放大,所以需要打起精神,把这些问题都能够深入解决,也算是对于平台建设精益求精一个最佳实践了。

46820

Linux初级常用命令面试问题

各位小伙伴快来看看这里基础题目都能完全掌握嘛? 欢迎各路大神留言或投稿自己遇到面试题目! 请小伙伴们先只看以下题目部分,自己先思考下答案!...(不要偷看后面的答案部分) 题目部分 1、如何查看当前Linux服务器运行级别? 2、如何查看Linux默认网关? 3、如何在linux上重建初始化内存盘镜像文件? 4、cpio命令是什么?...8、如何识别Linux系统中指定文件(/etc/fstab)关联包? 9、哪条命令用来查看bond0状态? 10、linux系统中/proc文件系统有什么用?...19、linuxat命令有什么用? 20、linux中lspci命令作用是什么? 暂停一下,先别往下翻,自己先动脑思考下吧!检验下自己掌握程度!...who -r和 runlevel 命令可以用来查看当前Linux服务器运行级别。 2、如何查看Linux默认网关? 用 route -n和 netstat -nr 命令,我们可以查看默认网关。

3.7K50
领券