查看超过5天的错误pod_查看退出pod的日志_查看pod状态的所有变化 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

FullGC没及时处理，差点造成P0事故

上线新功能后，要多观察。如果出现不稳定性的情况，需要高优先级查清原因，避免出现更大的问题。

03

Prometheus Operator 常用指标

Prometheus Operator 安装完成后会有很多默认的监控指标，一不注意就大量的报警产生，所以我们非常有必要了解下这些常用的监控指标，有部分指标很有可能对于我们自己的业务可有可无，所以可以适当的进行修改，这里我们就来对常用的几个指标进行简单的说明。

05

您找到你想要的搜索结果了吗？

是的

没有找到

Prometheus监控规则说明

关于 CPU 的 limit 合理性指标。查出最近5分钟，超过25%的 CPU 执行周期受到限制的容器。表达式：

02

运维记录--K8S中java程序频繁死掉killed

上周上线完之后，平台频繁出现问题，从服务器查看pod状态为Running 但是从日志中查看就是直接被killed 检查过nginx日志、数据库等未发现异常

01

人生苦短，我用k8s--------------k8s实战排障思路

K8S是一个开源的，用于管理云平台中多个主机上的容器化应用，Kubernetes的目标是让部署容器化变得简单并且高效

03

2020年企业运维经典面试题汇总

将近两年多没给大家更新文章了，今天晚上来点干货。总体来说19年到现在大环境不太好，各行各业都受影响，前段时间听说苏宁开启全员卖货模式，连副总裁都开始在朋友圈卖内裤了，哈哈哈，真是患难见忠臣啊，当然也听说xx二手车强制转岗、降薪，变相裁员。疫情期间让员工主动离职，不给赔偿，更可恶的是HR私自登录员工系统提交离职报告。我微信里的一个做二手服务器回收的老哥，18年收了两千多万的服务器，去年一半都不到；还有的朋友，单位开不出来工资，生活也受到很大的影响。总而言之，我是比较幸运的，有稳定的工作，有时候也会做一些游戏代练挣一些外快，反正吃饱饭是没问题了，哈哈。

00

业务上云使用腾讯云日志服务方案

日志服务（Cloud Log Service，下文简称CLS服务）是腾讯云提供的一站式日志数据解决方案，可以快速便捷的接入，享受日志采集、日志存储到日志内容搜索、统计分析等全方位稳定可靠的日志服务。下文讲解业务接入腾讯云日志服务方案。

09

Kubernetes Pod 故障归类与排查方法

Docker 是 Kubernetes Pod 中最常用的容器运行时，但 Pod 也能支持其他的容器运行，比如 rkt、podman等。

04

k8s pod被驱逐问题分析及解决

异常信息：kubectl get pod发现服务被驱逐，然后在调度到其它节点过程中出现问题，之所以出现问题是因为编排文件中添加了污点，已经标注该Pod不能被调度到其它节点。但是为什么会出现Pod被驱逐，这倒是个问题？查看/var/log/messages中日志，发现大量镜像无法被拉取的错误，如下所示：

04

优化生产环境中的 Kubernetes 资源分配

我和 Kubernetes 的初次接触就涉及到将应用容器化并部署到生产环境集群中，当时我的工作重点是把 buffer 吞吐量最高（低风险）的某个端点从单个应用程序中分离出来，因为这个特殊的端点会给我们带来很大的困扰，偶尔还会影响到其他更高优先级的流量。

03

047.集群管理-资源及配额管理

对于Kubernetes资源，有两个重要参数：CPU Request与Memory Request。

03

6 张配图通俗易懂说透 K8S 请求和限制

在 Kubernetes 中使用容器时，了解涉及的资源是什么以及为何需要它们很重要。有些进程比其他进程需要更多的 CPU 或内存。这很关键，永远不应该让进程挨饿。知道了这一点，我们应该正确配置容器和 Pod，以便充分利用两者。

02

操作指南：调试Kubernetes应用程序

调试Kubernetes应用程序通常是一个痛苦的过程，充满未知和不可预知的副作用。当你的Kubernetes集群没有自我愈合时会发生什么？错误配置的资源限制如何影响应用程序在生产环境中运行？如果不遵循一些基本原则，处理这些问题通常会使调试Kubernetes成为一个非常困难的过程。

02

一文搞懂Kubernetes的Limits和Requests

当在Kubernetes中使用容器时，重要的是要知道所涉及的资源是什么以及如何需要它们。有些进程比其他进程需要更多的CPU或内存。有些是关键的，不应该被饿死。

02

HPA|聊聊K8S的横向扩容能力

HPA似乎很简单。我通过遵循所有的文档来启用它。但它对我不起作用! 这是真的，HPA(水平Pod自动定标器)不工作的某些应用或者是应用程序所有者做了什么错误的事情，破坏了HPA?继续往下读吧。在继续

01

【TKE】平台常见问题 QA

本文章将以 QA 方式记录在使用 TKE 产品过程中的可能会遇到的常见问题解答，将不定期更新。

07

k8s资源管理

Pod的两个重要参数：CPU Request与Memory Request来表示容器最少所需的CPU和Memory。 Pod的两个重要参数：CPU Limitst与Memory Limits来表示容器最多只能使用的CPU和Memory。

01

企业运维经典面试题汇总(5)

Git没有一个全局版本号，而SVN有：目前为止这是跟SVN相比Git缺少的最大的一个特征

03

k8s实践(5）k8s的命名空间Namespace

你可以认为namespaces是你kubernetes集群中的虚拟化集群。在一个Kubernetes集群中可以拥有多个命名空间，它们在逻辑上彼此隔离。他们可以为您和您的团队提供组织，安全甚至性能方面的帮助！

04

【重识云原生】第六章容器基础6.4.8节——CronJob

一个 CronJob 对象就像 crontab (cron table) 文件中的一行。它用 Cron 格式进行编写，并周期性地在给定的调度时间执行 Job。

03

解读Kubernetes常见退出码

在这篇文章中，我们将深入分析Kubernetes中的典型退出码127与137，解释它们是什么，K8s和Docker中常见的原因是什么，以及如何修复

01

Kubernetes 触发 OOMKilled(内存杀手)如何排除故障

对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大众理想的懦弱回归，是随波逐流，是对内心的恐惧 ——赫尔曼·黑塞《德米安》

02

009.OpenShift管理及监控

用于调度，并控制pod不能在计算资源少于指定数量的情况下运行。调度程序试图找到一个具有足够计算资源的节点来满足pod请求。

03

Kubernetes集群多租户资源管理

先讲解Pod的两个重要参数：CPU Request与Memory Request。在大多数情况下我们在定义Pod时并没有定义这两个参数，此时Kubernetes会认为该Pod所需的资源很少，并可以将其调度到任何可用的Node上。这样一来，当集群中的计算资源不很充足时，如果集群中的Pod负载突然加大，就会使某个Node的资源严重不足。

02

Kubernetes 触发 OOMKilled(内存杀手)如何排除故障 | 技术创作特训营第一期

对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大众理想的懦弱回归，是随波逐流，是对内心的恐惧 ——赫尔曼·黑塞《德米安》

05

Kubernetes-控制器之Deployment

Deployment为Pod和ReplicaSet提供了一个声明式定义(declarative)方法，用来替代以前的ReplicationController来方便的管理应用。典型的应用场景包括：

02

处理一次k8s、calico无法分配podIP的心路历程

某天，上kplcloud构建一个测试应用，构建完成之后发现新pod一直启动失败，并且抛出了以下错误信息:

04

处理一次k8s、calico无法分配podIP的心路历程

某天，上kplcloud构建一个测试应用，构建完成之后发现新pod一直启动失败，并且抛出了以下错误信息:

04

ASP.NET Core on K8S深入学习（6）Health Check

本篇已加入《.NET Core on K8S学习实践系列文章索引》，可以点击查看更多容器化技术相关系列文章。

01

微软出品·kubernetes最新学习指南 v3.0

Kubernetes正在席卷应用开发世界。到2022年，全球超过75％的组织将在生产环境中运行容器化应用程序。Kubernetes正在塑造应用程序开发和管理的未来-微软希望今天帮助您开始使用它。于是微软出品了一个Kubernetes的学习路径指南

01

k8s 1.20发布

我们很高兴宣布Kubernetes 1.20的发布，这是2020年的第三版也是最终版！此版本包含42个增强功能：11个增强功能已逐步升级为稳定版，15个增强功能已转换为Beta版，16个增强功能已进入alpha版。

01

使用 Thanos+Prometheus+Grafana 打造监控系统

对于弹性伸缩和高可用的系统来说，一般有大量的指标数据需要收集和存储，如何为这样的系统打造一个监控方案呢？本文介绍了如何使用 Thanos+Prometheus+Grafana 构建监控系统。

02

使用 Thanos 和 Prometheus 打造一个高可用的 Kubernetes 监控系统

对于弹性伸缩和高可用的系统来说，一般有大量的指标数据需要收集和存储，如何为这样的系统打造一个监控方案呢？本文介绍了如何使用 Thanos+Prometheus+Grafana 构建监控系统。

02

Kubernetes 如何优雅的重启Pod

在应用程序的整个生命周期中，正在运行的 pod 会由于多种原因而终止。在某些情况下，Kubernetes 会因用户输入（例如更新或删除 Deployment 时）而终止 pod。在其他情况下，Kubernetes 需要释放给定节点上的资源时会终止 pod。无论哪种情况，Kubernetes 都允许在 pod 中运行的容器在可配置的时间内正常关闭。

02

定制化JDK升级引发的离奇事件

1、背景由于Oracle对外宣称Oracle JDK停止免费用于商用。公司法务部门评估之后担心后续会惹上光司，于是就开始了JDK升级-将所有服务Oracle修改为OpenJDK。上周开始微服务JD

02

记一次请求接口出现400响应码的诡异错误实录

最近业务碰到了一个诡异的400接口请求异常，部门用户通过浏览器访问会出现400响应码错误，部分用户又能正常访问。该接口用postman请求访问，都能正常返回数据。后端写客户端请求该接口，也都能返回正常的数据。本文就来记录一下这次问题

01

【图解】Kubernetes Deployment 故障排查指南

如果你不知道从何下手，那么在 Kubernetes 中排查故障可能会是一项艰难的任务。文本以超详细的图解说明了如何对 Kubernetes Deployment 进行故障排查，相信会对你有启发。

03

院长手把手教学---CronJob实验

[root@k8s-master ~]# kubectl apply -f cronjob.yaml

03

容器健康检查使用小结

Readiness：确保业务启动OK，再加入Service负载均衡。如果不用service，不配也可。

07

千丈之堤，以蝼蚁之穴溃：一个慢SQL引发的雪崩

早上8:40左右，地铁上，在跟小伙伴聊天，接到电话“是不是服务出问题了？” 第一个反应，不可能吧。昨天又没有上线，前天刚优化过，并且又没有收到告警。

04

022.掌握Pod-Pod升级和回滚

若Pod是通过Deployment创建的，可以在运行时修改Deployment的Pod定义（spec.template）或镜像名称，并应用到Deployment对象上，系统即可完成Deployment的自动更新操作。如果在更新过程中发生了错误，则还可以通过回滚操作恢复Pod的版本。

01

图解 K8S 中 SpringBoot Pod 如何优雅关闭，减少对客户端影响

在应用程序的整个生命周期中，正在运行的 pod 会由于多种原因而终止。在某些情况下，Kubernetes 会因用户输入（例如更新或删除 Deployment 时）而终止 pod。在其他情况下，Kubernetes 需要释放给定节点上的资源时会终止 pod。无论哪种情况，Kubernetes 都允许在 pod 中运行的容器在可配置的时间内正常关闭。

01

k8s优雅停服

在应用程序的整个生命周期中，正在运行的 pod 会由于多种原因而终止。在某些情况下，Kubernetes 会因用户输入（例如更新或删除 Deployment 时）而终止 pod。在其他情况下，Kubernetes 需要释放给定节点上的资源时会终止 pod。无论哪种情况，Kubernetes 都允许在 pod 中运行的容器在可配置的时间内正常关闭。

02

容器计算资源管理&网络QoS的实现---Openshift3.9学习系列第四篇

在OCP中，每个计算节点（默认是node节点，master节点通过配置也可以运行业务，但不建议这么做。）对于pod而言，CPU和内存都是属于计算资源。

03

动态清理 K8S OOM 和 CPU 节流

使用 Kubernetes 时，内存不足 (OOM) 错误和 CPU 节流是云应用程序中资源处理的主要难题。

02

压测工具平台案例库

使用http cookie manager获取登陆接口响应头中的cookie值，cookie引用变量名正确，但获取到的cookie没有生效，接口仍然报错401

03

动图理清 K8S OOM 和 CPU 节流

使用 Kubernetes 时，内存不足 (OOM) 错误和 CPU 节流是云应用程序中资源处理的主要难题。

02

在Kubernetes中如何针对Namespace进行资源限制？

LimitRange有个好听的中文名字，叫"资源配置访问管理"。用过K8S的都知道，在默认情况下，K8S不会对Pod进行CPU和内存限制，这就意味着这个未被限制的Pod可以随心所欲的使用节点上的CPU和内存，如果某个Pod发生内存泄漏那么将是一个非常糟糕的事情。所以正常情况下，我们在部署Pod的时候都会把Requests和Limits加上，如下：

03

落地k8s容易出现13个实践错误

在我们多年使用kubernetes的经验中，我们有幸看到了很多集群（在GCP，AWS和Azure上都是托管的和非托管的），并且我们看到一些错误在不断重复。

02

全链路压测如何排障调优 — 案例篇：腾讯微服务平台TSF最佳实践

微服务是一种架构模式，提倡将一个大型复杂的单体架构拆分成一个个微服务。服务内部是高内聚，服务之间是低耦合。

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭