腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Stackdriver
创建
检查
GKE
pods
/
deployments
状态
的
警报
?
google-kubernetes-engine
、
stackdriver
、
google-cloud-stackdriver
此外,我希望在
GKE
集群停止可访问时触发
警报
,因此没有
pods
/部署
的
状态
。 问题是关于Kubernetes
的
新
Stackdriver
,它目前处于测试阶段。实际上,我想知道如果手动销毁集群,pod
警报
会发生什么。
Stackdriver
是否检测到集群已经消失,并仍然管理
警报
(根据指标,可能会有'0‘值)?
浏览 13
提问于2020-01-10
得票数 0
5
回答
使用
Google Container Engine (
GKE
)和
Stackdriver
监控和提醒pod
状态
或重启
kubernetes
、
monitoring
、
google-kubernetes-engine
、
stackdriver
、
google-cloud-stackdriver
有没有办法通过
Stackdriver
监控
GKE
集群中运行
的
pod
状态
和重启pod数量?虽然我可以在
Stackdriver
中看到所有
pods
的
CPU、内存和磁盘
使用
指标,但似乎无法获得有关崩溃
pods
或副本集中因崩溃而重新启动
的
pods
的
指标。我
使用
Kubernetes副本集来管理pod,因此当它们崩溃时,它们会重新生成并
使用
新名称
创建</
浏览 0
提问于2017-05-05
得票数 22
1
回答
同一台服务器
GKE
上运行同一部署
的
两个
pods
如何
告警
google-kubernetes-engine
、
google-cloud-stackdriver
我有3个
pods
在3个服务器上运行。3个
pods
来自相同
的
部署。如果2个
pods
在1个节点中运行,我希望发出
警报
。是否可以在
Stackdriver
中
创建
警报
。是否可以在
Stackdriver
中
使用
kubectl get
pods
-o wide -n mynamespace来满足此需求。
浏览 40
提问于2021-01-13
得票数 0
2
回答
如何
获得可用于HPA
的
指标列表?
kubernetes
、
google-cloud-platform
、
horizontal-scaling
、
hpa
我有包含
GKE
应用程序
的
GCP集群: 我想
使用
来扩展应用程序能够读取指标的 根据建议
的
答案,我执行了命令: kubectl get --raw https://MY-KUBE-APISERVER-IP:6443/apis/met
浏览 4
提问于2020-02-04
得票数 3
1
回答
监视在
GKE
上运行
的
Cron作业
kubernetes
、
google-cloud-platform
、
cron
、
cloud
、
monitoring
我试图监视在
GKE
上运行
的
CronJob,我看不到一种
检查
CronJob是否实际运行
的
简单方法。如果CronJob运行
的
时间不超过X,并且
Stackdriver
似乎不支持这一点,我想触发一个
警报
。目前,我尝试
使用
基于日志指标的
警报
,但这只能在应用程序崩溃或特定错误时发出
警报
,而不是针对平台错误本身。 我研究了一个
使用
Prometheus
警报
的
解决方案,它能集成到<
浏览 1
提问于2019-09-16
得票数 4
2
回答
Pod处于待定
状态
,但开启了自动缩放功能,为什么不起作用?
kubernetes
、
google-kubernetes-engine
、
autoscaling
我有一个包含5个节点
的
GKE
集群,我启用了自动扩展,如下所示 enabled: true minNodeCount: 1如果我看到我
的
资源
的
统计数据167m 17% 2661Mi 10
浏览 0
提问于2019-09-16
得票数 0
1
回答
使用
GKE
在Kubernetes部署中丢失
Stackdriver
中
的
日志
logging
、
google-cloud-platform
、
google-kubernetes-engine
、
google-stackdriver
目前,在
GKE
日志记录下运行28+部署,
使用
自动流畅
的
集合对
Stackdriver
进行日志记录。主K8s版本: 1.10.6-
gke
.2 每分钟记录大约200个JSON字符串,分布在多个荚中。 在
Stackdriver
中,我们正在经历日志摄入
的
间歇性缺口。当
使用
kubectl
检查
日志时,我们可以清楚地看到以正确
的
结构化日志格式生成
的
日志。删除
浏览 0
提问于2018-09-03
得票数 0
1
回答
无法将部署
创建
角色分配给Kubernetes中
的
serviceAccount
kubernetes
、
google-kubernetes-engine
、
rbac
、
kubernetes-deployment
我希望拥有一个可以
创建
展开
的
服务帐户。因此,我
创建
了一个服务帐户,然后是一个角色,然后是一个角色绑定。-
deployments
- replicasets - createdefault kind: Role apiGroup: rbac.authorization.k8s.io 但是在应用这些文件之后,当我执行以下命令来
检
浏览 13
提问于2019-12-12
得票数 1
回答已采纳
1
回答
与Prometheus操作符舵图
kubernetes
、
google-cloud-platform
、
google-kubernetes-engine
、
kubernetes-helm
、
stackdriver
我们已经
使用
头盔图在
GKE
集群上设置了Prometheus + Grafana。现在,我们希望将一些度量导出到
Stackdriver
,因为我们已经安装了自定义指标
Stackdriver
适配器。我们已经在
使用
Stackdriver
中
的
一些Pub/Sub度量来自动标度少量
的
部署。现在,我们还希望在其他部署
的
自动标度中
使用
一些Prometheus度量(主要是nginx请求速率)。因此,我
的
第一个
浏览 4
提问于2020-06-18
得票数 1
回答已采纳
2
回答
如何
使用
PersistentVolumeClaim在Deployment/Pod上挂载持久卷?
kubernetes
、
google-kubernetes-engine
、
persistent-volume-claims
accessModes: resources: storage: 2Gi我验证了持久卷声明是正常
的
,
浏览 14
提问于2020-03-05
得票数 0
2
回答
来自服务器(NotAcceptable)
的
错误:未知
kubernetes
、
kubectl
、
google-kubernetes-engine
昨天,利用Terraform在Google平台上
创建
了一个网络和一个
GKE
集群。整个过程在CentOS 7 VM上运行,并同时安装gcloud、kubectl和helm。我还
使用
来安装Spinnaker。然
浏览 3
提问于2018-06-28
得票数 6
2
回答
Kubernetes HPA无法从堆栈驱动程序中检测到成功发布
的
自定义度量。
kubernetes
、
google-kubernetes-engine
、
stackdriver
、
google-cloud-stackdriver
我正在尝试
使用
一个HorizontalPodAutoscaler来扩展一个Kubernetes HorizontalPodAutoscaler,它通过
Stackdriver
监听一个定制
的
度量标准。我有一个
GKE
集群,启用了
Stackdriver
适配器。我能够将定制
的
度量类型发布到
Stackdriver
,下面是它在
Stackdriver
的
度量资源管理器中
的
显示方式。 我已经给出了适当
的</em
浏览 0
提问于2019-04-07
得票数 2
回答已采纳
2
回答
基于Kubernetes度量
的
Google云
GKE
水平吊舱自动标度
kubernetes
、
google-cloud-platform
、
google-kubernetes-engine
、
horizontal-pod-autoscaling
我想在HPA上
使用
pod网络接收字节计数标准kubernetes指标。
使用
下面的yaml来实现这一点,但是获得错误,比如无法从自定义度量API中获取度量:没有注册自定义度量API (custom.metrics.k8s.io) kind: Deployment minReplicas: 2 metrics: met
浏览 2
提问于2020-11-06
得票数 2
回答已采纳
3
回答
GKE
的
Cloud Run发生了什么?
kubernetes
、
google-cloud-platform
、
google-kubernetes-engine
web上
的
一些资源指出了
GKE
的
Cloud Run
的
存在。例如,这个谷歌,这个来自谷歌
的
YouTube 和这个LinkedIn training 。然而,当您尝试
使用
Google Cloud web控制台
创建
一个新
的
Kubernetes集群时,Cloud Run for
GKE
功能似乎消失了。在“附加功能”下启用Istio和Cloud Run for
GKE
的
复选框不再可用。(请参阅此LinkedI
浏览 1
提问于2019-10-28
得票数 4
1
回答
我们
如何
在Google Cloud Plarform中可视化Dataproc作业
状态
?
google-cloud-platform
、
google-cloud-dataproc
、
stackdriver
、
google-cloud-stackdriver
我们
如何
在Google Cloud Platform中可视化(通过仪表板) Dataproc作业
状态
? 我们想要
检查
作业是否正在运行,以及它们
的
状态
,如正在运行、延迟、阻塞。最重要
的
是,我们还想设置
警报
(
Stackdriver
警报
)。
浏览 3
提问于2018-10-29
得票数 0
1
回答
是否可以
创建
堆栈驱动程序
警报
,以便在任何K8
pods
关闭时发出
警报
?
stackdriver
我有以下设置:(GCP LB for SSL) (NodePort) (containingthe application) 我可以设置一个
stackdriver
HTTPS正常运行时间
警报
,以便在站点关闭时通知,但这只会在所有n个pod都不起作用时发出
警报
。是否可以
创建
堆栈驱动程序
警报
,以便在n个应用程序pod中
的
任何一个关闭时发出<
浏览 6
提问于2017-02-14
得票数 1
1
回答
如何
在Google Kubernetes引擎中持久化pod生命周期
状态
和事件?
kubernetes
、
google-kubernetes-engine
我们在1.9.6-
gke
.1上
使用
Google Kubernetes引擎,并且有一个带有几个节点池
的
集群,我们为这些节点池启用了自动伸缩,因为其中
的
节点包含附加
的
GPU (p100s)。有时我们通过Kubernetes Pod在由于触发
的
自动伸缩事件而启动
的
节点上通宵运行作业,许多小时后返回时发现pod已经消失,因为pod已经终止,处于某种未知
状态
,并且由于10分钟内没有其他pod调度到该节点也就是说,一旦节点消失,pod就会从Kubernetes日志
浏览 2
提问于2018-05-23
得票数 2
1
回答
关于群集备份
kubernetes
、
google-cloud-platform
、
backup
、
google-kubernetes-engine
我想了解有关集群备份
的
事情。我看到了这个文档,但这似乎更多地是关于GCP集群
的
。我看到很少有博客谈到
GKE
特性来
创建
现有
GKE
集群
的
克隆,但我在GCP控制台中找不到通过克隆现有
GKE
集群来
创建
新集群
的
任何选项。 请有人确认一下,
GKE
中是否仍然存在此克隆特性,还是不建议
使用
?除了克隆
GKE
集群之外,我们还需要备份集群资源和PersistentVolumes。似乎Veloro是一个
浏览 3
提问于2020-09-29
得票数 2
回答已采纳
1
回答
GCP Kubernetes所有日志都显示为错误日志
kubernetes
、
stackdriver
堆栈驱动程序中
的
所有容器日志都显示为severity:error。 这是正常
的
吗?谢谢
浏览 2
提问于2020-01-15
得票数 0
1
回答
如何
在
GKE
(google kubernetes engine)中运行kubeadm命令
kubernetes
、
google-kubernetes-engine
我
使用
GKE
创建
集群。但是kube-system命名空间中没有kube-apiserver工作负载,
使用
ssh连接主节点时也没有kubeadm可执行文件。但我在GCE(谷歌计算引擎)虚拟机中
使用
"kubeadm init“
创建
kubernetes,并且在运行"kubectl get
pods
-n kube-system”时出现kube-apiserver对于这两种情况,我都
使用
标准-2机器(2CPU,7.5G)。 我想用kubea
浏览 8
提问于2020-07-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
当 Pod 崩溃后如何在报警信息中获取对应的日志信息?
Kubernetes 1.12带来卷快照、TLS改进等
最受印度用户欢迎的相机产品之一,美图BeautyPlus和它背后的 Google Cloud
如何用Prometheus和Grafana监控Kubernetes集群?
加速Kubernetes部署的最佳实践
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券