首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#集群

保持集群精益意味着什么?

云云众生s

遵循精益方法可以帮助我们显著提高 Kubernetes 的投资回报率,改善工作负载性能,并节省维护和故障排除的时间。

700

说说Headless Service

用户11097514

腾讯 · 业务运维 (已认证)

在多个地理区域或多个 Kubernetes 集群中部署应用,以确保即使一个区域或集群发生故障,其他区域或集群仍能继续提供服务。这通常涉及跨区域的负载均衡和数据同...

4900

MongoDB教程(七):mongoDB分片

用户11147438

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快!

3110

集群及分布式定时任务中间件MEE_TIMED

上帝

MEE_TIMED一套开源的定时任务中间件,MEE_TIMED 简化了 scheduled及shedlock的配置,同时也升级了这两种中间件的能力 ,使定时任务...

4410

一款 AI 编写的 Kubernetes 实用小工具,助你批量检查容器服务健康状态

iMike

check-k8s-network 是一款 AI 编写的 Kubernetes 网络连通性检查小工具,它主要用于检查 Kubernetes 集群中各个容器的网络...

8010

回答关于Kubernetes 监控的 9 个问题

灵雀云

灵雀云 · 市场 (已认证)

开源解决方案 Velero 可以用来备份和恢复 Kubernetes 集群。我们建议将所有基础设施定义为代码,这样即使集群出现问题,也可以快速地通过重新应用基础...

7210

KubeSphere 最佳实战:探索 K8s GPU 资源的管理,在 KubeSphere 上部署 AI 大模型 Ollama

运维有术

进入集群管理界面,单击左侧「节点」菜单,点击「集群节点」查看 Kubernetes 集群可用节点的详细信息。

9310

KubeSphere 最佳实战:KubeKey 扩容 Kubernetes Worker 节点实战指南

运维有术

进入集群管理界面,单击左侧「节点」菜单,点击「集群节点」查看 Kubernetes 集群可用节点的详细信息。

11710

ICML 2024 | 情境化的策略恢复:用自适应模仿学习来建模和解释医疗决策

DrugAI

今天为大家介绍的是来自卡内基·梅隆大学的Eric P. Xing团队的一篇论文。可解释策略学习旨在从观察到的行为中估计可理解的决策策略;然而,现有模型在准确性和...

6210

从Helm到 Operator:Kubernetes应用管理的进化

crossoverJie

以为我们在编写部署一些简单 Deployment 的时候只需要自己编写一个 yaml 文件然后 kubectl apply 即可。

7710

从零到K8s大师:Kubernetes的5个必备工具

云云众生s

列表中的前三个工具对于初学者来说绝对不可或缺。后两个工具可以让你从初学者脱颖而出,看起来像高级用户。

6610

API集群负载统计 - 华为OD机试题

小土豆Yuki

某个产品的RESTful API集合部署在服务器集群的多个节点上,近期对客户端访问日志进行了采集,需要统计各个API的访问频次,根据热点信息在服务器节点之间做负...

6910

Facebook数据仓库的变迁与启示

公众号:码到三十五

Facebook的数据仓库架构初期面临的主要挑战之一是如何在同一个大数据系统上运行不同类型的任务。为了解决这个问题,Facebook采取了集群拆分的策略,明确划...

6910

Kubernetes安装总结

用户11097514

腾讯 · 业务运维 (已认证)

如果kubernetes出现故障需要重新安装的, 需要先执行kubeadm reset 然后才能init :::

13310

AI Infra 现状:一边追求 10 万卡 GPU 集群,一边用网络榨取算力

深度学习与Python

集群规模不断上涨,从千卡到万卡,再到十万卡,据王亚晨的描述,“去年大家都在谈论实现万卡集群,只在理论上讲如何实现十万卡。今年的情况有所不同,现在大家实际上已经在...

14510

优化您的“内部开发循环”以提高开发速度

云云众生s

一种越来越流行的方法是本地到远程开发。这种方法允许开发人员在本地运行代码,同时无缝连接到远程 Kubernetes 集群。像 Ambassador 的 Tele...

6310

Redis基础教程(十九):Redis分区

用户11147438

Redis Cluster 是 Redis 官方提供的集群解决方案,它实现了数据的自动分区和节点间的透明迁移,非常适合大规模数据存储和高并发访问的场景。

8610

大规模(万卡)集群训练平台设计方案 MegaScale: Scaling Large Language Model Training 视频教程

爱串门的小马驹

大语言模型贼牛逼这个就不强调了哈,机器翻译,人机会话表现出巨大潜力和应用价值。模型大小和训练数据大小决定了模型能力,为实现最先进的模型,人们已经致力于万亿tok...

6910

redis分布式锁

cultureSun

集群脑裂指因为网络问题,导致 Redis master 节点跟 slave 节点和 sentinel 集群处于不同的网络分区,因为 sentinel 集群无法感...

9410
领券