首页
学习
活动
专区
圈层
工具
发布

#集群

SK海力士增产DDR5,追逐超90%理论毛利率

芯智讯

6月23日消息,据韩国媒体报道,存储芯片大厂SK海力士计划在维持HBM产能的同时,将更多新增产能转向DDR5和LPDDR5产品,以利用当前因供应短缺导致的价格飙...

000

华为昇腾 910C不是最好的AI芯片,但它是中国AI产业唯一的选择——然后呢

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

从硅片物理约束到 CANN/CUDA 软件栈差距,从 DeepSeek-R1 推理基准到三年 TCO,一次华为昇腾 vs NVIDIA/AMD 的全维度硬核对账

1710

这个时代最狂野的人

春哥大魔王

马斯克的身家也破了万亿,是第二名贝佐斯还是佩奇来着——反正翻了三倍多。这不是他第一次摸到万亿门槛,之前特斯拉已经到过了。

800

网工干货|华为 iStack 堆叠 & CSS 集群全解析,园区 / 数据中心组网必看

ICT系统集成阿祥

做企业园区、数据中心运维的网工,一定绕不开交换机横向虚拟化。华为两大核心技术:盒式交换机用iStack 堆叠,高端框式核心交换机用CSS 集群,二者都能把多台物...

2000

Kubernetes 一个用了很多年的功能即将被移除:Service ExternalIPs 为什么被官方废弃?

一根头发丝的宽度

对于很多刚接触 Kubernetes 的同学来说,可能从未使用过 ExternalIPs;但对于一些早期部署的集群、私有云环境以及边缘计算场景来说,这曾经是一个...

2210

当网络分裂时:分区容忍共识算法如何拯救分布式系统?

专业造轮子

2024年2月17日,某全球云服务商突发大规模故障,欧洲区与北美区数据中心因海底光缆断裂形成网络分区,两地用户同时修改同一文件后出现数据冲突,导致1.2万企业客...

3810

腾讯云TBDS面向AI时代的多模态智算平台,助力企业AI转型

腾讯QQ大数据

企业更期望在一个统一平台内管理训练(Training)、微调(Fine-tuning)、推理(Inference)、数据处理(ETL)四类负载,并统一运维体系,...

8210

分布式集群实战:分片策略、一致性保证与负载均衡详解

数据库小学妹

最近帮一个客户做数据库架构评审。提交上来的方案里写了一大段"部署分布式集群"。问他分片策略和节点冗余分别是怎么考虑的,答不上来。

5410

码途周记#004:AI Agent的发展方向也许是AI Agent集群

码途

你可以把每一块认知乐高想象成电脑程序里的一个函数,大脑执行一个任务,本质上就是按顺序调用这几个函数,把它们串联起来。

6110

Sora终于开放上传真人照片生成视频了

用户11563501

有技术人员在社交媒体上调侃道:“那个‘我已获得同意’的复选框,现在承担的工作量比运行推理的GPU集群还要大。”

4110

告别传统 HPA!基于 AI Agent 的 Kubernetes Pod 智能弹性伸缩实践

用户5741377

传统 HPA 以单个 Workload 为管控单元,仅关注当前 Deployment 的资源负载,无法全局感知整个集群的节点资源水位、多业务运行状态、业务优先级...

13800

K8s运维封神指南:避开90%的坑

用户5741377

etcd是K8s的“大脑”,存储着整个集群的所有数据,但很多人部署时从不配置备份,一旦etcd故障,集群直接瘫痪,数据无法恢复,损失惨重。

9910

从容器逃逸到权限提升:一文拆解 k8s安全的核心风险

用户5741377

Pod 是 Kubernetes 中最基础的执行单元。一个 Pod 里可以包含一个或多个容器,它们共享同一网络和存储资源。这种封装方式让组件协作更高效,但也意味...

8800

从 Namespace 到 Pod:一文读懂 K8s 资源配额与限制

用户5741377

在 Kubernetes 中,应用运行的稳定性与集群的资源利用率息息相关。 如果不加控制,某个服务可能会“吃光”集群的 CPU 和内存,导致其他业务雪崩。 这时...

10010

Kubernetes 服务部署全解析:从镜像构建到集群发布实战指南

用户5741377

Kubernetes 服务部署流程看似繁琐,但只要掌握镜像构建、Deployment 与 Service 资源定义及管理技巧,结合配置管理与自动扩缩容,能有效保...

9000

Deepseek V4 Prefill-Decode分离测试1

用户12553134

今天再次测试发现,这两台实际是按照独立实例在各跑各的,没有形成集群。一步一步来,从简单到复杂。不然就是几千条的报错。

8310

一次 Ingress 重复报错引发的思考:内网从域名到 Pod 的全链路与根因分析

Wangzy

Wayne 是 360 开源的多集群 Kubernetes 管理平台,覆盖了多集群、访问控制、发布管理与审计,本身是个不错的东西。但它有一个现实问题:公开 re...

7510
领券