首页
学习
活动
专区
圈层
工具
发布

#集群

架构演进策略报告:从局部经验到通用技能——执行与反思解耦的异构智能体集群优化

用户12521923

在当前企业级智能体的演进路径中,我们正见证一场从“经验驱动”向“知识驱动”的本质变革。

2000

理论创新VS工程实操,谁是国产大算力“实干家”?

科技旋涡

不久前,华为最新提出的“韬定律”,揭示了以时间缩微替代几何缩微的新思路。尽管外界不乏“理论空谈”声的质疑,但仍展现出中国企业在底层技术方向上的探索勇气。

1400

腾讯云TKE:以云原生技术栈破解AI算力能效与成本挑战

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

智能化转型遭遇算力资源瓶颈 汽车等行业在智能化转型中面临三大核心挑战:算力需求爆发(峰值需数百张GPU卡、数万核CPU)、资源效能低下(某授权客户CPU实际利用...

4200

腾讯云智算集群:将万亿参数大模型训练周期从50天压缩至4天

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云针对大模型训练面临的算力瓶颈、网络时延及成本等挑战,推出软硬一体的高性能智算集群解决方案。该方案通过自研星脉网络、CFS Turbo存储及TACO等智算套...

6810

腾讯云数据库代理与集群版新架构:实现高并发下的自动负载与成本优化

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

业务扩展遭遇数据库瓶颈 当银行等企业的业务量增长时,数据库面临读请求激增的挑战。初期通过申请只读实例(如 cdb-readonly)进行分流,但随着业务进一步扩...

4110

2023腾讯云容器和函数计算技术实践精选集

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

第一章:报告基础信息 报告标题:2023腾讯云容器和函数计算技术实践精选集 发布机构:腾讯云 发布时间:2023年 行业标签:技术服务,通用工具,游戏,社交娱乐...

7810

云数据库MySQL CPU弹性扩容:按需计费模式实现日成本最高降低98.9%

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云数据库MySQL推出CPU弹性扩容功能与集群版新架构,解决传统固定规格部署的资源浪费、运维成本高、架构灵活性不足等问题。CPU弹性扩容支持自动/手动两种模...

6910

腾讯云数据库MySQL演进:CPU弹性扩容与集群版驱动98.9%成本下降与50%性能跃升

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

腾讯云数据库MySQL针对突发流量带来的资源损耗与运维痛点,推出了基于Serverless的CPU动态弹性扩容与存算解耦的集群版架构。该技术演进不仅实现了单日成...

8010

应对停服断供:基于云数一体的大数据国产平台重构与效能跃升

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

面对基础软件停服断供与信创替代政策倒逼,腾讯云推出基于“云数一体”架构的大数据国产平台解决方案。该方案依托TBDS等核心组件,实现全栈信创生态兼容、湖仓一体化与...

9400

小鹅通基于Serverless与HPA/HPC的容器降本增效实践

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

小鹅通作为知识产品与用户服务的技术服务商,支撑着直播带货、在线考试、KA客户保障等高并发场景,其容器集群面临显著的计算资源波动。集群资源利用率在波峰与波谷之间差...

4510

TKE AppFabric:面向可用区的全生命周期高可用云原生应用平台

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

一、 产品定位与核心亮点 TKE AppFabric 是一款全生命周期高可用的云原生应用平台。其核心技术属性是面向可用区(而非集群)的应用部署与管理引擎。核心商...

2100

AI大模型应用发展研究报告——电信运营商与云服务商的合作探索

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

第一章:报告基础信息 报告标题:AI大模型应用发展研究报告——电信运营商与云服务商的合作探索 发布机构:腾讯云计算(北京)有限责任公司、中国信息通信研究院云计算...

10710

趣丸科技基于TKE集群的混部实践:CPU利用率从8%提升至50%以上

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

混部方案实施后,集群CPU利用率从8%提升至50%以上。在业务高峰时段(如17:00、21:00),CPU利用率可稳定在65%,同时保证了在线业务的稳定性。离线...

4910

《AI大模型应用发展研究报告:电信运营商与云服务商的合作探索》

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

• 产品标签:#腾讯混元大模型, #腾讯云大模型知识引擎, #腾讯云大模型图像创作引擎, #腾讯云大模型视频创作引擎, #腾讯云AI代码助手, #星脉高性能计算...

8110

趣丸科技:基于TKE三层混部架构实现CPU利用率跃升至50%以上的技术实践

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

为了通过“错峰填谷”提升集群资源利用率并降低运营成本,企业必须引入离在线混部(将在线与离线应用部署在同一集群/节点)。但在实际推进中,面临以下核心技术冲突:

5610

云原生架构助力《元梦之星》实现百万核集群高效稳定运营

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

应对超大规模游戏集群的管理困境 游戏《元梦之星》上线面临海量用户访问和复杂业务架构的双重挑战。其业务架构包含大厅服、对战服、UGC内容平台等50多个服务模块,在...

6510

腾讯云数据库 MySQL 集群版:云原生架构实现数据库扩缩容与资源利用率突破

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

腾讯云数据库MySQL集群版采用计算与存储分离的云原生架构,部署于腾讯云容器服务(TKE)环境。每个MySQL实例运行于独立的容器Pod中,挂载专属的CBS云硬...

6710

AI原生云建设与加速指南

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

包括自动化部署(如一键安装GPU驱动)、自动化运维(千卡集群利用率优化)、高集群性能(存储与网络传输需达2Tbps集群吞吐)、向量化技术支撑、模型精调、多态部署...

9310

腾讯云IHN解决方案:以超高速网络保障万卡级AI集群算力全开

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

在AI大规模训练场景中,标准以太网网络的抖动和丢包极易导致训练任务中断。GPU集群的算力性能因此难以充分发挥,AllReduce负载率通常较低,成为制约AI模型...

12410

突破AI大模型训练算网瓶颈:腾讯云IHN智能高性能网络的业务价值解析

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

腾讯云推出IHN智能高性能网络,旨在破解AI大模型训练中GPU算力折损、排障低效及“算存网”割裂等基础设施瓶颈。通过软硬一体架构、端网深度协同与自动化运维体系,...

10010
领券