近日,DeepSeek公开致谢腾讯AI技术团队,称其对开源通信框架DeepEP的优化带来了“巨大的速度提升”(huge speedup),使大模型训练在RoCE网络环境下性能提升100%,InfiniBand(IB)网络提升30%。这一突破源于腾讯星脉网络团队对双端口网卡带宽利用率和CPU控制面延迟的优化,包括拓扑感知的多QP建链技术和IBGDA加速技术,让GPU通信更高效。这不仅提升了DeepSeek的MoE架构训练效率,也为国产AI基础设施的自主可控提供了重要支持。
与此同时,腾讯混元大模型和DeepSeek均强化了文生图能力。混元文生图大模型采用与Sora同源的DiT架构,支持中英文输入,在古诗词、传统建筑等中国元素生成上表现突出。而DeepSeek-V3同样聚焦图像生成,可应用于广告、艺术创作等场景。
DeepSeek已接入国家超算互联网平台,与腾讯混元共同推动国产AI生态发展。这种紧密协作不仅降低了技术门槛,也让中国AI在性能、成本、应用场景上具备全球竞争力。从底层通信优化到多模态能力突破,国产AI正展现出强大的协同创新潜力,未来可期!