DeepSeek仅用557万美元训练出了R1,远低于OpenAI、Claude等同类模型,有人说DeepSeek绕过CUDA,使用更底层的PTX语言进行训练,这是其低成本的原因之一。
于是乎,就有了一个讨论。
我觉得目前PTX绕过CUDA,以及英伟达短期股价下降并不能反映英伟达护城河消失了。
想要回答这个问题得搞清楚CUDA对英伟达意味着什么?
CUDA是英伟达在2006就推出的基于英伟达GPU的计算平台,主要用来通过GPU加速实现高性能计算任务,比如大模型训练、游戏渲染、数据挖掘、加密货币等。
所谓早是最大的优势,那个时候深度学习还不是很普及,相关的应用更是寥寥,所以CUDA成为了开发者们首选的GPU语言。
随着二十几年的发展,CUDA生态越来越完善,包括CUDA Toolkit核心开发工具包,比如编译器、库文件、头文件以及各种开发工具,相当完备。
还有各种计算库,CUBLAS(矩阵计算)、CUDNN(神经网络)、CUDA FFT(傅立叶变换)等已经非常的普及,形成了强大的用户规模。
另外,CUDA与Visual studio、Ecplise等主流IDE集成,可以直接进行CUDA代码的编写、调试和编译,可以说十分方便。
并且,各种软件比如英伟达的TensorRT、Triton和Deepstream等都是基于CUDA平台开发的,对于开发者来说省去了很多开发时间。
由于以上的各种积累,现在全球90%以上的AI计算都基于CUDA来调用英伟达GPU算力,所以基本形成了行业垄断。
2023年,英伟达数据中心GPU市占率达到了惊人的98%,虽然2024年有所下滑,但也维持在90%以上。
所以基于CUDA完备的的生态和英伟达GPU硬件上的绝对优势,PTX作为中间语言,复杂性高,短期内是无法撼动CUDA优势的。
但长期来看很难说,如果deepseek继续现在的性能和热度,会给行业带来很好的示范作用,市场上会出现更多基于PTX的解决方案,到时候AMD、昇腾在硬件上追赶缩小差距,参与分一杯羹,那么英伟达的护城河就会变窄。
所以重点在于,deepseek能否起一个好头,绕过CUDA只是第一步,下一步是建设新的生态,让更多开发者参与进来,这样才会形成组合拳优势。