部署DeepSeek模型,进群交流最in玩法!
立即加群
发布
社区首页 >专栏 >DeepSeek:技术领导者需要知道的五件事

DeepSeek:技术领导者需要知道的五件事

作者头像
大脸猫不吃鱼
发布2025-02-05 17:38:50
发布2025-02-05 17:38:50
1160
举报
文章被收录于专栏:啥是AI啊?啥是AI啊?

DeepSeek 给商界和科技界带来了冲击。在地缘政治紧张和股价暴跌的新闻头条中,准确了解 DeepSeek 的新 AI 模型对企业意味着什么(从长期 AI 战略到日常技术实验)是一项挑战。 

因此,为了让技术和商业领袖了解一些基础知识,我们回答了五个关键问题,无论未来几周和几个月内新闻和炒作周期如何变化,这些问题都可以帮助您前进。

DeepSeek 为何成为新闻焦点?

DeepSeek 是一家中国初创公司,于 2025 年 1 月 20 日发布了两款新的 AI 模型——DeepSeek-R1 和 DeepSeek R1-Zero。它之所以成为新闻,是因为该模型的性能似乎与其竞争对手相媲美,例如 Llama、Gemini、Claude 和 ChatGPT 的 o1“推理模型”。尽管据报道,它使用 NVIDIA 芯片进行训练,但这些芯片不如知名供应商使用的制造商顶级芯片先进。(NVIDIA 实际上以符合美国政府关于哪些芯片可以出口到中国的规定的方式开发了这些芯片——他们降低了互连速度,DeepSeek 工程师通过代码中的巧妙设计缓解了这一问题。)

后果很严重。英伟达的市值缩水近 6000 亿美元而美国科技行业整体上对中国企业感到震惊,因为中国企业显然在自己的游戏中击败了他们——尽管他们拥有的硬件显然较差。

DeepSeek 会降低企业使用 AI 的成本吗?

DeepSeek-R1 有几种较小的“精简”尺寸,可以在商用硬件上运行。这很重要,因为能够运行与 ChatGPT o1 性能相匹配的模型(而不是受制于第三方 API 成本)是一件大事。如果你试图做像agentic AI这样的高级事情,这一点尤其重要,因为 AI 可能需要很多周期才能成功完成工作。

虽然具体便宜多少还很难确定,但据信 DeepSeek 的硬件比 OpenAI 的便宜 20 到 50 倍(一些业内人士对此表示质疑但有强有力的迹象表明这些说法是真的)从理论上讲,这应该会使企业的 AI 成本大大降低:这是因为不仅基础模型本身的训练成本更低,而且使用和运行该模型(例如在应用程序中)也更便宜。

然而,这只是一个假设;还有很多问题。例如,DeepSeek 更便宜的基础设施可能会带来一些尚未确定的权衡。更重要的是,值得记住所谓的杰文斯悖论:效率的提高实际上并不像你想象的那样会降低价格,而是会导致需求增加,进而抵消价格的下降。

DeepSeek 所取得的成就很可能会鼓励人们更加注重效率——用更少的资源做更多的事情。 ——迈克·梅森,Thoughtworks 首席人工智能官

DeepSeek 会降低能源消耗吗?

DeepSeek 的模型表明,无需像其他成熟模型那样耗费大量电力,即可实现令人难以置信的高性能。因此,许多电力公司的股价受到重创。但其中一个潜在的好处是,它可以帮助推动绿色计算的采用,即通过提高效率来解决计算对环境的影响。(话虽如此,这也可能再次导致我们陷入杰文斯悖论,即随着效率的提高,能源消耗也会上升。)

这对 OpenAI 和谷歌等公司意味着什么还有待观察。这些公司计划在未来几年对数据中心和资源进行大量投资:如果 DeepSeek 真的证明了你可以用更少的资源做更多的事情,也许我们会看到这些公司转型。虽然这目前只是猜测,但毫无疑问,DeepSeek 正在迫使业界重新思考构建和运行有效的人工智能系统需要多少能源。

这会引发又一波人工智能创新浪潮吗?

DeepSeek 所取得的成就可能会鼓励人们更加注重效率——用更少的资源做更多的事情。该领域的挑战通常以规模为框架——更多的计算能力、更密集的模型训练、更大的模型。DeepSeek 最大的教训之一可能是,人工智能中存在一些创新方法,这些方法不需要更大的规模,而是需要独创性和优化。

值得注意的是,DeepSeek R-1 是我们所说的“开放”的— 开放,但并不完全满足被称为开源的严格要求。这意味着它可以以专有系统无法做到的方式进行调整和使用,可以说挑战了专有模型的当前主导地位。当你将这一点与降低的成本结合起来时,可能会为一批全新的公司打开大门,让他们考虑构建自己的模型。

我下一步该怎么做?

人工智能领域发展如此之快,这样的进步将会持续发生。这就是为什么确保您的实验流程和评估工具的过程足够灵活以适应变化至关重要。你永远不知道,下周我们可能会从另一家供应商那里得到另一种新型号。

不过,目前有许多潜在的用例值得探索,从构建一个简单的聊天应用程序到利用它进行编码。它的功能无可否认地强大,所以看看你能用它做什么。吴恩达在 LinkedIn 上指出“基础模型层的超强竞争对于构建应用程序的人们来说非常有利”——对于寻求将生成式人工智能引入生产环境的组织来说,这无疑是一个激动人心的时刻。 

尽管如此,我们仍然需要注意隐私风险。无论你使用哪种人工智能模型,隐私风险都是如此,但一些安全和隐私专家敦促人们特别谨慎。

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系外文翻译前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • DeepSeek 为何成为新闻焦点?
  • DeepSeek 会降低企业使用 AI 的成本吗?
  • DeepSeek 会降低能源消耗吗?
  • 这会引发又一波人工智能创新浪潮吗?
  • 我下一步该怎么做?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档