首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

IBM watsonx.ai上线DeepSeek-R1蒸馏模型

(全球TMT2025年2月12日讯)IBM日前宣布,DeepSeek-R1的Llama 3.1 8B和Llama 3.3 70b蒸馏版本现已在IBM的企业级AI开发平台watsonx.ai上提供。DeepSeek-R1是中国AI初创公司DeepSeek的推理大语言模型(LLM),被认为是世界上最强大的开源模型之一,通过在基础模型DeepSeek-V3上直接使用强化学习(RL)开发,并使用知识蒸馏技术微调多个Llama和Qwen模型。

IBM 通过“按需部署目录”在watsonx.ai中提供两种Llama蒸馏变体,允许用户部署专用实例进行安全推理。用户还可以使用自定义基础模型导入功能导入DeepSeek-R1模型的其他变体,如Qwen蒸馏模型。DeepSeek-R1以其卓越的推理能力支持广泛应用,包括规划、编码和数学问题解决等。开发人员可在watsonx.ai中使用DeepSeek-R1等已部署的模型和解决方案功能构建AI解决方案。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OZt1nYwVHs9UlULw6PsVPIqA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券