首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【资讯】昆仑万维开源全球首个工业界多模态推理模型Skywork R1V

之前介绍过两例DeepSeek R1迁移多模态的成功案例,不过都是学术界实验。

这次首个工业界迁移案例出现。

2025年3月18日,昆仑万维开源全球首个工业界多模态推理模型Skywork R1V(简称「R1V」)

R1V高效地将R1文本推理能力无缝推广到视觉模态,实现了多模态领域领先效果(非sota),并开源。

R1V三大亮点。

1. 全球第一个工业界开源多模态+推理模型

2. 性能接近甚至超越了规模大两倍的开源模型

3. 通过开源让技术可以惠及到更多人

效果:

1️⃣ 视觉问答任务中,R1V直接对标Claude 3.5 Sonnet、GPT-4o等闭源模型,同时保留顶级文本推理能力。

2️⃣ MMMU基准测试中,R1V以69分创下同等规模新高,在MathVista上拿下67.5分,达到领先的开源模型水平。

参考:

GitHub:https://github.com/SkyworkAI/Skywork-R1V

Hugging Face:https://huggingface.co/Skywork/Skywork-R1V-38B

技术报告:https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V.pdf

信息源:新智源,https://mp.weixin.qq.com/s/CYNce3oHoDrsOJSv5Pj6Nw

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OqTuEmQ5Q4yX4rvjozpsnJbA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券