首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

昆仑万维开源 Skywork R1V:全球首个工业级多模态推理模型

昆仑万维重磅发布:Skywork R1V 多模态推理模型正式开源

昆仑万维正式宣布推出全球首个工业界多模态推理模型——Skywork R1V(简称“R1V”)。这款拥有38亿参数的强大模型,在性能上已十分接近知名的闭源模型DeepSeek-R1,并在多项关键基准测试中展现出卓越性能,超越了一系列现有的先进技术水平(SOTA)。昆仑万维选择将R1V开源,旨在加速技术的共享与进步,为全球AI开源社区注入强劲动力。

R1V模型以其卓越的多模态推理能力而著称,它能够流畅地整合文本和视觉信息,展现出强大的智能水平。具体而言,R1V在视觉问答任务中直接与Claude3.5Sonnet和GPT-4o等闭源模型对标,同时保持着顶尖的文本推理能力。在权威的MMMU基准测试中,R1V以高达69分的优异成绩创造了同等规模模型的新纪录,而在MathVista测试中也获得了67.5分的出色成绩,充分证明了其在复杂数学推理和逻辑分析方面的强大能力。

R1V 成功的关键技术

R1V的巨大成功离不开昆仑万维研发团队的多项创新技术。这其中包括了跨模态迁移学习技术,该技术有效地将大模型的文本推理能力迁移到视觉模态,从而大幅度降低了对多模态推理数据的需求。此外,R1V所采用的混合训练策略,通过迭代监督微调和强化学习的有机结合,动态地调整思维链长度,进而显著提升了推理效率。特别值得一提的是,R1V还引入了自适应长度思维链蒸馏框架,有效避免了推理过程中的“过度思考”,显著地提高了推理的效率和质量。

开源助力 AGI 梦想

随着R1V的正式发布,昆仑万维不仅成为了全球首家开源多模态推理模型的企业,更是在推动AGI(通用人工智能)梦想的实现道路上迈出了关键性的一步。模型的权重、推理代码以及详细的技术报告均已全面公开,任何人都能够通过GitHub和Hugging Face平台获取相关资源。

温馨提示:

全球首个工业级开源多模态推理模型Skywork R1V正式发布,拥有38亿参数。

R1V在多个基准测试中表现突出,尤其在MMMU和MathVista测试中分别取得了69分和67.5分的高分。

昆仑万维的开源行动旨在促进技术共享,为全球AI开源社区注入活力,共同助力AGI梦想的实现。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OJRtctT6vX7hPOuyvkc7wgKg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券