首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

英伟达亲自下场,对标GPT4!发布NVLM多模态开源大模型

Nvidia,这家以显卡闻名的公司,这次在AI领域也发出了令人震撼的声响。他们推出了全新的开源人工智能模型NVLM 1.0系列,直接对标OpenAI和Google等科技巨头的闭源AI模型,目标明确,就是要在AI界引发一场新的风暴。

在这次发布的NVLM 1.0家族中,旗舰产品NVLM-D-72B模型拥有高达720亿个参数,且在视觉与语言任务上表现出了极强的多样性。不仅如此,该模型在纯文本处理任务上也有显著提升,彻底打破了过去“多模态训练会削弱文本性能”的魔咒。

1

NVLM-D-72B:文能提笔解题,武能分辨图像

NVLM-D-72B不仅能对图像、视频等复杂视觉输入进行细致入微的分析,它还能处理数学问题,甚至能够像人类一样一步步地进行推理。更值得一提的是,它的文本任务性能比起纯文本训练的模型提高了4.3个百分点。这意味着NVLM-D-72B不仅可以理解图片和文本,还在代码和数学推理上表现突出。

研究人员骄傲地表示:“我们的NVLM-D-72B模型在文本后端任务上取得了重大进展,特别是在数学和编程等任务上,远超其他同类模型。”

2

AI社区欢呼:Nvidia的开源之举引爆行业

Nvidia这次选择开源,不仅公开了模型的权重,还承诺发布完整的训练代码。这一举动无异于在当前AI界投下了一枚重磅炸弹,让全球的开发者和研究人员都能接触到最前沿的AI技术,不再仅仅是科技巨头的专属。

这一开源举措无疑将加速整个AI领域的创新进程。中小型企业和独立研究人员终于也有机会与科技巨头分庭抗礼,共同推动AI技术的发展。

一个AI研究者在社交媒体上感叹道:“哇哦!Nvidia刚刚发布了一个720亿参数的模型,居然在数学和编程任务上能与4050亿参数的Llama 3.1媲美,而且还能处理视觉任务?”

3

NVLM 1.0:AI开放时代的启幕

Nvidia这次的NVLM 1.0发布,可能将开启AI行业的新篇章。开放的代码和模型,不仅是技术的共享,更是对现有商业模式的一次挑战。未来,不排除其他科技公司也会感受到压力,逐渐向开放迈进。对中小型企业来说,这无疑是一次绝佳的机遇,能用以前无法企及的工具,参与到技术革新的洪流中。

然而,开放AI技术也带来了潜在的风险。随着先进AI的可及性大幅提升,滥用的可能性也随之上升。AI界现在需要的不仅仅是技术上的突破,更要建立负责任的使用框架,确保这些强大的工具不会被误用。

这也给AI商业模式带来了新的思考空间。如果所有最先进的模型都可以免费获得,那么未来公司们要如何保持竞争力?如何为用户创造更大的价值?这些问题,将在未来数月或数年内,随着NVLM 1.0的影响逐渐显现。

毫无疑问,Nvidia已经在AI领域打响了第一枪。接下来的问题是,这场战争将如何蔓延,哪些企业能快速适应新的游戏规则,在这场开放的AI战役中胜出。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O3knUV75zLgbY36ZjFewhtbw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券