首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

xAI发布支持视觉的多模态AI模型Grok-1.5V

BlockBeats 消息,4 月 13 日,马斯克旗下人工智能公司 xAI 宣布推出首个多模态 AI 模型 Grok-1.5V。除了强大的文本处理能力,Grok 还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中,Grok-1.5V 的表现均可与现有的前沿多模态模型相媲美。尤其在 xAI 新推出的 RealWorldQA 基准测试中,Grok 在现实世界空间理解能力上超越了同类模型。RealWorldQA 数据集包含 700 多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5 将很快向早期测试人员和现有用户开放。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OEn7ajuNgg8AwfQtkk93zFrg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券