首页
学习
活动
专区
工具
TVP
发布

人工智能应用结合图像与语言大模型 市场预期催化AI板块

作为现阶段衡量AI应用活跃度的标杆指标,ChatGPT的周活数据中秋、国庆期间连续第5周保持稳中有升。后续随着开放多模态大模型功能,叠加AI助手Copilot访问上量,ChatGPT的活跃用户数和时长有望进一步增加。结合近期行业的变化,以及市场对AI板块催化的反应,我们对AI算力板块的表现保持相对乐观。

9月29日,微软研究团队发布了题为《LMMs(大语言模型)的黎明》的论文, (《The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)》),通过一系列案例检验GPT-4V的能力。“能说会看”,可以基于图像进行分析和对话的多模态大模型即将上线,可以实现更强大的通用智能。

在基础能力层面,GPT-4V的主要优势在于图像输入与大语言模型的结合。比如可以加入指向性输入,用红线画圈、多轮图片输入等。此外,对于一些尝试性问题的解决能力也更好,比如对CT图片的病理特征有初步判断能力,对视频帧片段的解析能力也更强,可以解答连续图片中的一些基础逻辑关系。在应用层面,GPT-4V可以在人类监督的情况下,逐步完成如购物、网页浏览、视频解读等工作,其他应用包括缺陷检测、安全检查、结算、医疗等。但一些步骤仍会有一定的错误,大模型在具体场景下商业化应用的前景还有待探索。

GPT-4V的发布带来市场对于GPT进一步发展的预期,日前也进一步催化了AI板块。我们当前仍对AI算力板块的表现保持相对乐观。特别是随着市场进入三季报披露期,其中光模块公司的三季报整体属于有亮点者,而部分光模块龙头也从高点回调了逾40%,筹码结构也有较大优化,有重新吸引关注度的可能。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OlIiBpZLXHp_aHGwjlJoez0Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券