首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

腾讯元宝 X DeepSeek:双模聚合,解锁「图像理解」技能

刚刚,腾讯元宝解锁了一项新技能——「看图说话」

现在,用户上传一张图片,元宝不仅能识别其中的文字,还能理解画面内容,并给出自己的分析和解读。

翻译过来就是,腾讯元宝在DeepSeek原有基础上,补足了「图像理解」能力。怎么做到的?

其实,这得益于腾讯元宝「混元+DeepSeek」双模聚合效应

过去,DeepSeek处理图片,更像是「扫描仪」,只会老老实实提取信息;如今,在腾讯混元多模态技术的加持下,无论是艺术作品,还是生活随拍,都能真正「看懂」图中的细节、氛围,甚至是隐藏的含义。

注意,「看图说话」功能需要关闭联网搜索后使用。

当然,腾讯元宝的技能远不止于此。除了「看图说话」,它还支持文件解析、联网搜公众号或视频号内容、微信上传文件等,功能齐全并且样样精通。

同时,用户还可以根据场景和业务需要,选用适合的「AI大脑」:

DeepSeek-R1满血版或混元T1:适合深度思考;

DeepSeek-V3、腾讯混元Turbo:适合快速给出答案。

看看它对梵高《星夜》的解读:

元宝越来越聪明,AI助手也越来越好用。不如赶紧试试?

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OzxMblYwzkd4lTvntiiH44_A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券