刚刚,腾讯元宝解锁了一项新技能——「看图说话」。
现在,用户上传一张图片,元宝不仅能识别其中的文字,还能理解画面内容,并给出自己的分析和解读。
翻译过来就是,腾讯元宝在DeepSeek原有基础上,补足了「图像理解」能力。怎么做到的?
其实,这得益于腾讯元宝「混元+DeepSeek」双模聚合效应。
过去,DeepSeek处理图片,更像是「扫描仪」,只会老老实实提取信息;如今,在腾讯混元多模态技术的加持下,无论是艺术作品,还是生活随拍,都能真正「看懂」图中的细节、氛围,甚至是隐藏的含义。
注意,「看图说话」功能需要关闭联网搜索后使用。
当然,腾讯元宝的技能远不止于此。除了「看图说话」,它还支持文件解析、联网搜公众号或视频号内容、微信上传文件等,功能齐全并且样样精通。
同时,用户还可以根据场景和业务需要,选用适合的「AI大脑」:
●DeepSeek-R1满血版或混元T1:适合深度思考;
●DeepSeek-V3、腾讯混元Turbo:适合快速给出答案。
看看它对梵高《星夜》的解读:
元宝越来越聪明,AI助手也越来越好用。不如赶紧试试?
领取专属 10元无门槛券
私享最新 技术干货