Vectara 团队研究发现,DeepSeek R1存在非常严重的幻觉问题, R1幻觉率高达14.3%,远超DeepSeek V3(3.9%)。
问题可能出在R1训练方法上;
推理能力与事实准确性之间是文学发挥的空间(幻觉)
参考:
- 研究结果:https://github.com/vectara/hallucination-leaderboard
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货