文章《SheepDoctor: A knowledge graph enhanced large language model for sheep disease diagnosis》发表于Smart Agricultural Technology,提出了一种面向羊病诊断的领域大语言模型(LLM)SheepDoctor,通过融合知识图谱(KG)与检索增强生成(RAG)技术,显著提升了诊断的准确性与专业性。参照“羊医生”模型,“猫医生”、“狗医生”应该也在路上了。
一、研究背景与意义
传统诊断瓶颈:羊病诊断依赖兽医现场检查,存在资源有限、响应延迟、效率低下等问题。
症状相似性高:不同羊病症状高度相似,加剧诊断难度。
LLM 的潜力:大语言模型(如 ChatGPT)在人类医学中已展现强大能力,但在农业领域应用尚少。
研究空白:现有农业大模型(如 ShenNong、FanLi)虽涉及种植、渔业等,但缺乏针对羊病的专业化模型。
🧠 二、SheepDoctor 系统框架
系统构建流程如下图所示,涵盖数据收集、预处理、模型微调与知识图谱增强四大模块:
三、数据集构建
1. 数据来源
专业书籍、畜牧网站、真实诊断案例;
覆盖 207 种羊病、1152 种症状、487 种药物及其用法用量。
2. 数据格式
三元组知识图谱(1934 个三元组),用于结构化表示疾病-症状-治疗关系;
问答数据集(5987 条),采用 Alpaca 指令格式,涵盖单轮与多轮对话。
3. 提示工程(Prompt Engineering)
通过角色扮演、问题重构等方式增强数据多样性与逻辑性;
多轮对话模拟真实诊断流程,提升模型交互能力。
示例提示格式如下:
🧩 四、模型构建方法
1. 基础模型
选用 LLaMA2-13B-Chinese,因其在中文任务上表现良好;
使用 LoRA(Low-Rank Adaptation) 进行高效微调,显著降低计算成本。
2. 知识图谱增强
构建三元组如(羊痘,症状,发热)、(羊痘,治疗,青霉素);
使用 BERT + Jieba分词 计算问题与三元组的语义相似度,检索最相关知识;
将检索结果与问题拼接为提示词输入模型,提升回答准确性。
下图展示了部分知识图谱的结构:
五、实验结果与分析
1. 评估指标
BLEU、ROUGE:衡量文本生成流畅性与匹配度;
BERTScore:语义相似度;
Number-Units-Matched:数值与单位准确性。
2. 主要结果
注:BLEU略降因生成文本多样性增加,但语义一致性显著提升。
3. 泛化能力(Unseen Problems)
SheepDoctor 在未见疾病上的 F1 值达到 78.15%,显著优于基线模型;
知识图谱的引入大幅提升模型对未知情况的应对能力。
4. 对比通用模型(GPT-4o, Kimi)
SheepDoctor 在所有指标上均优于通用模型;
下图展示了各模型在 F1 值分布上的对比,SheepDoctor 在高分段(>0.8)占比最高:
六、讨论与局限性
优势:
领域专业化强,诊断准确率高;
知识图谱提供可解释性,增强可信度;
支持多轮对话,符合实际诊断流程。
局限性:
数据多样性不足(仅中文数据);
对模糊症状输入容易误诊;
计算资源要求高,部署成本大;
存在幻觉风险,需专业兽医复核。