首页
学习
活动
专区
圈层
工具
发布

宠物生病了怎么办?AI“杨医生”来了

文章《SheepDoctor: A knowledge graph enhanced large language model for sheep disease diagnosis》发表于Smart Agricultural Technology,提出了一种面向羊病诊断的领域大语言模型(LLM)SheepDoctor,通过融合知识图谱(KG)与检索增强生成(RAG)技术,显著提升了诊断的准确性与专业性。参照“羊医生”模型,“猫医生”、“狗医生”应该也在路上了。

一、研究背景与意义

传统诊断瓶颈:羊病诊断依赖兽医现场检查,存在资源有限、响应延迟、效率低下等问题。

症状相似性高:不同羊病症状高度相似,加剧诊断难度。

LLM 的潜力:大语言模型(如 ChatGPT)在人类医学中已展现强大能力,但在农业领域应用尚少。

研究空白:现有农业大模型(如 ShenNong、FanLi)虽涉及种植、渔业等,但缺乏针对羊病的专业化模型。

🧠 二、SheepDoctor 系统框架

系统构建流程如下图所示,涵盖数据收集、预处理、模型微调与知识图谱增强四大模块:

三、数据集构建

1. 数据来源

专业书籍、畜牧网站、真实诊断案例;

覆盖 207 种羊病、1152 种症状、487 种药物及其用法用量。

2. 数据格式

三元组知识图谱(1934 个三元组),用于结构化表示疾病-症状-治疗关系;

问答数据集(5987 条),采用 Alpaca 指令格式,涵盖单轮与多轮对话。

3. 提示工程(Prompt Engineering)

通过角色扮演、问题重构等方式增强数据多样性与逻辑性;

多轮对话模拟真实诊断流程,提升模型交互能力。

示例提示格式如下:

🧩 四、模型构建方法

1. 基础模型

选用 LLaMA2-13B-Chinese,因其在中文任务上表现良好;

使用 LoRA(Low-Rank Adaptation) 进行高效微调,显著降低计算成本。

2. 知识图谱增强

构建三元组如(羊痘,症状,发热)、(羊痘,治疗,青霉素);

使用 BERT + Jieba分词 计算问题与三元组的语义相似度,检索最相关知识;

将检索结果与问题拼接为提示词输入模型,提升回答准确性。

下图展示了部分知识图谱的结构:

五、实验结果与分析

1. 评估指标

BLEU、ROUGE:衡量文本生成流畅性与匹配度;

BERTScore:语义相似度;

Number-Units-Matched:数值与单位准确性。

2. 主要结果

注:BLEU略降因生成文本多样性增加,但语义一致性显著提升。

3. 泛化能力(Unseen Problems)

SheepDoctor 在未见疾病上的 F1 值达到 78.15%,显著优于基线模型;

知识图谱的引入大幅提升模型对未知情况的应对能力。

4. 对比通用模型(GPT-4o, Kimi)

SheepDoctor 在所有指标上均优于通用模型;

下图展示了各模型在 F1 值分布上的对比,SheepDoctor 在高分段(>0.8)占比最高:

六、讨论与局限性

优势:

领域专业化强,诊断准确率高;

知识图谱提供可解释性,增强可信度;

支持多轮对话,符合实际诊断流程。

局限性:

数据多样性不足(仅中文数据);

对模糊症状输入容易误诊;

计算资源要求高,部署成本大;

存在幻觉风险,需专业兽医复核。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O0NYRJTxC2ULAD5fyXcb22VA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券