始智AI wisemodel.cn开源社区
在医疗领域,AI技术发展迅速,带来变革的同时也面临挑战:AI医疗技术决策过程不透明,让人担忧其可靠性;医疗服务在不同地区、人群间可及性差异大;AI医疗生态也需更多创新来拓展应用。
为解决这些问题,百川智能专注AI医疗创新。经长时间研发,成功开源Baichuan-M1-14B模型。该模型融合前沿技术,优化算法与结构,在医疗数据处理、疾病诊断预测、医疗影像分析等方面性能出色。目前,Baichuan-M1-14B已上线始智始智AI-wisemodel开源社区。欢迎大家前往体验。
模型地址
https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Base
https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Instruct
01.
性能惊艳,实力领航
在AI技术迅猛发展并深度融入各行业的当下,医疗领域对AI技术的应用需求与日俱增。在此背景下,百川智能推出的Baichuan-M1-14B模型横空出世,作为行业首个医疗增强开源模型,承载着推动AI医疗变革的重任。
Baichuan-M1-14B模型展现出卓越性能。在cmexam权威医学知识评测中,它精准回答各类医学概念、病理机制、药物特性等问题,得分远超更大参数量的Qwen2.5-72B-Instruct。
在clinicalbench_hos针对临床实际病例分析的评测里,无论是复杂病情的诊断思路,还是治疗方案的给出,Baichuan-M1-14B都展现出强大的实力,成绩同样超过Qwen2.5-72B-Instruct。
在erke关于临床能力综合考察的评测中,涵盖从问诊技巧到治疗决策等多环节,Baichuan-M1-14B依然表现出色,成绩与行业内备受认可的o1-mini模型不相上下,彰显其在医疗领域的深厚潜力和强大实力。
02.
多管齐下,优化创新
为了提升Baichuan-M1-14B的医疗能力,我们多管齐下做了大量的优化、创新工作。
数据收集方面:面向细分医疗场景,收集了万亿级 token 的严肃医疗数据,涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例,亿级的医疗问答、医疗问诊、临床数据等,还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估,确保模型能学习到有价值且全面的医疗知识。
合成数据方面:针对病例、医学教材、医学指南等不同类别的高质量医疗数据,生成了超100B token包含了医疗复杂决策推理链条、决策依据以及问答对形式的多样化数据,进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。
模型训练阶段:我们运用行业首创的多阶段领域提升方案,将整个训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三阶段,依次提升基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO 强化学习法,优化思维链路径,避免传统奖励模型偏差,有效提升了模型的生成质量与逻辑推理能力。
Baichuan-M1-preview是我们在AI医疗领域的又一次重要突破,让我们在实现“造医生、改路径、促医学”愿景的道路上又迈出了坚实的一步。而Baichuan-M1-14B开源模型也将为中国AI医疗健康生态建设提供强大助力。
编辑丨赵雅鑫
领取专属 10元无门槛券
私享最新 技术干货