首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

万亿级token病例炼就首个医疗增强模型,Baichuan-M1-14B开源!

始智AI wisemodel.cn开源社区

在医疗领域,AI技术发展迅速,带来变革的同时也面临挑战:AI医疗技术决策过程不透明,让人担忧其可靠性;医疗服务在不同地区、人群间可及性差异大;AI医疗生态也需更多创新来拓展应用。

为解决这些问题,百川智能专注AI医疗创新。经长时间研发,成功开源Baichuan-M1-14B模型。该模型融合前沿技术,优化算法与结构,在医疗数据处理、疾病诊断预测、医疗影像分析等方面性能出色。目前,Baichuan-M1-14B已上线始智始智AI-wisemodel开源社区。欢迎大家前往体验。

模型地址

https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Base

https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Instruct

01.

性能惊艳,实力领航

在AI技术迅猛发展并深度融入各行业的当下,医疗领域对AI技术的应用需求与日俱增。在此背景下,百川智能推出的Baichuan-M1-14B模型横空出世,作为行业首个医疗增强开源模型,承载着推动AI医疗变革的重任。

Baichuan-M1-14B模型展现出卓越性能。在cmexam权威医学知识评测中,它精准回答各类医学概念、病理机制、药物特性等问题,得分远超更大参数量的Qwen2.5-72B-Instruct。

在clinicalbench_hos针对临床实际病例分析的评测里,无论是复杂病情的诊断思路,还是治疗方案的给出,Baichuan-M1-14B都展现出强大的实力,成绩同样超过Qwen2.5-72B-Instruct。

在erke关于临床能力综合考察的评测中,涵盖从问诊技巧到治疗决策等多环节,Baichuan-M1-14B依然表现出色,成绩与行业内备受认可的o1-mini模型不相上下,彰显其在医疗领域的深厚潜力和强大实力。

02.

多管齐下,优化创新

为了提升Baichuan-M1-14B的医疗能力,我们多管齐下做了大量的优化、创新工作。

数据收集方面:面向细分医疗场景,收集了万亿级 token 的严肃医疗数据,涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例,亿级的医疗问答、医疗问诊、临床数据等,还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估,确保模型能学习到有价值且全面的医疗知识。

合成数据方面:针对病例、医学教材、医学指南等不同类别的高质量医疗数据,生成了超100B token包含了医疗复杂决策推理链条、决策依据以及问答对形式的多样化数据,进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。

模型训练阶段:我们运用行业首创的多阶段领域提升方案,将整个训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三阶段,依次提升基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO 强化学习法,优化思维链路径,避免传统奖励模型偏差,有效提升了模型的生成质量与逻辑推理能力。

Baichuan-M1-preview是我们在AI医疗领域的又一次重要突破,让我们在实现“造医生、改路径、促医学”愿景的道路上又迈出了坚实的一步。而Baichuan-M1-14B开源模型也将为中国AI医疗健康生态建设提供强大助力。

编辑丨赵雅鑫

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Ocb0rKHHjSfnfqKRt5eRfh1A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券