近年来,人工智能技术飞速发展,大模型的更新迭代以及在专业领域的拓展应用已成为全球焦点。DeepSeek大模型凭借一系列突破性创新,重新定义了大模型的性能边界,在成本、效率、能耗等关键维度树立了行业新标杆。中国地质调查局与国内许多矿业企业、地勘单位以及科研院所,开展了DeepSeek在地质找矿领域的探索应用,取得了一定的成效。
包图网 供图
1
DeepSeek发展历史及核心技术优势
DeepSeek的发展历史分为三个阶段。一是初创早期技术突破阶段。2023年11月,DeepSeek推出首个开源大模型DeepSeek Coder。2024年1月,DeepSeek发布第一个通用大模型DeepSeek LLM(总参数670亿)。二是技术迭代与逐渐扩张阶段。2024年5月,DeepSeek发布创新搭载混合专家架构(MoE)模型DeepSeek-V2(总参数2360亿)。同年12月,发布DeepSeek-V3(总参数6710亿),并通过监督微调(SFT)和强化学习(RL)提高模型性能,成为全球性价比最高的模型之一。三是推理模型革命性突破阶段。2025年1月,DeepSeek发布模型DeepSeek-R1,采用了大规模强化学习(RL)进行后训练,仅需少量标注数据,即可显著提升模型的性能,为大型语言模型的训练提供了新的思路。
DeepSeek作为前沿的人工智能技术,其核心技术优势在于高效计算架构、优化的注意力机制、全模态对齐框架。一是搭载专家混合模型(MoE)大幅提升了DeepSeek处理任务的效率。专家混合模型(MoE)将大型模型拆分为多个专家子模块,每个专家模块(可新增)专注于处理特定类型的任务,如地质专家模块,提高了专业知识理解能力,增强了大模型垂直领域适配性。二是创新采用了多头潜在注意力(MLA)机制,提升了DeepSeek的语言理解能力和大规模数据处理能力。传统注意力模型仅能关注有限的上下文信息。DeepSeek通过扩展标准的多头注意力,可并行关注不同层次的特征,高效地进行多维数据关联分析和知识挖掘,提升了语言理解能力。
2
DeepSeek在地质找矿领域的应用现状
DeepSeek已在金融、医疗、交通等行业成功应用,证明DeepSeek与行业融合的可行性和有效性,但为保障数据的隐私与安全,各单位主要采取本地化部署或接入原有自主研发的平台/大模型的方式开展DeepSeek应用。
DeepSeek在地质找矿的应用场景主要分三类。
地质资料数据的智能利用。一是专业领域知识高精度智能检索。将积累的海量地质调查、勘查与科研数据资料进行整合,搭建本单位的知识库,通过DeepSeek+RAG(增强检索)技术对知识库进行智能检索与调用。二是地质资料数据潜在信息挖掘。通过DeepSeek智能构建知识图谱等方式进行地质矿产数据资料再开发,进行多维数据关联和信息挖掘。三是强化已开发大模型的知识推理能力。将DeepSeek接入已开发的大模型/平台,增强知识推理能力。
多源异构数据的融合处理。一是构建多元融合数据库。DeepSeek强大的多模态数据融合能力,能够高效整合地质信息、地球物理、地球化学及遥感等多源异构数据。二是多元异构数据分析。利用DeepSeek强大数据处理能力,对海量地质资料数据进行深入分析。
人工智能找矿的辅助应用。一是构建工作流及智能体,辅助智能找矿。围绕DeekSeek创建智能体和AI应用开发,支撑辅助找矿决策智能化。二是开展智能找矿靶区圈定。基于DeepSeek构建智能找矿大模型,开展成矿理论知识指导下的智能算法靶区圈定。三是开展基于人工智能辅助的三维地质建模。基于DeepSeek构建智能找矿大模型,开展三维地质模型自动构建,进行资源储量智能估算与三维矿体定位。
3
DeepSeek在地质找矿领域应用仍面临诸多挑战
尽管DeepSeek等通用大模型已经在一线地质找矿工作中得到初步探索与应用,但仍面临三个方面的挑战。
一是通用大模型在地质找矿领域的专业能力有待提升。现阶段大模型在地质找矿领域的应用主要是依靠其具身智能,由于通用大模型对复杂的地质专业知识理解和分析能力有限,在地质找矿中深入应用仍需要进行相应的微调优化,增强其行业适配性。
二是可供大模型使用的优质专业训练数据集不足。地质找矿工作存在“数据孤岛”现象,各单位之间数据资料的共享存在一定壁垒。海量的矿产勘查数据资料难以集成并制备优质的专业训练数据集。同时,融入专业知识的训练数据集制备,亟须一线地质工作者参与。
三是随着地质工作及认识的不断深入,地质资料数据不断增加、新认识不断涌现以及带来的对原有认识的修正,导致其及时有效嵌入大模型仍存在难度。随着DeepSeek等通用大模型自身的迭代升级、新类型的不断涌现、模型算法的更新和模型参数的扩容,其具身智能也在不断提升,然而已完成专业微调训练的大模型,其具身智能难以进行升级。
4
大模型在地质找矿领域的应用前景
夯实大模型训练和优化的基础,以“不变应万变”,迎接大模型的更新迭代。一是构建地质找矿工作的训练数据集,夯实数据与知识基础。通用大模型在地质找矿工作中的深度应用,需要专业知识与数据的嵌入。无论大模型如何推陈出新,融入专家知识的优质语料库,都是保证知识有效及时嵌构的重要载体,更是通用大模型专业逻辑架构的根基。二是建立可拓展的大模型微调优化算力设施,夯实硬件基础。大模型的应用与训练,对算力等硬件设施有极高的要求,尤其是高参数的通用大模型。地质找矿领域大模型的应用,应配备可拓展的硬件设施,以满足大模型不断更新迭代的需求。
创新地质找矿工作知识的表达方式,提升大模型对专业知识的理解与推理能力。一是构建专业的知识图谱与数字矿床模型。地质找矿工作者可基于地质资料馆馆藏资料,辅助公开文献,利用DeepSeek强大的多模态数据处理能力,构建专业的知识图谱和数字矿床模型,完善大模型对专业知识的理解及推理能力的逻辑架构,突破大模型对数据的表层记忆限制。二是研究建立知识图谱与数字矿床模型构建的标准与规范。开展典型矿床特征研究,总结成矿地质背景、成矿特征、物化遥异常标志、矿床成因类型与成矿模式等,梳理成矿要素、勘查要素、找矿预测要素。在此基础上,制定知识图谱与数字矿床模型构建的标准与规范,增强知识图谱与数字矿床模型的系统性。
进一步探索和试点示范基于地质找矿实践的智能化平台。一是研发地质找矿实践的智能化平台。现阶段大模型服务地质找矿工作的应用尚处于起步阶段,亟须建立统一平台,进行信息共享,形成合力,共同探索、开发、验证大模型在地质找矿不同工作环节应用的有效性。二是积极开展智能找矿工作的试点示范。围绕油气、铀、铬铁矿等重点矿种,聚焦重点油气盆地和重点成矿带,开展地质找矿大模型应用试点示范,验证其有效性和准确性。
(邢万里 甄世民 王春女 李萌坚 郑啸)
(作者单位:中国地质调查局发展研究中心)
编辑/宫 莉
初审/李晓娜
审核/张丽华
审签/沙马建峰