前言

前面的内容讲述了,机器学习为地质学家寻找矿产资源开辟了新的契机与范式,并成功克服了传统地学统计模型(如证据权重法)的部分局限。然而,我们也必须正视——机器学习依然存在一些难以彻底消除的不足。这些不足促使部分研究者在成矿预测领域中积极探索,并尝试引入其他方法加以改进。

image-20251021155616349

这也就是我们这部分内容要讲述的深度学习——卷积神经网络 (Convolutional Neural Network, CNN) 的故事。当然在开始讲述我们的主要内容之前,需要先说明一下传统的机器学习的“枷锁”

机器学习的“烦恼”

以支持向量机 (Support Vector Machines)、随机森林 (Random Forests, RF) 和逻辑回归 (Logistic Regression) 为代表的经典机器学习模型,在过去十年中为定量化找矿预测做出了巨大贡献 。然而,这些模型的共同点在于,它们无法直接“消化”原始的地质图件。它们需要的是结构化的、量化的输入,即一系列被称为“证据图层”或“特征图”的专题地图。特征工程,就是地质学家将自己的专业知识和成矿理论,手动转化为这些机器可读的证据图层的过程 。

这个过程本质上是将地质学家的假设进行空间量化。以下是一些具体的例子:

  • 邻近度分析: 如果地质学家认为“矿床倾向于产在断裂带附近”,他们就需要利用 GIS 工具,手动生成一张“断层缓冲区图”,图上每个像素的值代表其与最近断裂的距离 。
  • 属性提取: 如果理论指出“某类特定岩体是成矿母岩”,地质学家会从复杂的地质图中提取该岩体,生成一张二值图,图中仅突出显示该岩体的分布范围 。
  • 地形因子: 其他常见的证据图层还包括高程、坡度、曲率等,这些都是从数字高程模型 (DEM) 中手动提取的 。

当然还有很多,这并不是这部分内容所要重点探究的,如果感兴趣,请关注微信公众号:码上地球-数学地球科学获取更多内容。

最终,一个典型的矿产预测项目可能会产生数十个这样的证据图层,它们共同构成了一个“证据包”,被送入传统机器学习模型进行训练和预测。

image-20251021160847258

图片来源:Yang et al., 2022

尽管这一过程能将宝贵的专家知识融入模型,但其固有的缺陷也成为了制约勘查效率和发现新类型矿床的“枷锁”。

  1. 耗时耗力: 创建这些证据图层是一项巨大的工作量。对于一个区域性的勘查项目,仅仅是数据的收集、清洗、数字化和空间分析,就可能耗费一个地质团队数周甚至数月的时间。这个过程成本高昂,且效率低下 。
  2. 知识依赖与主观性: 这是最核心的痛点。创建哪些特征、如何创建(例如,缓冲区距离设为500米还是1000米?),完全依赖于专家的先验知识和对所研究矿床类型的理解 。这意味着,如果成矿模式是未知的、非典型的,或者专家自身的知识体系存在局限,那么最关键的成矿证据很可能在特征工程阶段就被忽略了,模型从一开始就失去了发现它的机会 。整个预测流程被专家的“概念模型”所束缚,难以实现真正的突破性发现 。
  3. 信息损失: 将复杂的空间关系简化为几个单一的证据图层,不可避免地会丢失原始数据中蕴含的丰富信息。例如,一张航磁异常图包含了形态、强度、梯度、纹理等多维度的复杂信息,当它被简化为一张“高磁异常区”的二值图时,绝大部分的细节信息都被丢弃了 。同样,一张“断裂密度图”只告诉我们哪里断裂多,却丢失了断裂的走向、倾向、切割关系等至关重要的结构信息。这种简化是对复杂地质现实的降维打击,可能导致模型错失关键的、由多种信息微妙组合而成的成矿模式 。
img

图片来源:Senanayake et al., 2023

尽管一些研究试图通过“暴力”生成成百上千种特征变体(例如,不同参数的缓冲区、不同窗口大小的密度图),然后利用算法来筛选出最优特征,以期减少主观性 。然而,这种方法虽然在一定程度上自动化了特征选择,但并未解决特征生成阶段的根本局限性——它依然是在一组预设的、简单的几何和统计运算框架内进行探索,无法触及原始数据中更深层次、更复杂的模式。

image-20251021161634873

卷积神经网络登场——地质学家的“智能之眼”

面对特征工程的重重枷锁,卷积神经网络 (CNN) 提供了一种全新的、颠覆性的解决方案。我们可以将 CNN 比作一个配备了无数“模式放大镜”的眼睛,它能够直接“阅读”原始的地质空间图像数据。而实现这一功能的核心部件,就是**卷积核 (Convolutional Kernel)**。

卷积核是 CNN 的基本工作单元。它是一个很小的数值矩阵(例如一个 $3 \times 3$ 或 $5 \times 5$ 的像素窗口),它会系统地滑过(这个过程称为“卷积”)整张输入的栅格图像,如地质图或地球物理异常图 。

LueNK6b

图片来源:The Sliding Window

与一个被动的窗口不同,每个卷积核都是一个高度专业化的模式探测器。我们可以把它想象成地质学家工具箱里不同专长的“小锤子”:

  • “边缘锤”: 这种卷积核的内部数值(权重)被设计成当它滑过图像中像素值发生剧烈变化的地方时,会产生强烈的响应。在地质图像中,这些地方通常是岩体边界、断裂线、或地球物理异常的清晰边缘
  • “纹理锤”: 这种卷积核则专注于识别某种特定的、重复出现的像素排列模式。例如,它可以被训练来识别遥感图像上某种与特定蚀变矿物相关的独特纹理,或是地球化学晕中某种特定的元素分布样式
  • “交汇锤”: 更复杂的卷积核甚至可以学习识别两种不同方向的线性特征交汇的模式,从而直接在图像上定位出潜在的构造交汇点,而无需手动创建断裂线和交点图层。

卷积核的工作过程可以分解为以下步骤:

  1. 滑动 (Sliding): 卷积核从输入图像的左上角开始,按照设定的步长(Stride),系统地向右、向下移动,直到覆盖整个图像 。
  2. 计算 (Computation): 在每一个停留的位置,卷积核会与它所覆盖的图像区域进行“逐元素乘积再求和”的数学运算(也称点积运算)。这个运算的结果是一个单一的数值 。
  3. 生成特征图 (Feature Map Generation): 所有位置计算出的数值组合在一起,形成一张新的、尺寸通常略小于原始图像的栅格图,这就是特征图 (Feature Map),也叫激活图 (Activation Map)

这张特征图意义非凡。它不再是原始的地球物理或地球化学数据,而是一张“模式激活图”。在这张图上,只有卷积核感兴趣的特定模式所在的位置被“点亮”(即具有较高的数值),而其他不相关的区域则变得暗淡 。例如,一个“边缘锤”卷积核处理过的航磁图,其生成的特征图将只剩下清晰的磁异常体边界,而内部平缓变化的区域则会被抑制。

通过拥有成百上千个各司其职的卷积核,CNN的第一层就能够将一张复杂的原始地质图像,分解成数百张各自代表一种基础模式(如不同方向的边缘、不同的纹理、不同的颜色斑块等)的特征图。这为后续更深层次的模式组合与学习奠定了坚实的基础。

这一过程的革命性在于,它实现了特征提取的自动化。传统方法中需要地质学家耗费数周完成的“断层提取”、“环形构造识别”等工作,在CNN中被转化为一系列并行的、可学习的卷积运算,在几分之一秒内即可完成。

image-20251021162900147

从像素到模式——CNN的“端到端”革命

如果说单个卷积核是 CNN 的“眼睛”,那么将成千上万个卷积核组织在多层结构中,就构成了 CNN 强大的“视觉皮层”。正是这种层级化的智慧,让 CNN 能够从最基础的像素点中,逐步构建出对复杂成矿模式的深刻理解,最终实现了地质勘查领域“端到端”学习的革命。

一个真正的 CNN 模型并非只有一层卷积操作,而是由多个卷积层、池化层和激活函数层堆叠而成 。这种深度和层级化的结构,使得 CNN 能够以一种类似于人类视觉系统的方式,逐步学习和组合特征:

  • 浅层网络: 靠近输入端的最初几层网络,它们的卷积核学习识别非常基础和原始的模式。在地质图像分析中,这对应于识别出最简单的视觉元素,例如特定方向的边缘(可能代表一条小断裂)、角点(可能代表构造拐点)、以及色块或梯度(可能代表一个初步的地球化学异常晕) 。这些特征本身并没有复杂的成矿意义,但它们是构成一切复杂模式的“积木”。
  • 中层网络: 这些层级接收来自浅层的特征图作为输入。它们的卷积核不再直接观察原始像素,而是观察由浅层网络提取出的“边缘”、“角点”等模式的组合。因此,中层网络能够学习到更复杂的复合模式。例如,一个中层卷积核可能会学习识别由多个“边缘”特征组合而成的“环状”结构(可能对应一个环形影像或穹窿构造),或者由多个“梯度”特征构成的“放射状”纹理(可能对应某种蚀变分带) 。
  • 深层网络: 靠近输出端的深层网络,则将中层网络识别出的复杂模式进一步组合,最终形成与成矿直接相关、高度抽象和复杂的空间模式。一个深层网络的激活可能代表着一个非常具体且复杂的成矿有利度判据,例如:“一个北东向展布的线性构造(来自浅层)与一个环状特征(来自中层)的接触带附近,同时伴随着某种特定的地球化学纹理组合(来自中、浅层)”。这个由数据驱动自动学习到的复杂规则,其精确性和复杂性可能远超任何人类专家能够预先定义的特征组合 。
VGGNet model architecture [5].

图片来源:Visual Guide to Applied Convolution Neural Networks

这种从简单到复杂的特征自学习能力,最终导向了CNN最核心的优势——端到端学习。我们只需要向其输入最原始的数据,然后直接让它输出最终的预测结果(例如,成矿概率图),而中间所有复杂的“特征提取”、“特征选择”和“模式组合”工作,都由网络在训练过程中自动完成 。

现实挑战

虽然我们前面讨论了 CNN 的优势以及它如何克服一些难题,但在实际应用中,CNN 依然要面对属于它自己的“高山”。

image-20251021164357625
  1. 数据依赖性: 深度学习模型,尤其是CNN,是出了名的“数据贪吃兽”。它们需要大量高质量、带有准确标签的训练数据才能学习到可靠的模式 。在地质勘查领域,“标签数据”即位置精确的已知矿点。在勘查程度高、矿点数据丰富的成熟矿集区,这一条件相对容易满足。但在很多勘查新区或研究程度较低的地区,已知矿点稀少,高质量的训练样本严重不足,这极大地限制了CNN模型的性能,容易导致模型过拟合或无法学习到有效的规律 。
  2. “黑箱”问题: 这是CNN乃至整个深度学习领域面临的最根本的挑战之一。尽管CNN可以生成一张非常精确的成矿有利度图,但它的决策过程高度不透明,我们很难用直观的地质语言去解释为什么模型会将某个特定区域标为高潜力区 。模型内部数百万个参数的复杂相互作用,形成了一个难以解读的“黑箱”。这种缺乏可解释性的问题,成为了地质学家信任和应用模型结果的主要障碍。一个地质学家很难说服管理层为一个耗资巨大的钻探项目提供资金,如果他的唯一理由是“因为AI模型说这里有矿”。
  3. 计算资源需求: 训练一个处理海量高维地学空间数据的大型CNN模型,需要强大的硬件支持,特别是高性能的图形处理器。

现实情况是计算资源反而是最容易解决的了😂

结语

当然,卷积神经网络的局限性与诸多细节问题,这里尚未深入探讨,因为那将偏离本文的核心。但总体而言,卷积神经网络并不是为了取代地质学家,而是致力于成为他们最敏锐的“义眼”和最强大的“外脑”。当然,这已经是题外话了。

image-20251021165043872

科学探索永无止境,本文仅为笔者个人学习总结。因知识所限,文中若有不当之处,敬请方家斧正。

参考内容

  • Yang, N., Zhang, Z., Yang, J., & Hong, Z. (2022). Applications of data augmentation in mineral prospectivity prediction based on convolutional neural networks. Computers & geosciences, 161, 105075.
  • Zhang, H., Xie, M., Dan, S., Li, M., Li, Y., Yang, D., & Wang, Y. (2024). Optimization of Feature Selection in Mineral Prospectivity Using Ensemble Learning. Minerals, 14(10), 970.
  • Sun, K., Chen, Y., Geng, G., Lu, Z., Zhang, W., Song, Z., … & Zhang, Z. (2024). A Review of Mineral Prospectivity Mapping Using Deep Learning. Minerals, 14(10), 1021.
  • Senanayake, I. P., Kiem, A. S., Hancock, G. R., Metelka, V., Folkes, C. B., Blevin, P. L., & Budd, A. R. (2023). A spatial data-driven approach for mineral prospectivity mapping. Remote Sensing, 15(16), 4074.
  • Partington, G. A. (2010, September). Exploration targeting using GIS: More than a digital light table. In Geo Computing Conference.
  • Nidhi, D. K., Seppä, I., Farahnakian, F., Zelioli, L., Heikkonen, J., & Kanth, R. (2023, November). Enhancing Minerals Prospects Mapping with Machine Learning: Addressing Imbalanced Geophysical Datasets and Data Visualization Approaches. In 2023 34th Conference of Open Innovations Association (FRUCT) (pp. 125-135). IEEE.
  • The Sliding Window
  • Visual Guide to Applied Convolution Neural Networks