前言

这部分内容可能和之前有些跨越,我会在后面慢慢补全一些深度学习成矿预测的其他内容。这篇文章的内容涉及在成矿预测,或者成矿远景区预测,成矿远景图预测,或者地球化学异常识别都是一样类似的道理。我们在做成矿预测图(Mineral Prospectivity Mapping, MPM)的时候会不得不面临数据少的问题,对于第一次接触这个的研究人员而言更是头疼。这部分内容将会尽我个人所能去说明这个事情。

image-20250507193450408

本文将围绕如下几点讲述:

  • 什么是数据增强?
  • **为什么要进行数据增强? **
  • 现在主流的数据增强方法有哪些?

需要注意的是,这部分内容是基于”图像“级别的成矿预测数据,而不是”像素“级别的成矿预测。关于更多的”图像“和”像素“级别的内容可以关注我的个人公众号:码上地球。我会在后续讲述这部分内容。

什么是数据增强

数据增强,有的人叫他数据扩增或者数据扩充,他们表达的都是一个意思。指的是一种通过人工生成或变换现有数据来扩大训练数据集规模和质量的技术。

为什么要进行数据增强

数据增强终归是因为正/负样本数量不足,导致模型训练效果不佳或者无法训练。更多的问题集中于如下几点:

  • 对于成矿而言,成矿是罕见事件,已知矿床数量有限,导致可用于训练深度学习模型的样本远远不足。

  • 监督深度学习方法(如卷积神经网络,CNN)通常需要大量样本才能有效学习数据中的复杂模式和非线性关系

  • 样本不足会导致模型预测精度下降、泛化能力弱,容易出现过拟合现象

image-20250422161650485

即“小样本数据限制”是成矿预测中常见的挑战,我们需要对正/负样本进行数据增强。

注:所有的增强都是基于一些原因而进行的,请不要为了数据增强而增强

数据增强方法

目前主流的数据增强方法可以分为两类:噪声注入合成数据,这不难理解对吧?

image-20250507192808577

合成数据

我们来先说明合成数据,因为合成数据由于适用性进而分为两个类别:传统方法其他方法(个人理解)。

对于传统方法而言,都是针对图像类地质数据的几何与光度变换,这种方法在计算机视觉中很常见,例如,自家学校或者研究生门口的人脸识别机器的训练数据。几何与光度变换具体包括:

  • 旋转,翻转,缩放,裁切,平移,错切
  • 亮度/对比度/饱和度/色调调整,颜色抖动

不难理解,对于计算机视觉任务而言,比如人脸识别,输入的人脸由于环境关照的不同,相机的性能参数差异,遮挡,人物的抖动,方向等各种原因,我们通过数据增强来大量的模拟这种情况是非常合理的。

这种方法实现简单,成本低,但是它对地质数据而言适用性非常有限对于网格化的地球物理或地球化学图,简单的几何变换(如旋转)可能会改变固有的空间意义或方向依赖性特征(例如磁异常、构造线理)。并且有不少的研究证明了,这些传统的数据增强方法对地质勘探的数据无效,甚至是导致地质意义是错误的。

image-20250507192449276

这就很麻烦了,我们迫切需要一些“地质感知”或“地质约束”的增强方法。很幸运的是,人类的智慧是无穷的,我们拥有了更多其他方法,包括:滑动窗口法,基于限定区域的滑动窗口法,像素对特征法,自编码器和对抗生成网络

当然也可能有其他方法,主流上或者常见的方法大概就这些了。

滑动窗口法(Sliding Window),顾名思义,就是我们通过一个更小尺寸的窗口对底图进行裁切以“生成”更多新样本。如下图所示,尽管这个图不是很标准,但是实际上我们是通过围绕矿点/矿体按照一定的步长进行滑动裁切以最终合成大量的正样本。这不难理解对吧?这也是目前最常用的一种数据增强方法。

image-20250507195136278

基于限定区域的滑动窗口法,这是一种滑动窗口方法的变体,他和滑动窗口法的区别在于,先使用一个比滑动窗口更大的窗口选定矿点/矿体,然后在限定区域的窗体里面用更小尺寸的窗体以一定步长进行滑动采样。最终形成大量的正样本。

image-20250507195625202

注:图像来源 (Yang et. al., 2022)

像素对特征法(Pixel-pair feature, PPF),首先要说明的是这个中文不一定官方,也有的地方译作像素到特征法,请注意辨别,这是指的同一种方法。这种方法通过另一种思路来完成的数据增强。即通过匹配像素对是否相似来实现的。举例而言:通过在正样本和负样本之间随机匹配大量的像素对,如果是两个正样本则输出 True,如果是两个不一样的样本,则输出False。基于这种方法可以在少量数据基础的情况下,快速生成大量的样本。

image-20250507200738218

注:图像来源 (Zhang et. al., 2021)

自编码器(AutoEncoder),自编码器是一种无监督学习的神经网络模型,它由两部分组成:编码器(Encoder)和解码器(Decoder)

  • 编码器:将高维的输入数据压缩成一个低维的潜在空间表示

  • 解码器:尝试从潜在空间的表示中重建原始输入数据

训练的目标是最小化输入数据与其重建数据之间的差异。通过这个过程,自编码器学习到了数据的内在结构和重要特征的压缩表示。

在了解自编码器的基本原理后,我们可以首先,将多源地球科学数据(地球化学,地球物理,地质数据,遥感数据)等作为自编码器的输入,通过自编码器学习数据的潜空间分布和模式,进而通过将正/负样本在潜空间里面的进行微小的随机扰动或插值采样。最后利用解码器最终生成新合成的样本

image-20250507201616140

对抗生成网络(Generative Adversarial Network, GAN),对抗生成网络由一个生成器(Generator)和一个判别器(Discriminator)组成生成器试图生成逼真的假数据,而判别器试图区分真实数据和假数据。通过这种对抗训练,生成器学习生成与真实数据在分布上相似的合成数据。

相信你在看到上面简短的原理可以理解到了他是如何进行的数据增强(合成数据),我们只需要将训练目标定义为训练生成器来生成看起来像真实地质、地球物理等数据的合成样本(例如,生成反映矿化异常的地球化学或地球物理图像、生成符合特定地质背景的组合特征)。

image-20250507202136314

噪声注入

添加随机零噪声(也有的用的是高斯噪声是指的一个意思)是一种噪声注入的方法,通过向证据层添加零值噪声点以增加数据集大小,同时保持位置和相关性。这很容易理解,如下图所示:

image-20250507204322115

注:图像来源 (Li et. al., 2021)

另一种方法是数据扰动,就目前而言,我见到的使用的不多。他是通过在原来数据的基础上,进行微小的抖动。这种方法一定程度上受限于数据类型和实际地质意义。

非均衡样本

说点题外话,从机器学习的特征工程的角度来看,我们增强数据的目的一方面是解决训练量不足的问题,另一方面而言是从根本上解决非均衡样本分类的问题。从非均衡样本的角度来看,我们的解决方案主要是两种:过采样和欠采样

当然,关于非均衡分类的问题有很多指的说明讨论的,但是我们这部分内容并不专注于讨论这个,只是尝试从另一个角度来启发不同的研究思路。

End

回收开头的情况,对于数据增强方法的选择,至于是合成数据好还是噪声注入好而言,各有优势,有句话说得好,小孩才做选择,我全都要(😂笑)。开玩笑,做研究嘛,还是要根据具体情况来定夺的。

image-20250507205813420

总而言之,言而总之,对于成矿预测任务进行的数据增强方法大概如下表所示:

数据增强方法 说明
裁切,旋转,缩放,错切,亮度/对比度调整,颜色抖动等 对于计算机视觉任务是常用的,但是对于成矿预测而言,这种增强变换方法会破坏地质意义,不推荐使用。
滑动窗口法(Sliding Window) 目前主流的方法,通用万金油。通过围绕正样本(矿点)做循环滑动裁切。
零噪声添加法(Adding random zero noise) 创新方法,增强模型的鲁棒性,不过有些学者认为这种方法会一定程度上影响地质事实。
数据扰动 有一定的局限性
基于限定区域的滑动窗口法 滑动窗口法的变体,先选定大区域,然后在里面用小尺寸窗口滑动裁切。
像素对特征法(Pixel-pair feature) 利用逆向思维,通过匹配两个数据样本是否相似来抽样组合大量样本
自编码器(AutoEncoder) 深度学习方法,有一些学者在使用
对抗生成网络(Generative Adversarial Network) 深度学习方法,效果更多的依赖于大量的高质量数据样本

参考文献

  • 文中所有表情包出自互联网网友,包括但是不限于知乎,小红书等平台。感谢友情提供🌹
  • 什么是数据增强
  • Zhang, C., Zuo, R., Xiong, Y., 2021. Detection of the multivariate geochemical anomalies associated with mineralization using a deep convolutional neural network and a pixel-pair feature method. Applied Geochemistry 130, 104994.
  • Liu, Y., Sun, T., Wu, K., Xiang, W., Zhang, J., Zhang, H., & Feng, M. (2025). Interpretability Analysis of Data Augmented Convolutional Neural Network in Mineral Prospectivity Mapping Using Black-Box Visualization Tools. Natural Resources Research, 1-25.
  • Yang N., Zhang Z.K., Yang J.H., Hong Z.L., 2022. Applications of data augmentation in mineral prospectivity prediction based on convolutional neural networks. Computers & Geosciences 161, 105075.
  • Yang, F., Zuo, R., Kreuzer, O.P., 2024. Artificial intelligence for mineral exploration: A review and perspectives on future directions from data science. Earth-Science Reviews, 104941.
  • Sun, K., Chen, Y., Geng, G., Lu, Z., Zhang, W., Song, Z., Guan, Y., Zhang, Z., 2024. A Review of Mineral Prospectivity Map Using Deep Learning. Minerals 14, 1021.
  • Li, T., Zuo, R., Xiong, Y., Peng, Y., 2021. Random-Drop Data Augmentation of Deep Convolutional Neural Network for Mineral Prospectivity Mapping. Natural Resources Research 30, 27–38.
  • Zuo, R., Xu, Y., 2023. Graph deep learning model for mapping mineral prospectivity. Mathematical Geosciences, 55, 1-21.
  • EveryThing about AutoEncoders, Tejpal Kumawat.
  • Adversarial Networks (GANs)? Understanding and Implications, Sushant Babbar.