在地学智能化应用中,很多分类任务都会遇到同一个现实问题: 泥岩样本特别多,砂岩或优质储层样本很少; “非储层”占绝大多数,“储层”只占一小部分; 甚至某些关键岩性(如胶结强的白云岩、特定相带的细粒岩)样本数量极少。 这会导致一个典型现象: 模型 Accuracy 看起来不低,但关键类别(少数类)几乎识别不出来。或者你把 Recall 拉高了,误报(Precision 下降)又变得很严重。 这一篇文章专门讲清楚: 什么是类别不平衡,为什么地学里普遍存在; 它会对模型和指标造成什么影响; 常见的处理方法有哪些; 在岩性…