从数据导入到预测验证：GeoStrata 的完整工作流是怎样串起来的

真正把地学分析做成一个稳定系统时，问题很少出在“有没有某个功能”，而更常出在工作流是否被组织清楚。同样一批井数据，导入方式不同、深度参考不统一、快速尝试与正式预测混在一起、验证结果与手工对比互相覆盖，最后都会让原本看起来合理的分析链条失去可追踪性。GeoStrata 的一个核心设计，不是单点算法，而是它如何把数据导入、深度标准化、预测、对比、验证和输出组织成一条连续的工作流。

图 1. GeoStrata 将预测、验证与手工对比拆分成不同路径，避免不同置信级别和不同目的的结果混入同一条输出流。

输入数据不是“导进来”就结束，而是整个流程的起点

GeoStrata 面对的从来不是一种单一输入。一个真实项目通常同时包含曲线数据、轨迹数据、层位数据、岩性数据以及项目级辅助信息。把这些文件读进系统当然是第一步，但真正决定后续流程是否成立的，不是“是否成功导入”，而是系统能否把这些对象组织成可计算、可比较、可复核的项目上下文。

这正是 GeoStrata 与许多临时脚本工作方式的一个区别。对后者而言，数据往往是在需要时临时读取、局部拼接；而对 GeoStrata 这样的工作平台来说，输入对象之间的关系本身就是系统的一部分：哪些曲线属于哪口井，哪组层位与哪条轨迹对应，岩性与深度体系如何对齐，这些都不是额外附属信息，而是后续分析链条成立的前提。

深度体系不是显示选项，而是对比与验证能否成立的基础

在 GeoStrata 的工作流里，MD、TVD、TVDSS 并不是简单的界面切换标签。它们会直接影响单井显示、多井对比、层位线位置以及结果解释的成立方式。对使用者来说，切换深度参考看上去像是一个显示动作；但对系统来说，这其实是在改变一组分析对象的空间与解释关系。

图 2. 在 GeoStrata 中，MD / TVD / TVDSS 的切换并不是外观调整，而会影响层位显示、井间对齐和验证结果的可信度。

这也是为什么 GeoStrata 必须把深度标准化与对象链接放在工作流前段。如果深度体系没有被统一整理，后续的层位显示、多井关系和验证判断就很容易出现“局部看着没问题、整体却对不齐”的情况。单井里能成立的解释，不一定能直接延伸到井间关系；而这种差异在很多地学项目里，恰恰是最容易被低估、却最影响可信度的地方。

可以把这类处理理解成工作流中的一个显式阶段：

project = GeoStrataProject.load(raw_inputs)

project.attach_logs()
project.attach_trajectory()
project.attach_markers()
project.attach_lithology()

project.normalize_depth(reference="TVDSS")
project.build_project_context()

这段伪代码表达的重点不是具体实现，而是一个系统观：在 GeoStrata 里，先统一参考，再做分析。如果这一步没有被系统性处理，后续所有预测与对比都容易带着不稳定前提继续往下走。

为什么正式预测与快速预测必须分开

GeoStrata 当前对预测流程的一个重要判断，是把“正式预测”和“快速预测”作为两条不同路径来组织。两者都属于预测，但使用场景并不相同。快速预测更像是一种快速试探、参数尝试或过程性探索；正式预测则承担更高的结果沉淀和复用要求。如果这两类结果共用相同目录、共用相同文件命名方式，那么后续验证和复盘就很容易失去边界。

这也是为什么 GeoStrata 已经开始显式区分：

outputs/prediction/
outputs/quick_prediction/

这种拆分看起来像是文件管理问题，实际上是工作流治理问题。它在回答的不是“文件放哪更整齐”，而是：

当前这个结果属于正式结论还是快速试探？
它后面应该进入哪条验证路径？
它是否会覆盖已有结果？
它在后续复盘时是否容易被误判来源？

一旦预测层没有边界，验证层也会随之失真。GeoStrata 之所以要做输出分流和命名规则统一，并不是因为目录看起来更专业，而是因为这直接决定了后续分析是否还能被准确解释。

验证流程为什么也必须单独分层

如果说预测负责产生候选结果，那么验证负责回答另一个更关键的问题：这些结果到底有没有站得住。GeoStrata 当前的工作流里，验证并不是一个附属按钮，而是一层独立的路径。至少从使用方式上，它已经区分出一键验证、快速验证和手工对比导出等不同层级。

这几类路径之所以不能混在一起，是因为它们面对的工作目标并不相同。一键验证更偏向标准化快速检查；快速验证强调效率和过程内判断；手工对比导出则更接近人工审阅、汇报或专项复核。如果这些结果都进入同一位置、沿用同一命名模式，之后几乎必然出现来源混乱与结果污染。

因此，GeoStrata 已经把它们拆到不同输出路径中，例如：

outputs/validation_compare/oneclick/<目标井>/
outputs/validation_compare/quick/<目标井>/
outputs/compare/manual/

从工程角度看，这意味着系统正在把“运行目的”也纳入输出结构本身。一个结果不只是文件内容，还包含它从哪条路径来、服务于哪种验证方式、是否属于人工介入流程。这使得 GeoStrata 的输出不再只是临时产物，而开始成为可复盘的项目资产。

输出目录和命名规则，实际上是系统可信度的一部分

在很多桌面工具或临时脚本系统里，输出管理通常是最晚才被认真处理的部分：先把结果算出来，再想办法保存。但一旦项目进入多轮分析、多种结果并行、多人讨论或多井复核阶段，输出管理就会迅速从“后处理问题”升级为“可信度问题”。GeoStrata 当前对输出目录与命名规则的治理，正是在处理这一层更深的问题。

不同流程使用不同目录，不同类型结果使用不同前缀，核心目的有三个：

避免同名覆盖与来源混淆
让快速流程与正式流程保持隔离
让验证结果能够明确回溯到对应路径

在工程上，这其实是在为系统建立一种“结果语义”。也就是说，一个输出文件不仅仅是内容载体，它还必须通过路径和命名表达自身的使用场景。只有这样，后续用户才有可能在项目层面理解：某个结果是正式产物、快速试探，还是某一轮对比验证的中间节点。

GeoStrata 试图把分析—验证—导出组织成闭环

如果把 GeoStrata 当前的工作流设计总结成一句话，那么我会说：它关心的不只是某一步能不能运行，而是整条链路能不能形成闭环。输入数据不是终点，预测结果不是终点，图形显示也不是终点。真正有价值的系统，应该允许结果被追踪、过程被复核、不同路径被比较、输出被稳定沉淀下来。

这也是 GeoStrata 与很多“能做单次分析”的工具之间最大的差别之一。它正在逐步把一类容易临时化处理的地学流程，组织成更稳定的项目结构。对于后续重构、测试、产品化甚至团队协同来说，这种组织能力本身，就是比单一功能更重要的系统能力。