岩石薄片鉴定是一项分析岩性、构造、成岩作用及含油情况的有效手段,在地质、地球物理、石油勘探等领域发挥着关键作用。针对岩石薄片鉴定通常存在人为主观性强、工作效率低、经验门槛高等问题,我们提出了一种名为ThinGPT的多模态映射网络,旨在解决沉积岩薄片描述中存在的主观性强、效率低下及专业知识要求高等问题。该模型通过对比语言-图像预训练(CLIP)和生成式预训练模型(GPT-2)的特征空间对齐,实现了对岩石薄片图像的智能化描述。ThinGPT首次将大型语言模型(LLM)以轻量化架构应用于岩石薄片描述领域,对地质学、地球物理学和石油勘探领域的智能化发展具有重要意义。
尽管深度学习在岩石薄片图像分类、分割和超分辨率重建方面取得了进展,但特征描述生成方面的研究仍然缺乏。传统监督模型面临样本稀缺、泛化能力差和训练数据需求大等挑战。鉴于此,本次工作的创新之处在于首次提出一种针对岩石薄片的文本描述的生成的大模型架构(图1),侧重于上下文语义信息的长段鉴定结果生成。具体地,针对薄片描述中关键词频率高、句式结构化的特点,设计了基于单字符的分词方案:1)使用岩石薄片描述样本作为语料库;2)创建仅包含语料中字符、数字和符号的字符列表;3)减少训练参数,提高训练效率。
在训练策略方面,我们利用CLIP图像编码器保持冻结状态然后利用跨模态融合网络和GPT-2共同参与权重传播和梯度更新,进一步采用图像域冻结、文本域微调的训练策略。从而实现ThinGPT的轻量化架构的设计完成。
图1 ThinGPT网络架构
为开展岩性为沉积岩的岩石薄片智能鉴定任务,本研究共收集了岩性类型分别为碎屑岩、页岩及碳酸盐岩的薄片图像及鉴定文本数据。实验结果表明:ThinGPT模型生成的碎屑岩、页岩和碳酸盐岩薄片鉴定结果具备合理的上下文关系并符合真实样本风格(图2-4),在指标评估上具有潜在性能。在模型复杂度上,仅训练映射网络的ThinGPT模型更加轻量化,极大提高了薄片鉴定效率,实现了视觉和文本预训练大模型的语义联合表示(图5)。
图2 ThinGPT对碎屑岩薄片的鉴定效果对比
图3 ThinGPT对碳酸盐岩薄片的鉴定效果对比
图4 ThinGPT对碳酸盐岩薄片的鉴定效果对比
图5定量指标与关键词置信度分析
研究成果发表在油气领域国际重要期刊Petroleum Science上,论文第一与通讯作者为永利集团博士生罗歆,其博士生导师为孙建孟教授,合作者包括中石化经纬有限公司的慈兴华、刘伟,永利集团的迟蓬和崔瑞康,深层油气全国重点实验室为第一署名单位。受国家自然科学基金(No.42474156)资助。
论文信息: Luo, X., Sun, J.-M., Chi, P., Zhang, R., Cui, R.-K., Ci, X.-H., Liu, W., ThinGPT: describing sedimentary rock thin section images with a multimodal large language model, Petroleum Science, https://doi.org/10.1016/j.petsci.2025.09.009.