• 简体   /   繁体
基于图像-文本大模型CLIP微调的零样本参考图像分割-计算机应用研究2025年04期

基于图像-文本大模型CLIP微调的零样本参考图像分割

作者:刘杰 乔文昇 朱佩佩 雷印杰 王紫轩 字体:      

摘 要:近年来,以CLIP为代表的视觉-语言大模型在众多下游场景中显示出了出色的零样本推理能力,然而将CLIP模型迁移至需要像素水平图-文理解的参考图像分割中非常困难,其根本原因在于CLIP关注图像-文本整体上的对齐(试读)...

计算机应用研究

2025年第04期