关键词:
域适应
预训练
上下文学习
证据学习
摘要:
近年来,机器学习技术的快速迭代推动了计算机视觉领域的革新,提升了图像分类、目标检测及语义分割等核心任务的性能。然而,传统监督学习范式中隐含的独立同分布假设在开放世界中面临严峻挑战,实际部署场景中普遍存在的域偏移,即数据分布不一致现象往往导致模型性能衰退。为缓解数据分布引发的泛化困境,域适应机器学习技术通过特征空间对齐和知识迁移等机制,增强模型在跨域场景下的鲁棒性。尽管如此,现有研究在应对现实复杂场景时仍存在亟待突破的技术瓶颈。针对开放世界场景下域适应技术面临的三大挑战展开系统性研究:连续变量引发的分布偏移、预训练对域适应的影响、以及源域与目标域标签集合不重叠时的可信预测问题。通过理论创新与方法改进提出了一系列具有理论保障与实践价值的解决方案,为域适应技术的实际应用提供了新的研究范式。主要贡献体现在以下三方面:
(1)面向连续变量引起的数据分布偏移问题,提出连续域适应问题,并且为了全面的评价模型性能,构造了基准数据集。揭示了时间演化、观测角度等连续变量导致的数据分布连续渐变特性,并构建了基于交替训练策略的几何约束模型。通过设计“牵拉”和“收缩”双阶段优化机制,在特征空间中维护源域与目标域的分布几何结构,同时引入连续性约束以增强对无限数量未见目标域的外推能力。实验表明,该方法在旋转角度、时间序列和俯仰角度三类连续变量构成的基准测试中,较传统离散域方法取得了性能提升。
(2)面向预训练对于域适应的影响问题,针对目标域错误率上界的理论框架,突破仅考虑源域和目标域的传统双域范式,建立包含预训练域的三域理论框架。通过量化分析预训练知识退化现象与梯度差异效应,揭示了预训练导致目标域错误率上界升高的内在机理。基于此提出的训练框架引入预训练数据复用机制,有效降低目标错误风险上界。结合语义相似度的数据选择策略,减少所需预训练数据的数量,提升了训练的高效性,并在预训练数据不可用时提供了合成图像的替代方案,进一步证明了方法的有效性。所提出的方法能够与现有的无监督域自适应和无源域自适应方法无缝集成,在少量预训练或合成图像条件下仍然有效,在多个基准测试中提升了的性能。
(3)面向源域与目标域标签集合不重叠时的可信预测问题,基于上下文学习与证据理论,实现了在仅需单参考标注条件下实现可信预测。聚焦于图像分割任务,探讨了将自然图像训练的基础分割模型直接应用于医学图像分割的可行性。构建单样本引导的上下文学习范式,通过空间拼接与模型中注意力机制捕捉跨图像特征相似性。设计基于委员会投票的证据学习策略,将几何/光度变换后的目标图像视为独立委员会成员,通过融合语义不变性与几何等变性先验知识,减小自然图像和医学图像分布差异对于性能的影响,以及缓解模型过度自信问题。方法在多个模态的图像上进行了测试,实验结果以及可视化充分验证了所提方法的有效性和鲁棒性。