摘要:为解决现有轻量化图像超分辨率模型在平衡全局感受野、局部特征提取能力与计算效率方面的不足, 并针对Mamba架构在上下文建模中存在的跨token交互能力不足问题, 提出一种名为MTSR的高效Mamba-Transformer协同网络. 首先, 构建一种混合协同架构, 通过合理配比Mamba与Transformer模块, 利用Transformer卓越的跨token交互能力弥补纯Mamba模型在上下文建模方面的缺陷, 实现了长程依赖建模与计算效率的有效平衡. 其次, 设计一种深度卷积注意力前馈网络, 用以替代传统的多层感知机. 此网络能够显著增强局部细节特征的提取能力和通道间的信息交互, 从而减少重建过程中的像素级信息损失, 从而更充分地发挥Mamba模块的性能潜力. 最后, 提出一个三重深度可分离浅层细化模块, 该模块专注于高效捕获并增强图像的浅层特征, 为后续的非线性映射提供更丰富的原始纹理信息. 在5个公开基准数据集上的大量实验结果表明, 所提MTSR模型相较于当前的轻量化SOTA模型SRFormer-light和MambaIR-light, 峰值信噪比(PSNR)分别获得了高达0.31 dB和0.38 dB的性能增益, 同时保持了Mamba高效推理速度的优势. 实验结果表明, 该方法为轻量化图像超分辨率领域提供了一种兼具高性能与高效率的有效解决方案.