边缘检测作为图像处理与计算机视觉领域的基础任务之一,对于后续的图像分割、目标识别与场景理解等应用具有重要意义。随着深度学 习的广泛应用,尤其是神经网络在图像特征提取方面的强大表现,基于神经网络的边缘检测算法逐渐成为研究热点。传统卷积神经网络(CNN)尽 管取得了显著成果,但在多尺度特征提取和全局上下文建模方面仍存在不足。尤其是在处理复杂场景或高分辨率图像时,常出现特征融合不充分、 冗余边缘多、推理速度慢等问题。本文基于 Transformer 结构的优势,从模型优化和特征工程角度出发,设计了一种融合金字塔结构的 Transformer 边缘检测算法,以提高多尺度特征的利用率,强化图像全局语义建模能力,并通过结构优化降低模型推理时间与计算资源消耗。在 BSDS500 与 BIPED 两个公开数据集上的实验表明,所提出算法在检测精度、边缘质量及推理速度方面均优于当前主流模型,具有良好的实用前景。