云龙湖旅游景区网站建设招标,动漫模板素材图片,网站正在建设中页面的英文,郑州公司建网站摘要#xff1a;配备多头自注意#xff08;MHSA#xff09;的模型在计算机性能方面取得了显著的性能。它们的计算复杂性与输入特征图中的像素平方成正比#xff0c;导致处理缓慢#xff0c;特别是在处理高分辨率图像时。新型的token Mixer 被提出作为MHSA的替代品#xf…摘要配备多头自注意MHSA的模型在计算机性能方面取得了显著的性能。它们的计算复杂性与输入特征图中的像素平方成正比导致处理缓慢特别是在处理高分辨率图像时。新型的token Mixer 被提出作为MHSA的替代品以规避这个问题基于FFT的token混合器在全局操作中类似于MHSA但计算复杂度较低。然而尽管它具有吸引人的特性但基于FFT的token混合器尚未仔细检查其与快速发展的MetaFormer架构的兼容性。在这里我们提出了一种名为动态滤波器、DFFormer和CDFFFormer的新型token混合器使用动态滤波器来弥合上述差距的图像识别模型。CDFFormer实现了85.0%的Top-1精度接近卷积和MHSA的混合架构。其他广泛的实验和分析包括对象检测和语义分割表明它们与最先进的架构具有竞争力在处理高分辨率图像识别时它们的吞吐量和内存效率是卷积和MHSA与ConvFormer没有太大区别远远优于CAFormer。我们的结果表明动态过滤器是应该认真考虑的token混合器选项之一。
论文构建了符合MetaFormer的DFFormer和CDFFormerDFFormer和CDFFormerDFFormer块和ConvFormer块的混合模型主要由MetaFormer块组成
Dfformer模型变体配置信息如下表所示
在YOLOv5项目中添加模型作为Backbone使用的教程 1将YOLOv5项目的models/yolo.py修改parse_model函数以及BaseModel的_forward_once函数
2在models/backbone新建文件下新建Dfformer.py添加如下的代码
3在models/yolo.py导入模型并在parse_model函数中修改如下先导入文件
4在model下面新建配置文件yolov5_dfformer.yaml
5运行验证在models/yolo.py文件指定–cfg参数为新建的yolov5_dfformer.yaml