网站设计需要那些模块,企业门户网站建设优势,苏州网页制作设计,排名好的网站开发[集创赛海云捷讯杯]全国二等奖经验分享 一.前言二.我们的作品三.小结 一.前言
笔者是研一在校生#xff0c;从五月份开始和本科生一起卷集创赛#xff0c;经历初赛#xff0c;分赛区决赛#xff0c;全国总决赛#xff0c;认识了很多一起做比赛的朋友收获颇丰。今年海云杯… [集创赛海云捷讯杯]全国二等奖经验分享 一.前言二.我们的作品三.小结 一.前言
笔者是研一在校生从五月份开始和本科生一起卷集创赛经历初赛分赛区决赛全国总决赛认识了很多一起做比赛的朋友收获颇丰。今年海云杯初赛报名队伍340支左右晋级分赛区决赛的队伍130支晋级全国总决赛22支加上各赛区优秀组织队伍报送一共晋级全国总决赛26支队伍。在淘汰率方面可以说是各杯赛最卷的几个杯赛之一了。其中我在的东北赛区分赛区八组晋级一组总决赛除了西南赛区各个赛区也基本上都是这个比例。 为了记录一下集创赛的过程也为下一届报名海云杯的同学们提供些借鉴计划未来一两个月推出海云捷讯集创赛经验贴分享专栏。在专栏中会尽可能的详细介绍在做海云杯的过程中遇到的困难和解决思路。
二.我们的作品
目前基于FPGA的机器视觉技术在缺陷检测领域发展迅速深度学习技术凭借其不需要人工、依靠卷积神经网络的特征表征能力自动提取特征的优点被广泛应用于缺陷检测领域。本设计基于海云自研CNN加速器对AI框架进行深度优化更高效的利用CNN加速器从而实现机器视觉缺陷检测。 本文首先阐述了DVP、VGA时序、模型缩放、QAT量化、MobileNet_SSD算法等的原理对Paddle-lite推理框架、工业缺陷检测存在的问题以及小目标识别的解决策略进行了详细阐述。训练一个全精度mobilenet_v1_ssd模型作为基准模型。针对样本中针孔识别置信度较低的问题将算法默认的先验框大小进行了调整提高了针孔样本推理置信度。对SDK各部分进行耗时分析使用neon指令集优化输入输出重排使推理时间降低至570ms左右。同时对模型先验框算子进行离线运算将推理时间降低到220ms。在自定义位置插入伪量化节点完全卷积全融合将推理时间降低到186ms。通过敏感度分析结果使用量化裁剪联合调度策略完成裁剪使推理时间降低为55ms。使用临近插值算法进行图形缩放算法优化。使用模块分层设计和状态机的方案重写dvp_ddr3ddr3_vga输入重排和预处理加速等模块使系统能够流畅运行。在完成图片推理后我们再联合调度摄像头、HDMI和加速器。成功的实现了视频读入输出实现推理与摄像头加载图像的并行化使推理刷新时间达到76ms。进一步地通过多线程调度推理和HDMI刷新提升pl侧的时钟频率将HDMI平均刷新帧率提升至38Hz平均推理刷新速度85ms。
我们使用模块分层设计和状态机的方案成功实现了dvp_ddr3ddr3_vga输入重排和预处理四个IP。经过上述优化推理刷新时间最短为82ms平均为85ms。HDMI平均刷新帧率为38Hz。成功检测了分赛区测试视频的十份缺陷样本完成了赛题要求的设计指标。为了进一步提升推理刷新速度我们自主设计了基于脉动阵列的CNN加速器通过Avalon-mm总线进行系统互联使用分层次状态机的方案完成数据加载和调度。 三.小结
等笔者写完毕设开题再回来更新