当前位置: 首页 > news >正文

青年汇网站开发公司韩国做游戏的电影 迅雷下载网站有哪些

青年汇网站开发公司,韩国做游戏的电影 迅雷下载网站有哪些,买布自己做网站衣服的,现在做网站建设挣钱吗海云捷迅杯:基于FPGA C5Soc的MobileNetV1 SSD目标检测方案设计 本作品参与极术社区组织的有奖征集|秀出你的集创赛作品风采,免费电子产品等你拿~活动。 **杯赛题目#xff1a;**海云捷迅杯——基于FPGA C5Soc的MobileNetV1 SSD目标检测方案设计 设计任务#xff1a; 基于已训…海云捷迅杯:基于FPGA C5Soc的MobileNetV1 SSD目标检测方案设计 本作品参与极术社区组织的有奖征集|秀出你的集创赛作品风采,免费电子产品等你拿~活动。 **杯赛题目**海云捷迅杯——基于FPGA C5Soc的MobileNetV1 SSD目标检测方案设计 设计任务 基于已训练好的SSD模型参数文件、基于已有的Intel FPGA工程网表文件、Linux-C5soc平台的Paddle-Paddle框架驱动为参考优化或者重新设计加速器以及对应驱动并部署SSD模型到FPGA进行推理。对方案进行评估和实现。提出设计方案提升性能并实现。 团队介绍 **参赛单位**南京大学 **队伍名称**爱卡丝俱乐部 **指导老师**王中风 **参赛队员**薛睿鑫、程昕、苏天祺 **总决赛奖项**一等奖和企业大奖 项目介绍 本项目采用Intel Cyclone V系列的SoC芯片进行开发部署以MobileNet V1为backbone的SSD目标检测模型对硬软件进行协同优化以提高目标检测效率。整个系统包括PS (processing system) 端和PL (programmable logic) 端两部分PS端包括ARM处理器、Memory负责数据传输及计算流程的预处理和控制PL端则包括卷积和偏置激活计算单元、SRAM等负责对高负载的运算进行加速。PL端的数据通过Avalon总线与DRAM进行交互。 我们在量化、排序、传输、计算、流水线这五个方面对系统进行了优化具体的优化手段如下图所示。通过上述优化目标检测的速度提升超过3.5倍。 我们的技术创新点体现在以下几个方面 重新设计了稀疏卷积的数据流采用Row-wise、Weight stationary的滑窗卷积方式将计算并行度提高到96并支持channel-wise的input数据稀疏提高了FPGA上数据的复用性大大减少数据的传输量从而减少数据的传输时间、降低功耗。采用层融合方式处理每层的偏置和激活操作在FPGA上的卷积计算完成后将结果直接传到偏置激活计算单元进行计算再将偏置激活的计算结果经过SRAM传到片外。这样一方面能够加速偏置激活的计算另一方面经过偏置激活的计算后数据能够支持量化为更低比特而不损失精度从而进一步减少数据的传输。增加input、weight、bias和output四个 Ping Pong Buffer使数据传输与计算时间能够重叠这样进一步优化了数据计算的流水线在同一时间内进行数据传输和计算从而实现对系统的加速。在进行模型预测之前将量化并重排的权重和偏置保存避免每次预测时对权重和偏置数据的重复量化和重排。 系统架构 为实现快速的目标检测效果我们设计的系统整体架构图如下图所示。数据经UpSizer和BusMatrix单元进行仲裁存储到相应的SRAM中。当计算开始时卷积模块可以直接从SRAM中读取数据卷积的结果直接传入BiasRelu单元进行计算再写入Output Ping Pong Buffer最终的output再经过BusMatrix和UpSizer单元传回DRAM。 优化效果 经过充分的仿真验证和上板调试系统能够正确完成目标检测任务最终的目标识别速度能够达到最快每张图836ms 我们统计了优化前后卷积层的加速比结果如下图所示相比原始优化前的系统我们的加速系统能够实现最高39倍加速比平均4.5倍加速比。 参赛体会 这次比赛给了我们一个很好的机会提升硬软件协同开发的能力。从硬件数据流的设计到代码的调试我们一步一个脚印提出了很多优化的方案并评估它们的可行性最终实现了上面所述的加速系统。团队的成员也能够优势互补在讨论中碰撞出了很多火花。非常感谢实验室的学长学姐和赛事指导老师曾给予我们的帮助在我们遇到难题时帮助我们指明解决问题的方向。 未来展望 针对深度卷积进行层融合优化。将深度卷积与前一层的卷积融合减少中间数据的传输。利用DMA进行片上与片下数据的传输提高传输效率。探索更加有效的量化方式能够进一步减少数据的传输量的同时保持精度。 总结 我们在官方提供的系统基础上进行优化成功在Intel Cyclon V SoC芯片上部署了以MobileNet v1为backbone网络的SSD目标检测模型联合优化ARM端和FPGA端实现了硬件加速效果。 我们有针对性地设计了稀疏卷积和偏置激活计算的数据流提高FPGA上数据的复用性减少数据传输偏置激活的计算与卷积采用层融合的流水线进行优化能够在加速偏置激活计算的同时实现更低比特的数据量化进一步减少数据的传输Ping Pong Buffer优化的数据传输与计算流水线使得数据的计算和传输能够在同一时间进行减少了计算的空闲状态此外我们还优化了模型的量化操作在进行模型预测之前将量化后的权重和偏置保存避免每次量化时对权重和偏置数据的重复量化。以上工作共同作用大大优化了系统的整体性能提升计算速度。 最后的实验结果表明我们的设计分别在模型中的普通卷积层和逐点卷积层上实现了最高39×和平均4.5×的加速比。在上板测试中我们在保证结果正确的情况下将单张图片的识别速度从3000ms提升到了836ms取得了超过3.5倍的速度提升。 作品内容来源于爱卡丝俱乐部转载请标明出处。欢迎大家参加极术社区组织的有奖征集|秀出你的集创赛作品风采,免费电子产品等你拿~活动10月1日截止~
http://www.pierceye.com/news/568056/

相关文章:

  • 龙岗在线网站建设西安房产信息网
  • 如何建立公司企业网站大朗做网站的
  • 怎么做整蛊网站wordpress系统的特点
  • php网站开发视频教程浙江建设局网站
  • 温州seo顾问温州网站优化排名推广
  • qq空间怎么做网站wordpress 分类名
  • 外贸国际网站推广重庆律师网站
  • 唐山建设信息网站wordpress 首页显示产品
  • 建设网站的公司哪个济南兴田德润怎么联系重庆短视频培训
  • 营销型网站的建设方案企业网页设计作品分析
  • 网站建设的费用报价做网站销售这几天你有什么想法
  • 做箱包关注哪个网站类似建站之星网站
  • 口碑好网站建设报价wordpress 微博侧边栏
  • 长沙 建站优化花都区手机版网站建设
  • 网站自动弹窗代码国外哪些网站可以兼职做任务
  • 怎么查看网站服务器位置wordpress 数据表结构
  • 国外做家纺的网站有些网站开发人员工具无反应
  • 泉州做网站个人网站备案号可以做企业网站吗
  • 苏州姑苏区专业做网站国外购物网站建设
  • 蒙牛官网网站怎么做的爱站网备案查询
  • 天津市建设工程监理公司网站电商seo引流
  • 导航网站链接怎么做wordpress教育相关的模板
  • 招聘网站建设人员条件wordpress有后端吗
  • 3g免费网站制作做美图 网站
  • 网站建设有哪些知识点图片制作软件哪个好用
  • 百度站长工具使用方法石岩医院网站建设
  • 网站一直百度上搜不到是怎么回事宝安大型商城网站建设
  • 本地营销型网站建设学校网站制作方案
  • 百度安装app下载免费王通seo赚钱培训
  • 郑州免费网站制作wordpress注册404