网站建设发朋友圈的图片,中国建设银行行网站,制作app怎么制作,邢台市住房和城乡建设局官方网站ASPLOS 2023 Paper 论文阅读笔记整理
问题
近数据处理#xff08;NDP#xff09;是一种很有前途的体系结构范式#xff0c;可以解决数据密集型应用程序的内存墙挑战。基于3D堆叠存储器的典型NDP系统包含大量并行处理单元#xff0c;每个并行处理单元都可以访问其本地存储…ASPLOS 2023 Paper 论文阅读笔记整理
问题
近数据处理NDP是一种很有前途的体系结构范式可以解决数据密集型应用程序的内存墙挑战。基于3D堆叠存储器的典型NDP系统包含大量并行处理单元每个并行处理单元都可以访问其本地存储器以及系统中的其他远程存储器区域。 现有方法局限性
在NDP体系结构中最小化远程数据访问和实现计算负载平衡需要权衡。对于倾斜的负载在离其数据位置更近的地方执行计算任务会导致负载不平衡产生热点。为确保负载平衡而动态调度任务不可避免地会使一些计算远离其数据的首选位置从而导致更多的远程访问。现有技术[1355597088]必须牺牲一种技术来改进另一种技术从而限制NDP的性能和能源效益。
本文方法
本文提出了ABNDP利用软硬件协同优化来同时缓解这两个问题。 在硬件方面使用了分布式DRAM缓存设计Traveller cache在每个处理单元保留一小部分本地DRAM以缓存来自远程存储器的数据。不允许在任何地方自由缓存数据而是将每个数据块的缓存限制在NDP系统中分布的有限数量的camp位置。camp位置的缓存数据由附近的多个处理单元共享提高了缓存空间利用率和数据重用时间同时仍确保了较短的访问距离。进一步对不同的camp位置使用倾斜映射减少缓存冲突。 在软件方面采用混合任务调度策略同时考虑远程访问成本和负载不平衡影响。除了原始内存位置之外用于缓存数据的多个camp位置为调度提供了更高的灵活性这可以更好地分散热数据上的繁重计算并减少任务中的总远程访问距离。偏斜的camp位置映射方案简化了访问多个数据的任务的调度。 评估表明ABNDP成功地实现了最小化远程访问成本和保持负载平衡这两个目标并且平均在性能1.7×和能耗25%方面显著优于基线系统。
实验
实验环境zsim[77]模拟器 数据集数据密集型应用。BFS、单源最短路径sssp、Page Rankpr、图卷积神经网络gcn、A*搜索astar、K最近邻knn、稀疏矩阵向量乘法spmv、K-meanskmeans。
实验对比加速比、能量消耗、远程访问次数、活跃核心数、
实验参数数据集
总结
针对使用3D堆叠存储器的近数据处理NDP问题现有方法难以同时实现最小化远程数据访问和计算负载平衡。本文提出ABNDP利用软硬件协同优化来同时缓解这两个问题。1在硬件方面使用了分布式DRAM缓存在每个处理单元缓存远程存储器的数据。对处理单元分组camp每组缓存一份数据缓存数据由附近的多个处理单元共享。进一步对不同的camp位置使用倾斜映射减少缓存冲突。2在软件方面采用混合任务调度策略同时考虑远程访问成本和负载不平衡影响。可以调度到camp缓存附近更好地分散热数据上的繁重计算并减少任务中的总远程访问距离。
局限性同一份数据缓存在多个DRAM缓存一致性的开销应该较高适用于数据修改较少的负载。