HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

面向GPU计算平台的归约算法的性能优化研究

摘要:归约算法在科学计算和图像处理等领域有着十分广泛的应用,是并行计算的基本算法之一,因此对归约算法进行加速具有重要意义。为了充分挖掘异构计算平台下GPU的计算能力以对归约算法进行加速,文中提出基于线程内归约、work-group内归约和work-group间归约3个层面的归约优化方法,并打破以往相关工作将优化重心集中在work-group内归约上的传统思维,通过论证指出线程内归约才是归约算法的瓶颈所在。实验结果表明,在不同的数据规模下,所提归约算法与经过精心优化的OpenCV库的CPU版本相比,在AMDW8000和NVIDIATeslaK20M平台上分别达到了3.91~15.93和2.97~20.24的加速比;相比于OpenCV库的CUDA版本与OpenCL版本,在NVIDIATeslaK20M平台上分别达到了2.25~5.97和1.25~1.75的加速比;相比于OpenCL版本,在AMDW8000平台上达到了1.24~5.15的加速比。文中工作不仅实现了归约算法在GPU计算平台上的高性能,而且实现了在不同GPU计算平台间的性能可移植。

关键词:
  • 归约算法  
  • gpu  
  • 线程内归约  
  • opencl  
作者:
张逸然; 陈龙; 安向哲; 颜深根
单位:
北京信息科技大学; 北京100049; 中国石油集团东方地球物理勘探有限责任公司; 河北涿州072751; 深圳市商汤科技有限公司; 广东深圳518000
刊名:
计算机科学

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机科学

计算机科学杂志紧跟学术前沿,紧贴读者,国内刊号为:50-1075/TP。坚持指导性与实用性相结合的原则,创办于1974年,杂志在全国同类期刊中发行数量名列前茅。