教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 精品文档 > 说明书 >

基于GPGPU的数字图像并行化预处理

来源:网络收集 时间:2026-02-08
导读: GPGPU高速处理 设计与应用 计算机测量与控制. 2009.17(6) ComputerMeasurementControl 文献标识码:A 1169 文章编号:167124598(2009)0621169203 中图分类号:TP391 基于GPGPU的数字图像并行化预处理 宋晓丽,王 庆 (西北工业大学计算机学院,陕西西安 710072) 摘

GPGPU高速处理

设计与应用

计算机测量与控制.

2009.17(6) ComputerMeasurement&Control 

文献标识码:A

  1169

文章编号:167124598(2009)0621169203      中图分类号:TP391

基于GPGPU的数字图像并行化预处理

宋晓丽,王 庆

(西北工业大学计算机学院,陕西西安 710072)

摘要:首先简要介绍了统一设备架构CUDA(ComputeUnifiedDeviceArchitecture)技术的背景、特点、内存模型,利用通用计算图形处理单元GPGPU(GeneralPurposeGPU)及CUDA技术,实现了图像直方图均衡化和薄云去除的并行化处理,与传统的基于

CPU的方法相比,两个基于GPGPU的图像预处理操作的执行效率分别提高了40倍与80倍左右,在大规模实时性图像处理操作中,有

很大的实用价值。

关键词:GPGPU;CUDA;直方图均衡;薄云去除;并行计算

DigitalImageParallelPre-ProcessingBasedonGPGPU

SongXiaoli,WangQing

(SchoolofComputerScience,Northwestern,,China)

Abstract:ParallelprocessingofhistogramequalizationandremovaloflightforbyGPGPUandCUDAtechnique.Theefficienciesoftwoimagepre-canbeimprovedupto40and80timescomparedtothesequentialmethodsbasedonCPU,beredoundedtoreal-timeapplicationsforlargescaleimageprocessingandanalysis.

Keywords:GP;;removaloflightcloud;parallelcomputing

0 前言

在过去的几十年里,人们一直在寻找各种加速图像处理的方法,然而受到CPU本身在浮点计算能力上的限制,对于那些需要高密度计算的图像处理操作,过去传统的在CPU上实现的方法,并没有在处理性能与效率上有很大的进步。然而,近些年来随着可编程图形处理器单元(GPU)在性能上的飞速发展,利用GPU加速图像处理的技术成为研究热点。

GPGPU全称GeneralPurposeGPU[1],即通用计算图形处理单元,也就是将GPU用于3D图形处理已外的通用计算,现在其应用领域已扩展到了几何造型[2]、数值计算[3]、流体模拟[4]、三维重建[5]、场景绘制[6]、数据库操作[7]等领域。传统的GPGPU方法,是通过GL/OpenGL等这一类现有的图形函数库,来编写shadinglanguage,将通用计算转化为图形计算,其程序编写较为繁琐,对程序员的专业知识要求较高。Com2puteUnifiedDeviceArchitecture(统一计算设备架构,简称CUDA)是NIVIDIA公司推出地一种GPGPU技术,它提供了类似C语言的GPGPU程序开发环境,编程较为简单,它能让多个GPU芯片同步协调的进行计算,使数据并行执行,速度可提升为传统CPU执行方式的几十甚至上百倍。

许多图像预处理操作都是对图像像素的重复性高密度运

收稿日期:2008211208; 修回日期:2008212210。

基金项目:“十一五”国防预研项目(70271029);国家863项目

(2007AA01Z314)。

算,+6理算法具有内在的并行性,控制较为简单,因此可以

利用GPGPU来突破CPU在浮点运算能力上的瓶颈,对于大规模的需要实时性的图像预处理工作,这种在图像处理操作执

行效率上的大幅度提高是非常必要的。本文利用CUDA技术,在GPGPU上实现了图像直方图均衡化和薄云去除的并行化处理,实验结果表明,该方法在图像预处理的执行效率上,比在CPU上有了很大的提高。

1 CUDA概述

CUDA计算加速的实质是将一个大问题拆分为多个小问

题,这多个小问题之间是相互独立的,再把这些小问题交给GPU做大量并行化处理,从而提高整体计算性能[8]。在使用CUDA组织程序时,GPU被看作一个可以并行执行大量线程的计算设备Device,它作为主控CPU或Host的协处理器执行运算。支持CUDA的硬件设备由一组相同结构的流多处理器

作者简介:宋晓丽(19832),女,黑龙江省嫩江县人,硕士研究生,主要从事图像处理,模式识别方向的研究。

王 庆(19692),男,教授,博士,主要从事图像处理、结构模式识别方向的研究。

图1 硬件模型

GPGPU高速处理

  1170  计算机测量与控制 第17

SM(Streammulti-processors)组成,如图1所示,每个流多处理器内部包含多个流单处理器SP(streamprocessor),各SM采用SIMD(SingleInstructionMutipleData)结构实现连

接,在每个时钟周期,每组SP执行相同的指令,但处理不同的数据[9-10]。

在CUDA程序中,线程Thread是实现数据并行操作的最小实体,数据并行处理的实质也就是各个线程的并行执行。在

CUDA中,由一定数量执行相同指令的线程所组成的集合被

由上图可以看出,在直方图的计算和灰度重新映射时,各像素之间没有依赖性,所以可进行并行化处理。其整体的数据流程如图3所示。即先将整幅图像进行分块,在所分的子块中,每个线程串行处理块内数据,计算子直方图,然后将每个线程的子直方图再归并起来。

定义为Block,所有完成相同功能的Block又组成一个Grid。但在Grid中,Block间相互不能进行数据共享和执行同步。一个Device上一次只能有一个Grid在执行,而一个Grid上的若干个Block可以并行执行,每个Block内的若干个Thread间可以实现数据共享和执行同步,我们可以根据需要来决定线程到底是并行执行还是串行执行,或是二者的综合[9,11]。

在CUDA中,根据内存类型的不同,也对线程的内存访问模式进行了划分,内存模式如表1所示[12],其中On-chip型的内存为高速内存,Off-chip型为低速内存。针对内存的这些特点,我们常用的编程模式就是将数据先分块,然后利用设备中的高速内存来完成计算,回低速内存,,;并行机制,入数据,并行处理;内存。

表1 内存模式

内存

LocalSharedGlobal

3位置

Off-chipOn-chipOff-chip

CachedNoN/A-NoYesYes

存取方式

Read/writeRead/writeRead/writeReadRead

访问对象

OneThreadAllThreadsinaBlockAllThreads+

HostAllThreads+HostAllThreads+Host

ConstantOff-chipTextureOff-chip

2 利用CUDA实现图像直方图均衡化处理

图像直方图是图像处理中一种十分重要的图像分析工具,它主要用在图像分割,图像灰度变换等处理过程中。直方图均衡化处理的中心思想是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布[13]。对256灰度级的图像进行的直方图灰度均衡化串行过程描述如图2所示。

3bmpWidth大小的灰度图像数据从主

CUDA数组中,因为texture内存的读取速度要优于global内存,所以再将CUDA数组与GPU中的texture内存进行绑定,再将与纹理绑定的数据拷贝到GPU的global内存上,使得并行运算的数据交换全部都在GPU上进行,从而加速了程序的执行效率。根据直方图计算的特点及CUDA的编程机制限定,我们设定每个线程块block中有32个线程,每个线程处理256个数据,每个线程的子直方图有256级,则图像共被分成N1=(bmpHeight3bmpWidth)/(323256)个块,这N1个块中的线程并行执行,我们利用shared内存来计算每个线程的子直方图。然后就要对每个块中各线程的子直方图进行归并操作,成为一个block的256级子直方图,当N1个块中的子直方图进行归并操作全部计算完后,就要对这N1个子直方图进行归并,形成整幅图像的直方图。此时设定每个块中有256个线程,每个线程处理N1/32个数据。由于此前配置是每个块中只有32个线程,为了合并时使用新的执行配置即一个块中256个线程,所以我们先要将N1个子直方图归并到32(N2)个块中去。然后用0号block的256个线程来完成对32个子直方图的归并,同样这个 …… 此处隐藏:5370字,全部文档内容请下载后查看。喜欢就下载吧 ……

基于GPGPU的数字图像并行化预处理.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wendang/1484050.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)