Introduction To OpenCL Application Development(1)-白红宇

Introduction To OpenCL Application Development(1)

阅读量：224 次

发布时间：2019-02-28

本文共 1521 字，大约阅读时间需要 5 分钟。

OpenCL，全称Open Computing Language（开放计算语言），由非盈利技术联盟Khronos Group管理，是一种面向异构计算架构的编程框架。它能够充分利用CPU、DSP、FPGA以及GPU等多种硬件的计算能力，支持多层次并行编程，在同构或异构体系结构上实现高效的计算。

OpenCL规范主要包含四个模块：平台模型、执行模型、内存模型以及编程模型。

平台模型描述了宿主机和设备的抽象架构。一个平台由宿主机和一或多个设备组成，每个设备可以划分为多个计算单元（Compute Units，CU），而每个CU又可以进一步划分为多个处理元素（Processing Elements，PE）。设备上的计算任务最终映射到每个PE上执行。

在平台模型中，编程人员需要关注三个版本号：

平台版本号：表示平台支持的运行时功能，包括与宿主机交互的所有API（如上下文、内存对象、设备、命令队列等）。

设备版本号：表示设备的计算能力，可通过clGetDeviceInfo函数获取，通常包含资源限制和扩展功能等信息。

OpenCL支持版本号：表示设备最高支持的OpenCL语言版本。

OpenCL的执行模型主要定义了Kernel程序在宿主机和设备之间的执行流程。Kernel程序由宿主机编译并提交到设备执行，而宿主机程序则定义Kernel执行的上下文并控制其运行。

在执行模型中，以下两个概念至关重要：

Work-item（工作项）：Kernel在设备上执行的单次实例，具有唯一的索引值，用于区分不同工作项。

Work-group（工作组）：多个Work-item组成一个Work-group，Work-group内的Work-item具有唯一的Local ID。如果有多个Work-group，则Local ID不唯一。

NDRange（N维索引空间）：定义了多维度的工作空间，Work-item的Global ID、Local ID和Work-group ID均为N维数组。每个维度的工作空间必须是整数倍于Work-group的大小。

上下文（context）是OpenCL中定义的抽象容器，负责协调宿主机与设备之间的交互，管理设备上的内存对象、Kernel以及程序资源。上下文中的资源包括设备、Kernel程序、程序对象和内存对象。

创建上下文的API为clCreateContext()，命令队列的创建和管理由clCreateCommandQueue()完成。上下文中的设备信息可以通过clGetDeviceInfo()函数获取。

在OpenCL中，内存对象用于将宿主机内存映射到设备上，实现数据传输。OpenCL定义了两种内存对象：buffer和image。buffer类似于C语言中的数组，直接映射到宿主机内存；image则作为不透明的对象用于数据填充和性能优化。

创建buffer内存对象的API为clCreateBuffer()，数据传输可通过clEnqueueWriteBuffer和clEnqueueReadBuffer实现，支持阻塞和非阻塞模式。

OpenCL程序（program）是Kernel函数集合的抽象，负责将Kernel调度到设备运行。通过clCreateProgramWithSource()编译Kernel程序到cl_program对象，实现与运行时的委托。

通过对OpenCL规范的深入理解，本文为后续关于OpenCL应用程序编写提供了理论基础。下文将详细介绍如何利用OpenCL进行实际应用开发。

转载地址：http://dsnp.baihongyu.com/

你可能感兴趣的文章