opencl 学习-iibull-ChinaUnix博客

牛蹄印章_VX_iibull

首页　| 　博文目录　| 　关于我

iibull

博客访问： 9673401
博文数量： 1778
博客积分： 12961
博客等级：上将
技术积分： 20371
用户组：普通用户
注册时间： 2009-01-09 11:25

个人简介

偷得浮生半桶水(半日闲), 好记性不如抄下来(烂笔头). 信息爆炸的时代, 学习是一项持续的工作.

文章分类

全部博文（1778）

TX2-NX（83）
OpenHarmony（26）
debug（374）
Python3.x（19）
AI-DeepLearning（7）
VR/AR/MR（5）
Cuda（6）
机器人（355）
GTK3 + （35）
android4.x代码分（35）
linux设备驱动第（39）
原创（50）

ER69XX项目归纳（5）
ARMLINUX技术文摘（42）

驱动（18）
Porting（73）

Delphi（12）

dotNet（13）

Meego（4）

Kernel（25）

U-BOOT（7）
代码分析（6）
移植（13）
sysfs 全接触（1）
skyeye（1）
音视频（2）
android（33）

Oracle（15）
wince（10）
linux 驱动（18）
前沿文摘（24）
GTK（11）
杂项（18）

工作（6）
日志（16）
娱乐（28）
linux 系统（46）
linux 应用（56）
armlinux（79）
未分配的博文（267）

文章存档

2025年（27）

2024年（27）

2023年（26）

2022年（112）

2021年（217）

2020年（157）

2019年（192）

2018年（81）

2017年（78）

2016年（70）

2015年（52）

2014年（40）

2013年（51）

2012年（85）

2011年（45）

2010年（231）

2009年（287）

我的朋友

相关博文

opencl 学习

分类： Android平台

2015-08-04 20:12:48

/>
OpenCL程序分成成两部分：一部分是在设备上执行的（例如GPU），另一部分是在主机上运行的。在设备上执行的程序就是实现“异构”和“并行计算”的部分。为了能在设备上执行代码，程序员需要写一个特殊的函数（kernel函数）。这个函数需要使用OpenCL语言编写。OpenCL语言采用了C语言的一部分加上一些约束、关键字和数据类型。在主机上运行的程序用OpenCL的API管理设备上运行的程序。主机程序的API用C语言编写，也有C++、Java、Python等高级语言接口。

/*
gcc main.c -lOpenCL
*/
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <iostream>
#include <CL/cl.h>
using namespace std;
void check_result(const int *buf, const int len) {
int i;
for (i = 0; i < len; i++) {
if (buf[i] != (i + 1) * 2) {
cout << "Result error!" << endl;
break;
}
}
if (i == len)
cout << "Result ok." << endl;
}
void init_buf(int *buf, int len) {
int i;
for (i = 0; i < len; i++) {
buf[i] = i + 1;
}
}
int main(void) {
cl_int ret;
/** step 1: get platform */
cl_uint num_platforms;
ret = clGetPlatformIDs(0, NULL, &num_platforms);
// get platform number
if ((CL_SUCCESS != ret) || (num_platforms < 1)) {
cout << "Error getting platform number: " << ret << endl;
return 0;
}
cl_platform_id platform_id = NULL;
ret = clGetPlatformIDs(1, &platform_id, NULL);
// get first platform id
if (CL_SUCCESS != ret) {
cout << "Error getting platform id: " << ret << endl;
return 0;
}
/** step 2: get device */
cl_uint num_devices;
clGetDeviceIDs(platform_id, CL_DEVICE_TYPE_GPU, 0, NULL, &num_devices);
if ((CL_SUCCESS != ret) || (num_devices < 1)) {
cout << "Error getting GPU device number: " << ret << endl;
return 0;
}
cl_device_id device_id = NULL;
clGetDeviceIDs(platform_id, CL_DEVICE_TYPE_GPU, 1, &device_id, NULL);
if (CL_SUCCESS != ret) {
cout << "Error getting GPU device id: " << ret << endl;
return 0;
}
/** step 3: create context */
cl_context_properties props[] = { CL_CONTEXT_PLATFORM, (cl_context_properties)platform_id, 0 };
cl_context context = NULL;
context = clCreateContext(props, 1, &device_id, NULL, NULL, &ret);
if ((CL_SUCCESS != ret) || (NULL == context)) {
cout << "Error creating context: " << ret << endl;
return 0;
}
/** step 4: create command queue */
cl_command_queue command_queue = NULL;
command_queue = clCreateCommandQueue(context, device_id, 0, &ret);
if ((CL_SUCCESS != ret) || (NULL == command_queue)) {
cout << "Error creating command queue: " << ret << endl;
return 0;
}
/** step 5: create memory object */
cl_mem mem_obj = NULL;
int *host_buffer = NULL;
const int ARRAY_SIZE = 1000;
const int BUF_SIZE = ARRAY_SIZE * sizeof(int);
// create and init host buffer
host_buffer = (int *)malloc(BUF_SIZE);
init_buf(host_buffer, ARRAY_SIZE);
// create opencl memory object using host ptr
mem_obj = clCreateBuffer(context, CL_MEM_READ_WRITE | CL_MEM_USE_HOST_PTR, BUF_SIZE, host_buffer, &ret);
if ((CL_SUCCESS != ret) || (NULL == mem_obj)) {
cout << "Error creating command queue: " << ret << endl;
return 0;
}
/** step 6: create program */
char *kernelSource =
"__kernel void test(__global int *pInOut)\n"
"{\n"
" int index = get_global_id(0);\n"
" pInOut[index] += pInOut[index];\n"
"}\n";
cl_program program = NULL;
// create program
program = clCreateProgramWithSource(context, 1, (const char**)&kernelSource, NULL, &ret);
if ((CL_SUCCESS != ret) || (NULL == program)) {
cout << "Error creating program: " << ret << endl;
return 0;
}
// build program
ret = clBuildProgram(program, 1, &device_id, NULL, NULL, NULL);
if (CL_SUCCESS != ret) {
cout << "Error building program: " << ret << endl;
return 0;
}
/** step 7: create kernel */
cl_kernel kernel = NULL;
kernel = clCreateKernel(program, "test", &ret);
if ((CL_SUCCESS != ret) || (NULL == kernel)) {
cout << "Error creating kernel: " << ret << endl;
return 0;
}
/** step 8: set kernel arguments */
ret = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void*)&mem_obj);
if (CL_SUCCESS != ret) {
cout << "Error setting kernel argument: " << ret << endl;
return 0;
}
/** step 9: set work group size */
cl_uint work_dim = 1; // in most opencl device, max dimition is 3
size_t global_work_size[] = { ARRAY_SIZE };
size_t *local_work_size = NULL; // let opencl device determine how to break work items into work groups
/** step 10: run kernel */
ret = clEnqueueNDRangeKernel(command_queue, kernel, work_dim, NULL, global_work_size, local_work_size, 0, NULL, NULL);
if (CL_SUCCESS != ret) {
cout << "Error enqueue NDRange: " << ret << endl;
return 0;
}
/** step 11: get result */
int *device_buffer = (int *)clEnqueueMapBuffer(command_queue, mem_obj, CL_TRUE, CL_MAP_READ | CL_MAP_WRITE, 0, BUF_SIZE, 0, NULL, NULL, &ret);
if ((CL_SUCCESS != ret) || (NULL == device_buffer)) {
cout << "Error map buffer: " << ret << endl;
return 0;
}
// check result
check_result(device_buffer, ARRAY_SIZE);
/** step 12: release all resources */
if (NULL != kernel) clReleaseKernel(kernel);
if (NULL != program) clReleaseProgram(program);
if (NULL != mem_obj) clReleaseMemObject(mem_obj);
if (NULL != command_queue) clReleaseCommandQueue(command_queue);
if (NULL != context) clReleaseContext(context);
if (NULL != host_buffer) free(host_buffer);
return 0;
}

阅读(2590) | 评论(0) | 转发(0) |

上一篇：C 中编程技巧

下一篇：树莓派烧写镜像

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6