某些并行计算需要面临某些在计算进行前的某些单通瓶颈点,这种情况下,当然可以使用信号量的方式来进行处理,但是还存在着另外的一种处理方式是更加方便的,它就是:栅栏(在pthread库里面被定义成为类型 pthread_barrier_t),下面我们来看一段程序作为示例
#define _XOPEN_SOURCE 600
#include <pthread.h> #include <stdlib,h> #include <stdio.h>
#define ROWS 10000 #define COLS 10000 #define THREADS 10
double initial_matrix[ROWS][COLS]; double final_matrix[ROWS][COLS];
//Barrier variable
pthread_barrier_t barr
extern void DotProduct(int row, int col, double source[ROWS][COLS], double destination[ROWS][COLS]); extern void determinant(double matrix[ROWS][COLS]);
void * entry_point(void * arg) { int rank = (int)arg; int row; for(row=rank*ROWS/THREADS; row < (rank+1)*THREADS;++row) for(int col=0;col<COLS;++col) DotProduct(row,col,initial_matrix,final_matrix);
//synchronization pointer
int rc = pthread_barrier_wait(&barr); if(rc!=0 && rc != PTHREAD_BARRIER_SERIAL_THREAD) { printf("Could not wait on barrier\n"); exit(-1); }
for(row=rank*ROWS/THREADS; row < (rank+1)*THREADS;++row) for(int col=0;col<COLS;++col) DotProduct(row,col,final_matrix,initial_matrix); }
int main(int argc, char* argv[]) { int i; pthread_t thr[THREADS];
//Barrier initialization
if(pthread_barrierattr_init(&barr,NULL,THREADS)) { printf("Could not create a barrier\n"); return -1; }
for(i=0;i<THREADS;++i) { if(pthread_create(&thr[i],NULL,&entry_point, (void*)i)) { printf("Could not create thread %d\n", i); return -1; } }
for(i=0;i<THREADS;++i) { if(pthread_join(thr[i],NULL)) { printf("Could not join thread %d\n", i); return -1; } }
double det = determinant(initial_matrix); printf("The determinant of M^4 = %f\n", det);
return 0; }
|
这段程序产生出许多个线程,并且分配给每个线程计算矩阵乘法的一部分,然后每个线程使用这次计算的结果,继续进行下一步的计算:另一个矩阵的乘法
几点关于API的说明:
- barrier 变量必须在最开始声名为全局变量
- barrier 变量的初始化必须在main函数里进行初始化
- 在点上每一个线程都会等待它的对端完成工作
注意
在程序顶部的宏定义 _XOPEN_SOURCE 是非常重要的;如果没有这个变量,那么barrier类型就会在pthread.h中被屏蔽掉,这个定义必须在所有的头文件引用之前被定义出来
阅读(2261) | 评论(0) | 转发(0) |