Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2097102
  • 博文数量: 414
  • 博客积分: 10312
  • 博客等级: 上将
  • 技术积分: 4921
  • 用 户 组: 普通用户
  • 注册时间: 2007-10-31 01:49
文章分类

全部博文(414)

文章存档

2011年(1)

2010年(29)

2009年(82)

2008年(301)

2007年(1)

分类: C/C++

2010-10-02 16:53:27

某些并行计算需要面临某些在计算进行前的某些单通瓶颈点,这种情况下,当然可以使用信号量的方式来进行处理,但是还存在着另外的一种处理方式是更加方便的,它就是:栅栏(在pthread库里面被定义成为类型 pthread_barrier_t),下面我们来看一段程序作为示例

#define _XOPEN_SOURCE 600

#include <pthread.h>
#include <stdlib,h>
#include <stdio.h>

#define ROWS        10000
#define COLS        10000
#define THREADS        10

double initial_matrix[ROWS][COLS];
double final_matrix[ROWS][COLS];

//Barrier variable

pthread_barrier_t barr

extern void DotProduct(int row, int col, double source[ROWS][COLS], double destination[ROWS][COLS]);
extern void determinant(double matrix[ROWS][COLS]);

void * entry_point(void * arg)
{
    int rank = (int)arg;
    int row;
    for(row=rank*ROWS/THREADS; row < (rank+1)*THREADS;++row)
        for(int col=0;col<COLS;++col)
            DotProduct(row,col,initial_matrix,final_matrix);

    //synchronization pointer

    int rc = pthread_barrier_wait(&barr);
    if(rc!=0 && rc != PTHREAD_BARRIER_SERIAL_THREAD)
    {        
        printf("Could not wait on barrier\n");
        exit(-1);
    }

    for(row=rank*ROWS/THREADS; row < (rank+1)*THREADS;++row)
        for(int col=0;col<COLS;++col)
            DotProduct(row,col,final_matrix,initial_matrix);
}

int main(int argc, char* argv[])
{
    int i;
    pthread_t thr[THREADS];

    //Barrier initialization

    if(pthread_barrierattr_init(&barr,NULL,THREADS))
    {
        
        printf("Could not create a barrier\n");
        return -1;
    }

    for(i=0;i<THREADS;++i)
    {
        if(pthread_create(&thr[i],NULL,&entry_point, (void*)i))
        {
            
            printf("Could not create thread %d\n", i);
            return -1;
        }
    }

    for(i=0;i<THREADS;++i)
    {
        if(pthread_join(thr[i],NULL))
        {
            
            printf("Could not join thread %d\n", i);
            return -1;
        }
    }

    double det = determinant(initial_matrix);
    printf("The determinant of M^4 = %f\n", det);

    return 0;
        
}
 

这段程序产生出许多个线程,并且分配给每个线程计算矩阵乘法的一部分,然后每个线程使用这次计算的结果,继续进行下一步的计算:另一个矩阵的乘法

几点关于API的说明:

  1. barrier 变量必须在最开始声名为全局变量
  2. barrier 变量的初始化必须在main函数里进行初始化
  3. 在点上每一个线程都会等待它的对端完成工作
注意

在程序顶部的宏定义 _XOPEN_SOURCE 是非常重要的;如果没有这个变量,那么barrier类型就会在pthread.h中被屏蔽掉,这个定义必须在所有的头文件引用之前被定义出来

阅读(2269) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~