Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2628373
  • 博文数量: 333
  • 博客积分: 4817
  • 博客等级: 上校
  • 技术积分: 4413
  • 用 户 组: 普通用户
  • 注册时间: 2011-02-28 10:51
文章分类

全部博文(333)

文章存档

2017年(20)

2016年(57)

2015年(27)

2014年(20)

2013年(21)

2012年(164)

2011年(24)

分类: 高性能计算

2015-01-15 14:44:27

方法1:
cudaEvent_t start1;
cudaEventCreate(&start1);
cudaEvent_t stop1;
cudaEventCreate(&stop1);
cudaEventRecord(start1, NULL);
需要测时间的内核函数kernel;
cudaEventRecord(stop1, NULL);
cudaEventSynchronize(stop1);
float msecTotal1 = 0.0f;
cudaEventElapsedTime(&msecTotal1, start1, stop1);

方法2:
StopWatchInterface * timer_cublas;
sdkCreateTimer(&timer_cublas);
sdkStartTimer(&timer_cublas);
需要测时间的内核函数kernel;

sdkStopTimer(&timer_cublas);
cudaThreadSynchronize();
double dSeconds = sdkGetTimerValue(&timer_cublas)/((double)nIter);
阅读(5287) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~