硕士学位论文
蛋白质翻译后修饰鉴定MS-Alignment的GPU加速研究与实现摘 要 蛋白质翻译后修饰在生命体中具有重要的作用,有效探明蛋白质翻译后修饰是目前蛋白质组学研究的一个重要内容。蛋白质翻译后修饰鉴定MS-Alignment算法是基于串联质谱的数据库搜索方法,其优点在于盲搜索,即对搜索的翻译后修饰类型没有限制,但其缺点是鉴定速度较慢,很难满足大规模数据对鉴定时间的要求。
本文采用图形处理器(GPU)加速优化MS-Alignment算法,以期缩短鉴定时间,满足大规模数据对鉴定时间的要求,主要工作包括以下两个方面:
(1) 结合MS-Alignment算法的特点,基于CUDA(Compute Unified Device Architecture,统一计算设备架构)编程模型,设计并实现了耗时最多的“数据库检索及候选肽段生成”部分在单GPU上的算法DCGPU。DCGPU采用划分蛋白质序列的细粒度数据并行,首先将蛋白质序列从主机存储器传输至设备存储器,然后调用内核函数计算候选肽段与实验质谱的匹配分数,最后将结果从设备存储器传输至主机存储器,并在算法实现过程中采用多种优化方法。测试结果表明,DCGPU在最多有1个翻译后修饰模块中加速比为26倍左右,在最多有2个翻译后修饰模块中加速比为41倍左右。
(2) 在DCGPU的基础上,基于MPI编程模型,设计并实现了MS-Alignment在GPU集群上的加速算法MCUDA_MS-A。采用CPU和GPU异构并行计算,在CPU端采用主从模式:主进程分发和收集数据,从进程使用GPU计算。基于目前的测试结果,可以预测MCUDA_MS-A在GPU集群上可将大规模质谱鉴定时间从4.5月左右减少到1小时左右。
使用GPU加速MS-Alignment算法,可以满足蛋白质翻译后修饰鉴定中大规模数据的快速计算需求,还可以将GPU并行计算的思想和本文的优化技巧应用到基于串联质谱技术的计算蛋白质组学的其他研究方面。
关键词:蛋白质翻译后修饰鉴定,MS-Alignment,统一计算设备架构,图形处理器,GPU集群
Keywords: identification of post-translational modifications, MS-Alignment, Compute Unified Device Architecture (CUDA), Graphics Processing Units (GPU), GPU Cluster
引用声明:您的任何转载或引述请作出适当、准确的原始注明,请勿作于商业用途。
![](/fileicon/pdf.gif) |
文件: | 翟艳堂_MS-Alignment_CUDA_正文.pdf |
大小: | 1043KB |
下载: | 下载 |
|
阅读(684) | 评论(0) | 转发(0) |