2013年(2)
分类: 高性能计算
2013-02-20 10:52:33
1、PTX指令系统支持32位到64的MAD指令,每个SM(192个cores)每个周期可以支持32个MAD操作,K10的主频大约为1.5GHZ,2个GK104S,2×1536个Cores,2×8=16 SMs
因此,每个周期可以完成的MAD指令数为16×32,每秒钟可以完成的MAD指令数为16×32×1.5GZ=768G
2、PXT3.1支持Funnel Shift,通过这个指令可以在一个周期内实现循环移位。但是需要SM3.5的支持,K10和680是否支持还不得而知。