2016-02-08から1日間の記事一覧

【CUDA】Warp shuffleの__shfl()サンプル

warp shuffleは,kepler世代のcc3.x以上から使える, shared memoryを用いずに,warp内のthread間で値を交換することができる機能です.GPGPUでは,shared memoryをいじるのが当然なのですが,それをせずにさらに高速化することができるということで,使える…