大家做高性能计算的朋友,想必对CPU的执行模式已经非常熟悉了吧。当代高级些的CPU一般采用超标量流水线,使得毗邻几条相互独立的指令能够并行执行——这称为指令集并行(ILP,Instruction-Level Parallelism);而像x86引入的SSE(Streaming SIMD Extens...
分类:
其他好文 时间:
2015-01-16 18:55:43
阅读次数:
178
并行方向需要学习的数学知识http://dev.gameres.com/Program/Visual/3D/GPGPU_math_Tutorial.html
分类:
其他好文 时间:
2015-01-04 16:42:53
阅读次数:
136
虽然实时GI技术已经趋于成熟了,但出于对不同平台的性能和质量的考虑, 更倾向搭配一些预计算的渲染技术来实现,如给静态物体提供GI的LightMap, 给动态物体提供GI的Irradiance Volume ,以及给增加GI的Specualar细节的IBL等等。特别是对应移动平台而言。 为了提高预计算...
分类:
其他好文 时间:
2014-12-23 10:15:07
阅读次数:
146
http://blog.csdn.net/augusdi/article/details/12833235
CUDA从入门到精通(零):写在前面
在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这...
分类:
其他好文 时间:
2014-10-26 10:23:59
阅读次数:
357
http://www.cse.ust.hk/gpuqp/Mars.htmlhttp://www.cse.ust.hk/gpuqp/
分类:
移动开发 时间:
2014-07-07 22:34:47
阅读次数:
221
转载自:http://hc.csdn.net/contents/content_details?type=1&id=3411.展开循环如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。
1 #include 2 using namesp...
分类:
其他好文 时间:
2014-05-23 23:56:27
阅读次数:
556