码迷,mamicode.com
首页 >  
搜索关键字:gpu    ( 2258个结果
让Flash支持Stage3D
如要需要支持Stage3D,采用GPU来渲染,需要设置wmode="direct",在FB中,对于web和air设置方法不同:1.web:需要在web的html模板中,添加参数:var params = {}; params.wmode = "direct";2.air:需要在bin-dubeg.....
分类:其他好文   时间:2014-08-21 00:09:23    阅读次数:211
OpenCV GPU CUDA OpenCL 配置
首先,正确安装OpenCV,并且通过测试。我理解GPU的环境配置由3个主要步骤构成。1. 生成关联文件,即makefile或工程文件2. 编译生成与使用硬件相关的库文件,包括动态、静态库文件。3. 将生成的库文件加入到程序中,加入过程类似于OpenCV库的添加过程。详细操作参见:http://wen...
分类:其他好文   时间:2014-08-20 12:11:32    阅读次数:189
解读Unity中的CG编写Shader系列三
在上一个例子中,我们得到了由mesh组件传递的信息经过数学转换至合适的颜色区间以颜色的形式着色到物体上。这篇文章将要在此基础上研究片段的擦除(discarding fragments)和前面剪裁、后面剪裁(front face culling and back face culling)来达到透明效果。 当一个mesh组件的信息被传递后,我们可以通过代码决定哪些部分渲染(render)出来,而哪些部分不要,这个过程就像把那些不要的部分剔除了,我们看不到他,虽然他的mesh信息还在,但是我们的GPU不会去处理...
分类:其他好文   时间:2014-08-19 19:03:25    阅读次数:304
2014 8.19记录……
观摩了下传说中的的FFT(快速傅里叶)大致就是用递归,和非递归两种方法实现。赶脚fft算法比较适合在fpga里面跑个流水线。感觉应该比CPU&&dsp&&gpu强多了……用MATLAB验证计算结果。
分类:其他好文   时间:2014-08-19 12:39:45    阅读次数:128
【转】CUDA程序优化要点
CUDA程序优化应该考虑的点:精度:只在关键步骤使用双精度,其他部分仍然使用单精度浮点以获得指令吞吐量和精度的平衡; 目前GPU的单精度性能要远远超过双精度性能,整数乘法、求模、求余等运算的指令吞吐量也较为有限。在科学计算中,由于需要处理的数据量巨大,往往采用双精度或者四精度才能获得可靠的结果,目....
分类:其他好文   时间:2014-08-17 22:46:23    阅读次数:482
llvm 初探
gcc/g++ 如此成熟,本来以为可能下个20年我们还是用它,但最近看 llvm 似乎大有取代gcc 和 g++ 的架势 1)Apple 编程已经把 llvm 提供developer 使用  2)  开源 3D 架构,Mesa3D 可以使用 llvm 引擎 (当没有 GPU时, Mesa 解释 glsl并执行,速度慢,如果使用 LLVM JIT, 速度大大提升)  3)某些云平台,引...
分类:其他好文   时间:2014-08-17 17:03:42    阅读次数:246
六 GPU 并行优化的几种典型策略
前言 如何对现有的程序进行并行优化,是 GPU 并行编程技术最为关注的实际问题。本文将提供几种优化的思路,为程序并行优化指明道路方向。优化前准备 首先,要明确优化的目标 - 是要将程序提速 2 倍?还是 10 倍?100倍?也许你会不假思索的说当然是提升越高越好。 但这里存在一个优化成本的问题...
分类:其他好文   时间:2014-08-17 16:48:02    阅读次数:193
CUDA C编程入门-不同的grid和block大小对CUDA内建的变量的影响,以及如何确定Thread ID
测试环境 测试的GPU平台为GTX660M,计算能力为3.0首先介绍一下GPU提供的函数:int printf(const char *format[, arg, ...]); 从核函数格式化输出到主机,只支持计算能力在2.x及以上的设备。行为与标准的C相似。这里我们用于输出内建变量的值。核函...
分类:其他好文   时间:2014-08-17 01:03:01    阅读次数:606
CUDA C编程入门-硬件实现
NVIDIA GPU架构是建立在一个可扩展的多线程流处理器(SMs)阵列之上的。当一个在主机CPU的CUDA程序调用一个核函数时,网格的blocks分配给运行容量空闲的多核处理器计算。线程块的线程同时在多核处理器上执行,多个线程块能同时在一个多核处理器上执行。当线程块结束时,新的线程块会加载到空.....
分类:其他好文   时间:2014-08-12 03:02:33    阅读次数:234
四 GPU 并行编程的存储系统架构
前言 在用 CUDA 对 GPU 进行并行编程的过程中,除了需要对线程架构要有深刻的认识外,也需要对存储系统架构有深入的了解。 这两个部分是 GPU 编程中最为基础,也是最为重要的部分,需要花时间去理解吸收,加深内功。 了解 GPU 存储系统架构的意义 CUDA 编程架构的设计思路本身也就是让...
分类:其他好文   时间:2014-08-12 00:06:23    阅读次数:288
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!