《GPU高性能编程CUDA实战》中代码整理!...
分类:
其他好文 时间:
2015-05-24 20:28:32
阅读次数:
120
makefile很重要 什么是makefile?或许很多Winodws的程序员都不知道这个东西,因为那些Windows的IDE都为你做了这个工作,但我觉得要作一个好的和professional的程序员,makefile还是要懂。这就好像现在有这么多的HTML的编辑器,但如果你想成为一个专业人士,.....
分类:
其他好文 时间:
2015-05-22 15:04:20
阅读次数:
123
Share memory是片上资源,生命周期是整个block中,它的数据读写十分快,有1个cycle latency。在Share memory中,经常存在bank conflict问题,如果没有bank conflict问题,它的数据读写可以和片上的寄存器(Register)一样快。因此,我们需要尽量减少bank conflicts....
分类:
其他好文 时间:
2015-05-21 09:07:59
阅读次数:
222
多高斯背景差分,非常吃cpu,特别是多路视屏,所以想用gpu做检测 后面的跟踪一系列的规则判断用cpuopencv+cuda+stl做了个测试代码:// MTTestCudaMog.cpp : Defines the entry point for the console application./...
分类:
其他好文 时间:
2015-05-19 18:26:56
阅读次数:
214
我是这么理解的; (object.getName = object.getName),这条语句在执行结束后,返回的是右操作数object.getName; 但是关键是这个右操作数现在放在哪里 ? 我猜想因为这条语句是在全局中执行的,所以在全局中会有一个临时的变量,不妨命名为temp; 且temp =...
分类:
编程语言 时间:
2015-05-17 10:38:01
阅读次数:
127
然后第二段代码执行过程中,有1个globalvariabeobject,1个createFunctionactivationobject,10个anonymousfunction1activationobject,10个anonymousfunction2activationobject,并且这10...
分类:
编程语言 时间:
2015-05-17 10:37:44
阅读次数:
118
使用VS2013编译CUDA程序时,可能会遇到以下问题:1、errorMSB3721:"D:\ProgramFiles\NVIDIAGPUComputing\Toolkit\CUDA\v7.0\bin\nvcc.exe"-gencode=arch=compute_52,code=\"sm_52,co...
分类:
其他好文 时间:
2015-05-16 23:12:45
阅读次数:
336
GPU的硬件结构,也不是具体的硬件结构,就是与CUDA相关的几个概念:thread,block,grid,warp,sp,sm。 sp: 最基本的处理单元,streaming processor 最后具体的指令和任务都是在sp上处理的。GPU进行并行计算,也就是很多个sp同时做处理 sm:多个sp加...
分类:
其他好文 时间:
2015-05-16 20:32:54
阅读次数:
291
下面简单介绍一些cuda中的共享存储器和全局存储器 共享存储器,shared memory,可以被同一块中的所有线程访问的可读写存储器,生存期是块的生命期。 Tesla的每个SM拥有16KB共享存储器。 在编程过程中,有静态的shared memory 动态的shared memory 静态的sha...
分类:
其他好文 时间:
2015-05-16 20:24:45
阅读次数:
112
CUDA基本使用方法 在介绍OpenCV中GPU模块使用之前,先回顾下CUDA的一般使用方法,其基本步骤如下: 1.主机代码执行;2.传输数据到GPU;3.确定grid,block大小; 4.调用内核函数,GPU运行程序;5.传输结果到CPU;6.继续主机代码执行。 下图是两个向量相加的简单示例程序...
分类:
其他好文 时间:
2015-05-16 20:23:10
阅读次数:
122