码迷,mamicode.com
首页 >  
搜索关键字:professional cuda c    ( 1984个结果
CUDA学习日志:常量内存和纹理内存
在上一篇博文中,我们谈到了如何利用共享内存来实现线程协作的问题。本篇博文我们主要来谈谈如何利用常量内存和纹理内存来提高程序性能。 Jeremy Lin 常量内存 所谓的常量内存,从它的名字我们就可以知道,它是用来保存在核函数执行期间不会发生变化的数据。NVIDIA硬件提供了64KB的常量内存,并且常量内存采用了不同于标准全局内存的处理方式。在某些情况下,用常量内存来替换全局内存可以有效地减少内存带宽。 常量内存的声明方式与共享内存是类似的。要使用常量内存,则需要在变量前面加上 __constant__修饰符...
分类:其他好文   时间:2014-11-29 23:08:00    阅读次数:541
卷积神经网络
自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-convnet2。为了增进CNN的理解和使用,特写此博文,以其与人交流,互有增益。正文之前,先说几点自己对于CNN的感触。先明确一点就是,Deep Learning是全部深度学习算法的总称,CNN是深度学习算法在图像处理领域的一个应用。 第一点,在学习Deep learning和CNN之前,总以为它们是很了不得的知识,总以为它们...
分类:其他好文   时间:2014-11-29 17:37:54    阅读次数:249
JavaScript示例九(JSON序列化)
JSON序列化示例 var book={ title:"Professional JavaScript", authors:["Nicholas C. Zakas","Other"], edition:3, year:2011, //* toJSON:function(){ return this; } //*/ };...
分类:编程语言   时间:2014-11-29 16:02:33    阅读次数:105
CUDA编程学习(三)
我们知道一个grid包含多个block,而一个block又包含多个thread,下面将是如何进行下thread中的并行。/**** Splot a block into parallel threads****/_global_ void add(int *a, int *b, int *c){ ....
分类:其他好文   时间:2014-11-29 13:11:58    阅读次数:203
CUDA编程学习(四)
利用Block和Thread进行并行加速_global_ void add(int *a, int *b, int *c){ int index = threadIdx.x + blockIdx.x * blockDim.x; c[index] = a[index] + b[index]...
分类:其他好文   时间:2014-11-29 13:10:33    阅读次数:192
CUDA编程学习(二)
将数据加载到GPU后,如何在grid下的block进行并行计算(一个grid包含多个block)/****How do we run code in parallel on the device****/ /****Use block****/ _global_ void add(int...
分类:其他好文   时间:2014-11-29 11:44:48    阅读次数:156
CUDA编程学习(一)
/****c code****/#includeint main(){ printf("Hello world!\n); return 0;}/****CUDA code****/_global_ void mykernel(void){}int main(){ mykernel>...
分类:其他好文   时间:2014-11-29 11:39:15    阅读次数:219
通过JDBC连接取得数据库相关的元数据
今天突然想起之前从astah-professional专门画ER图的工具 的一个Sample中取得Java代码,相当棒的一段代码,只需要通过JDBC连接就可以得到数据库信息,主要是通过 java.sql.DatabaseMetaData 这个类实现。先记录...
分类:数据库   时间:2014-11-27 18:59:09    阅读次数:271
CUDA学习日志:线程协作与例程
在上篇博文中,我们已经用CUDA C编写了一个程序,知道了如何编写在GPU上并行执行的代码。但是对于并行编程来说,最重要的一个方面就是,并行执行的各个部分如何通过相互协作来解决问题。只有在极少数情况下,各个处理器才不需要了解其他处理器的执行状态而彼此独立地计算出结果。即使对于一些成熟的算法,也仍然需要在代码的各个并行副本之间进行通信和协作。因此,下面我们来讲讲不同线程之间的通信机制和并行执行线程的同步机制。 首先,我们来看一个线程块的网格示意图:...
分类:编程语言   时间:2014-11-25 18:37:56    阅读次数:271
交互设计资源
1.苹果ios界面设计库  http://pttrns.com/  2.交互设计网站 digital web:The web professional's online magazine of choice.  http://www.digital-web.com/  3.Signal vs. Noise:37 signal的官方blog  http://37signals.com/sv...
分类:其他好文   时间:2014-11-24 19:17:07    阅读次数:163
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!