码迷,mamicode.com
首页 >  
搜索关键字:professional cuda c    ( 1984个结果
CUDA 程序运行时 CPU 100%的一个解决方法
CUDA 程序运行时CPU 100%的问题有点让人头痛,在实验过程中调用了kernel函数后,再调用cudaMemcpyAsync,但发现在还有会到block在这个所谓的async api,strace 跟了一下,发现99.999%都是 clock_gettime(CLOCK_MONOTONIC_RAW, {2461, 485666623}) = 0 于是实然有了一个灵感,为什么我不写一个...
分类:其他好文   时间:2015-01-12 19:23:50    阅读次数:276
CUDA系列学习(二)CUDA memory & variables
(一)、CPU Memory 结构CPU提速主要依靠局部性原理,即时间局部性和空间局部性。我们先看一下CPU的内存结构:Data Access先复习一下数据在这几级存储中的传输。作为数据transfer的基本单位,cache line的典型大小为8*8(8个变量,每个8bytes)=64bytes. 当一个cache想要load数据到寄存器时,检查cache中的line,如果hit了就get到数据...
分类:其他好文   时间:2015-01-12 00:27:23    阅读次数:443
求职英语_1
(一) job fair, hunt for, technic support,involve in,vacancy,professional(n,adj),deadline,in other words (二) counsel(nv),Railway Station, net(和Internet相...
分类:其他好文   时间:2015-01-10 12:33:34    阅读次数:204
makefile全面总结
makefile很重要       什么是makefile?或许很多Winodws的程序员都不知道这个东西,因为那些Windows的IDE都为你做了这个工作,但我觉得要作一个好的和professional的程序员,makefile还是要懂。这就好像现在有这么多的HTML的编辑器,但如果你想成为一个专业人士,你还是要了解HTML的标识的含义。特别在Unix下的软件编译,你就不能不自己写make...
分类:其他好文   时间:2015-01-09 14:19:47    阅读次数:147
CUDA系列学习(一)An Introduction to GPU and CUDA
本文从软硬件层面讲一下CUDA的结构,应用,逻辑和接口。分为以下章节: (一)、GPU与CPU (二)、CUDA硬件层面 (三)、CUDA安装 (四)、CUDA 结构与接口 4.1 Kernels 4.2 Thread,Block, Grid 4.3 Memory 4.4 Execution (五)、码HelloWorld——数组求和...
分类:其他好文   时间:2015-01-09 10:50:23    阅读次数:155
如何在LabVIEW中使用Modbus通信
主要软件: 主要软件版本: 2010 主要软件修正版本: N/A 次要软件: LabVIEW Development Systems>>LabVIEW Professional Development System 问题: (1)    什么是Modbus通信协议? (2)    在LabVIEW中需要安装什么软件可以进...
分类:数据库   时间:2015-01-08 15:19:39    阅读次数:225
windows linux 双系统引导修复
文件位置/boot/grub/menu.lst? 加入 title??Microsoft?Windows?XP?Professional root??(hd0,0) savedefault makeactive chainloader?+1 linux?的grub是一个非常好的引导程序,它可以引导多操作系统。...
分类:Windows程序   时间:2015-01-07 13:21:06    阅读次数:266
Lexia3 Citroen/Peugeot Diagnostic tool install instruction
We knew that Lexia-3 is a professional Citroen and Peugeot diagnostic interface, it’s both easy-using and powerful function. Many customers buy this d...
分类:其他好文   时间:2015-01-06 17:42:56    阅读次数:113
卷积神经网络的并行化模型——One weird trick for parallelizing convolutional neural networks
前段时间一直在关注 CNN 的实现,查看了 caffe 的代码以及 convnet2 的代码。目前对单机多卡的内容比较感兴趣,因此特别关注 convnet2 关于 multi-GPU 的支持。 其中 cuda-convnet2 的项目地址发布在:Google Code:cuda-convnet2 关于 multi-GPU 的一篇比较重要的论文就是:One weird trick for parallelizing convolutional neural networks 本文也将针对这篇文章给出分析。...
分类:Web程序   时间:2015-01-06 11:54:57    阅读次数:234
GacLib使用方法(一)
GacLib使用方法这是vczh大神的GacLib库新手入门,为自己做点笔记,详细的信息可以参考网页。下面简单说说怎么在自己的程序中使用GacLib库,本文只是前述网址中新手教程的一点体验,使用的环境是64位windows7专业版和visual studio 2013 professional。St...
分类:其他好文   时间:2015-01-05 14:46:29    阅读次数:532
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!