码迷,mamicode.com
首页 >  
搜索关键字:professional cuda c    ( 1984个结果
向上取整
(a+(b-1))/b34 / 11 + (34 % 11 != 0 ? 1 : 0)CUDA计算中,可以采用这两种方式来表示向上取整。
分类:其他好文   时间:2014-09-21 23:15:11    阅读次数:243
《GPU高性能编程CUDA实战中文》中第四章的julia实验
在整个过程中出现了各种问题,我先将我调试好的真个项目打包,提供下载。 1 /* 2 * Copyright 1993-2010 NVIDIA Corporation. All rights reserved. 3 * 4 * NVIDIA Corporation and its licensors....
分类:其他好文   时间:2014-09-21 21:13:51    阅读次数:417
Open SSL 开发环境配置
Open SSL 开发环境配置 最后更新日期:2014-05-13 阅读前提:VisualStudio的基本使用、Cent OS的基本使用 环境: Windows 8.1 64bit英文版,Visual Studio 2013 Professional Update1英文版,ActivePerl 5.16.3,openssl-1.0.1g,Cent OS 6.5 (32位),openssl-...
分类:其他好文   时间:2014-09-20 18:42:25    阅读次数:358
CUDA:Supercomputing for the Masses (用于大量数据的超级计算)-第十节
原文链接第十节:CUDPP, 强大的数据平行CUDA库Rob Farber 是西北太平洋国家实验室(Pacific Northwest National Laboratory)的高级科研人员。他在多个国家级的实验室进行大型并行运算的研究,并且是几个新创企业的合伙人。大家可以发邮件到rmfarber@...
分类:其他好文   时间:2014-09-19 18:52:15    阅读次数:293
CUDA:Supercomputing for the Masses (用于大量数据的超级计算)-第九节
原文链接第九节:使用CUDA拓展高等级语言Rob Farber 是西北太平洋国家实验室(Pacific Northwest National Laboratory)的高级科研人员。他在多个国家级的实验室进行大型并行运算的研究,并且是几个新创企业的合伙人。大家可以发邮件到rmfarber@gmail....
分类:其他好文   时间:2014-09-19 17:26:06    阅读次数:323
CUDA:Supercomputing for the Masses (用于大量数据的超级计算)-第七节
第七节:使用下一代CUDA硬件,快乐加速度原文链接Rob Farber 是西北太平洋国家实验室(Pacific Northwest National Laboratory)的高级科研人员。他在多个国家级的实验室进行大型并行运算的研究,并且是几个新创企业的合伙人。大家可以发邮件到rmfarber@gm...
分类:其他好文   时间:2014-09-19 17:03:25    阅读次数:236
CUDA:Supercomputing for the Masses (用于大量数据的超级计算)-第六节
原文链接第六节:全局内存和CUDA RPOFILERRob Farber 是西北太平洋国家实验室(Pacific Northwest National Laboratory)的高级科研人员。他在多个国家级的实验室进行大型并行运算的研究,并且是几个新创企业的合伙人。大家可以发邮件到rmfarber@g...
分类:其他好文   时间:2014-09-19 13:40:05    阅读次数:303
数组逆序=全局内存版 VS 共享内存版
全局内存版 1 #include 2 #include 3 #include "cuda.h" 4 #include "cuda_runtime.h" 5 #include "device_launch_parameters.h" 6 //检查CUDA运行时是否有错误 7 void checkC.....
分类:其他好文   时间:2014-09-19 13:35:25    阅读次数:247
CUDA编程->CUDA入门了解(一)
安装好CUDA6.5+VS2012,操作系统为Win8.1版本,首先下个GPU-Z检测了一下:             看出本显卡属于中低端配置,关键看两个:      Shaders=384,也称作SM,或者说core/流处理器数量,数量越大,执行并行线程越多,单位时间计算量也就越大。      BusWidth=64Bit,这个越大,数据的处理速度也就越快      接下来看...
分类:其他好文   时间:2014-09-18 22:22:20    阅读次数:420
CUDA实现数组倒序
数组倒序,将在主机上初始化的数组传输到设备上,然后用CUDA并行倒序,此时在全局内存上操作,再将结果返回到主机并验证。 1 #include 2 #include 3 #include "cuda.h" 4 #include "cuda_runtime.h" 5 #include "device.....
分类:其他好文   时间:2014-09-18 22:08:04    阅读次数:189
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!