简介 先安装好Nvdia 驱动 在安装cuda 安装方式 https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&t ...
分类:
系统相关 时间:
2020-06-14 01:33:12
阅读次数:
104
CUDA中不能在主机代码中对cudaMalloc()返回的指针进行解引用。 可以将cudaMalloc()分配的指针传递给在设备上执行的函数。 可以在设备代码中使用cudaMalloc()分配的指针进行内存读/写操作。 可以将cudaMalloc()分配的指针传递给在主机上执行的函数。 不能在主机代 ...
分类:
其他好文 时间:
2020-06-11 21:57:45
阅读次数:
57
Makefile教程(绝对经典,所有问题看这一篇足够了)makefile很重要 什么是makefile?或许很多Winodws的程序员都不知道这个东西,因为那些Windows的IDE都为你做了这个工作,但我觉得要作一个好的和professional的程序员,makefile还是要懂。这就好像现在有这... ...
分类:
其他好文 时间:
2020-06-08 19:27:31
阅读次数:
215
参考博客: https://blog.csdn.net/u011276025/article/details/73826562/ 1. 把Label要转成LongTensor格式 self.y = torch.LongTensor(y) 完整使用代码如下: 1 class ImgDataset(Da ...
分类:
其他好文 时间:
2020-06-08 19:21:24
阅读次数:
92
下载 在 https://developer.nvidia.com/nvidia-tensorrt-7x-download 选择对应设备型号 LINUX查看CUDA版本 cat /usr/local/cuda/version.txt LUNUX查看CUDNN版本 cat /usr/local/cud ...
分类:
其他好文 时间:
2020-06-08 11:08:51
阅读次数:
114
1:同步函数 1)__syncthreads() 实现线程块中的线程同步 保证线程块中所有线程执行到同一位置; 只有当整个线程块都走向相同分支时,才能在条件语句中使用__syncthreads)(; 一个warp内的线程不用同步; __syncthreads()调用花费时间周期,应尽量避免/节约使用 ...
分类:
其他好文 时间:
2020-06-07 12:45:31
阅读次数:
61
PS: 简单分享一下本人装cuda的过程,个人觉得这个cuda安装相比显卡驱动安装更加顺利,没那么多问题跑出,Cuda的版本就不纠结了哈,我直接用自己装过的版本。 Cuda安装( 参考:https://www.cnblogs.com/iloveblog/p/7683349.html) 1. 首先在c ...
分类:
系统相关 时间:
2020-06-06 10:46:58
阅读次数:
81
从零配置dlib(GPU) ? Written by Aquish 参考: [ win10+anaconda+cuda配置dlib ] [ 记一次Win10环境python3.7安装dlib模块趟过的坑 ] [ win10系统python下实现dlib的GPU加速 ] 写在前面 配环境真的是一件考验 ...
分类:
其他好文 时间:
2020-06-05 21:00:07
阅读次数:
133
CUDA运行时 Runtime(四) 一. 图 图为CUDA中的工作提交提供了一种新的模型。图是一系列操作,如内核启动,由依赖项连接,依赖项与执行分开定义。这允许定义一次图形,然后重复启动。将图的定义与其执行分离可以实现许多优化:第一,与流相比,CPU启动成本降低,因为大部分设置是提前完成的;第二, ...
分类:
其他好文 时间:
2020-06-05 12:58:52
阅读次数:
58
CUDA C++编程接口:编译 一.概述 CUDA C++为熟悉C++编程语言的用户提供了一个简单的路径,以方便地编写程序以执行该设备。 它由一组最小的扩展到C++语言和运行库。 在编程模型中引入了核心语言扩展。它们允许程序员定义内核作为C++函数,并使用一些新的语法来指定每次调用函数时的网格和块维 ...
分类:
编程语言 时间:
2020-06-04 19:28:30
阅读次数:
73