卷积操作的GPU粗粒度并行实现及测试
一、 算法基本思想:
1、 GPU中的一个线程产生一个卷积结果,有多少个结果就使用多少个Block;
2、 矩阵和卷积核存放在共享内存中,卷积结果存放在全局内存中;
3、 支持10000以内任意维度的二维矩阵,卷积核最大支持16x16。
4、 支持任意多幅图像的批处理。...
分类:
其他好文 时间:
2015-03-02 11:11:59
阅读次数:
235
机器学习Machine Learning - Andrew NG
courses学习笔记
Neural Networks Representation神经网络表示
Non-linear Hypotheses非线性假设
Neurons and the Brain神经元和大脑
Model Representation模型表示
Examples and Intu...
分类:
Web程序 时间:
2015-02-27 22:58:55
阅读次数:
195
零零星星挖坑几个了,都没填土,实在是欠账太多,闲话少说吧,还是多记录总结一下。今天的主题是围绕convolution和加速记得之前看过lecun他们组的一篇文章,是fft加速convolution的。按照Convolution Theorem,时域上的卷积可以转成空间域的傅立叶变换进行。lecun的...
分类:
其他好文 时间:
2015-02-27 16:57:26
阅读次数:
126
原文链接:caffe.berkeleyvision.org/tutorial/layers.html创建caffe模型,首先要在protocol buffer 定义文件(prototxt)中定义结构。在caffe环境中,图像的明显特征是其空间结构。Convolution:Documents: 1 P...
分类:
其他好文 时间:
2015-02-26 21:25:31
阅读次数:
289
How to build and run your first deep learning network Step-by-step instruction on training your own neural network.
分类:
Web程序 时间:
2015-02-26 20:00:25
阅读次数:
195
(原文地址:维基百科)简单介绍:脉冲神经网络Spiking neuralnetworks(SNNs)是第三代神经网络模型,其模拟神经元更加接近实际,除此之外,把时间信息的影响也考虑当中。思路是这种,动态神经网络中的神经元不是在每一次迭代传播中都被激活(而在典型的多层感知机网络中却是),而是在它的膜电...
分类:
Web程序 时间:
2015-02-13 22:24:50
阅读次数:
210
第二次作业基本部分包含三部分,Q1: Two-layer Neural Network,Q2: Modular Neural Network,Q3: ConvNet on CIFAR-10。Q1: Two-layer Neural Network这部分将要实现一个两层的神经网络,包括前向传播与BP后...
分类:
其他好文 时间:
2015-02-12 12:08:01
阅读次数:
3624
这一篇是整个第五章的精华了,会重点介绍一下Neural Networks的训练方法——反向传播算法(backpropagation,BP),这个算法提出到现在近30年时间都没什么变化,可谓极其经典。也是deep learning的基石之一。还是老样子,下文基本是阅读笔记(句子翻译+自己理解),把书里的内容梳理一遍,也不为什么目的,记下来以后自己可以翻阅用。...
分类:
编程语言 时间:
2015-02-07 23:03:19
阅读次数:
313
神经网络neural network,是生物科学和信息科学交叉的产物。用计算机模拟人脑的工作过程,完成分类识别的任务。
这里我们先感性的介绍神经网络及其训练过程,然后数学推导这个过程。
一个神经元和其它神经元连接:
一个神经元通常和若干个神经元相连...
分类:
其他好文 时间:
2015-02-03 11:11:01
阅读次数:
464
这一篇是整个第五章的精华了,会重点介绍一下Neural Networks的训练方法——反向传播算法(backpropagation,BP),这个算法提出到现在近30年时间都没什么变化,可谓极其经典。也是deep learning的基石之一。还是老样子,下文基本是阅读笔记(句子翻译+自己理解),把书里...
分类:
编程语言 时间:
2015-02-01 14:41:45
阅读次数:
348