有了前面的准备,可以用Theano实现一个逻辑回归程序,逻辑回归是典型的有监督学习。
为了形象,这里我们假设分类任务是区分人与狗的照片。
首先是生成随机数对象
importnumpy
importtheano
importtheano.tensor as T
rng= numpy.random
数据初始化
有400张照片,这些照片不是人的就是狗的。
每张照片是28*28=78...
分类:
其他好文 时间:
2014-08-28 22:46:06
阅读次数:
360
标量相加
import theano.tensor as T
from theano import function
x = T.dscalar('x')
y = T.dscalar('y')
z = x + y
f = function([x, y], z)
输入定义两个符号变量来代替数值,输出是一个0维的numpy.ndarray数组。
矩阵相加
把输入类型换一下就行了,矩阵如果...
分类:
其他好文 时间:
2014-08-28 16:13:59
阅读次数:
642
scikit-learn.org 一个开源的机器学习python工具 http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html Theano - Phthon深度学习算法库 Python的科学计算库 http://...
分类:
其他好文 时间:
2014-08-27 20:12:08
阅读次数:
247
学习笔记之《Unsupervised feature learning by augmenting single images》...
分类:
其他好文 时间:
2014-08-25 17:02:34
阅读次数:
241
神经概率语言模型,内容分为三块:问题,模型与准则,实验结果。[此节内容未完待续...]1,语言模型问题 语言模型问题就是给定一个语言词典包括v个单词,对一个字串做出二元推断,推断其是否符合该语言表达习惯。也就是的取值为0或者为1。 概率语言模型放松了对取值的限制,让其在0~1之间取值(语言模...
分类:
其他好文 时间:
2014-08-24 23:45:53
阅读次数:
361
在之前的章节中,我们已经很好地解决了手写体识别问题(维数为28*28)。但如果是更大的图像(维数为96*96)呢?如果你还是要学习400个特征,那么网络权重参数就有400*96*96即近400万个。
卷积特征提取
如果我们从大型彩色图像(64*64*3)中随机抽取一些小patch(8*8),学到了一些特征,然后用这些特作为滤波器去扫过整张大图,即逐行逐列做卷积。这样做可以大幅减小网...
分类:
其他好文 时间:
2014-08-18 18:41:59
阅读次数:
820
稀疏自编码器效果不错,但是有个固有缺陷:必须对输入数据的范围缩放到(0,1)。
设想一个图像如果不经预处理,直接把大于1的值输入稀疏自编码器,那么被sigmoid一下,就成了(0,1)的范围了,再被sigmoid一下,还是在(0,1)范围。这样残差根本没办法算,因为经过了sigmoid变换之后的数据已经不可能与输入数据相等了。
但是如果我们把第三层,原先的sigmoid函数换成恒等...
分类:
其他好文 时间:
2014-08-16 15:12:00
阅读次数:
302
自我学习就是稀疏编码器串联一个Softmax分类器,上一节看到,训练400次,准确率为98.2%
在此基础上,我们可以搭建我们的第一个深度网络:栈式自编码(2层)+Softmax分类器
简单地说,我们把稀疏自编码器的输出作为更高一层稀疏自编码器的输入。
和自我学习很像,似乎就是新加了一层,但是其实不然:
新技巧在于,我们这里有个微调的过程,让残差从最高层向输入层传递,微调整个网络权重...
分类:
其他好文 时间:
2014-08-16 12:37:40
阅读次数:
220
linger博客原创性博文导航
http://blog.csdn.net/lingerlanlan
大学研究游戏外挂技术开始了此博客,断断续续写了些博文。后来,开始机器学习和深度学习的研究工作,由于喜欢和热爱,业余时间也经常性学习,并写博文总结。因此,博文越来越多,由于博文是根据时间排序的,看起来有点乱,所以在此处写个导航。
UFLDL学习笔记和编程
ufldl...
分类:
其他好文 时间:
2014-08-15 00:01:26
阅读次数:
372
自我学习就是把稀疏自编码器与Softmax回归分类器串联起来。
稀疏编码器是用来无监督学习的,使用无标签数据。
Softmax回归分类器是有监督学习,使用标签数据。
实际生活中,我们能轻松获得大量无标签数据(如从网上随机下载海量图片)
难以获得大量有标签数据(有标签的数据库通常不会太大,而且很贵)
如果我们手头上只有少量标签数据,但是有大量的无标签数据,这是就可以采用自我...
分类:
其他好文 时间:
2014-08-13 13:03:36
阅读次数:
493