这一课时主要是讲述了线性模型的一些处理。
包括:
1、输入数据的表示(Input Representation)
2、线性分类(Linear Classification)
3、线性回归(Linear Regression)
4、非线性模型转换(Nonlinear Transformation)
作者认为,如果要测试某个模型的可用性,做好就是用真实数据。
为了讲解线...
分类:
其他好文 时间:
2014-08-29 22:42:38
阅读次数:
366
一年前一个偶然的机会我遇到了一本书 ——《影响力》,看完这本书之后对我们如何思维产生了极大的兴趣,于是在一年的时间里面密集地阅读了以下一些方面的经典著作:社会心理学、认知科学、神经科学、进化心理学、行为经济学、机器学习、人工智能、自然语言处理、问题求解、辩论法(Argumentation Theor...
分类:
其他好文 时间:
2014-08-29 08:20:37
阅读次数:
409
scikit-learn.org 一个开源的机器学习python工具 http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html Theano - Phthon深度学习算法库 Python的科学计算库 http://...
分类:
其他好文 时间:
2014-08-27 20:12:08
阅读次数:
247
第一章 统计学习方法概述1.1 统计学习 统计学习(statistical learning)是关于计算机基于数据概率模型并运用模型进行预测和分析的学科。统计学习也称为统计机器学习,现在人们提及的机器学习一般都是指统计机器学习。 统计学习的对象是数据(data),关于数据的基本假设是同类数据具有.....
分类:
其他好文 时间:
2014-08-27 18:26:38
阅读次数:
135
L2范数 除了L1范数,还有一种更受宠幸的规则化范数是L2范数: ||W||2。它也不逊于L1范数,它有两个美称,在回归里面,有人把有它的回归叫“岭回归”(Ridge Regression),有人也叫它“权值衰减weight decay”。这用的很多吧,因为它的强大功效是改善机器学习里面一个非常.....
分类:
其他好文 时间:
2014-08-27 12:46:08
阅读次数:
377
知道某个算法,和运用一个算法是两码事儿。当你训练出数据后,发觉模型有太大误差,怎么办?1)获取更多的数据。也许有用吧。2)减少特征维度。你可以自己手动选择,也可以利用诸如PCA等数学方法。3)获取更多的特征。当然这个方法很耗时,而且不一定有用。4)添加多项式特征。你在抓救命稻草么?5)构建属于你自己...
分类:
其他好文 时间:
2014-08-26 21:05:46
阅读次数:
889
Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Apache Mahout项目已经发展到了它的第三个年头,目前已经有了三个公共发行版本。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。
Mahout 的创始人 Grant Ingersoll 介绍了机器学习的基本概...
分类:
其他好文 时间:
2014-08-26 19:44:17
阅读次数:
357
在对数据进行拟合,学习模型的过程中,会出现以下情况:1)high variance, overfitting.过拟合2)high bias, underfiiting.欠拟合过拟合出现的原因1)太多的特征。2)过少的训练数据。如何解决?1)减少特征数2)模型选择算法(model selection ...
分类:
其他好文 时间:
2014-08-26 19:13:56
阅读次数:
310
outlook
temperature
humidity
windy
play
yes
no
yes
no
yes
no
yes
no
yes
no
sunny
2
3
hot
2
2
high
3
4
...
分类:
其他好文 时间:
2014-08-26 09:53:05
阅读次数:
200