机器学习(3)之最小二乘法的概率解释在前面梯度下降以及正规方程组求解最优解参数Θ时,为什么选择最小二乘作为计算参数的指标,使得假设预测出的值和真正y值之间面积的平方最小化?我们提供一组假设,证明在这组假设下最小二乘是有意义的,但是这组假设不唯一,还有其他很多方法可以证明其有意义。(1)假设1:假设输...
分类:
其他好文 时间:
2014-09-11 01:02:41
阅读次数:
291
课程简介:
本次课程主题为"泛化理论",介绍了机械学习相关课程,重点介绍与之相关的公式推导及其应用。是这一整套课程中最具理论的课程,如果读者理解了该部分内容,那么对于后面课程的理解将会有很大的帮助。...
分类:
其他好文 时间:
2014-09-10 17:49:21
阅读次数:
227
Weka算法Classifier-tree-RandomForest源码分析(二)代码实现...
分类:
其他好文 时间:
2014-09-09 23:05:59
阅读次数:
262
入门:数据挖掘入门的书籍,中文的大体有这些:JiaweiHan的《数据挖掘概念与技术》IanH.Witten/EibeFrank的《数据挖掘实用机器学习技术》TomMitchell的《机器学习》TOBYSEGARAN的《集体智慧编程》AnandRajaraman的《大数据》Pang-NingTan的...
分类:
其他好文 时间:
2014-09-09 22:55:09
阅读次数:
405
Apriori算法也属于无监督学习,它强调的是“从数据X中能够发现什么”。从大规模的数据集中寻找物品之间隐含关系被称为关联分析或者称为关联规则学习。这里的主要问题在于,寻找物品的不同组合是一项十分耗时的任务,所需的计算代价很高,蛮力搜索并不能解决这个问题。因此此处介绍使用Apriorio算法来解决上述问题。
1:简单概念描述
(1) 频繁项集:指经常出现在一块的物品的...
分类:
其他好文 时间:
2014-09-09 20:11:19
阅读次数:
313
scikit-learn机器学习库介绍(翻译tutorial)...
分类:
其他好文 时间:
2014-09-09 18:21:48
阅读次数:
261
前面的7次笔记介绍的都是分类问题,本次开始介绍聚类问题。分类和聚类的区别在于前者属于监督学习算法,已知样本的标签;后者属于无监督的学习,不知道样本的标签。下面我们来讲解最常用的kmeans算法。
1:kmeans算法
Kmeans中文称为k-均值,步骤为:(1)它事先选定k个聚类中心,(2)然后看每个样本点距离那个聚类中心最近,则该样本就属于该聚类中心。(3)求每个聚类中心的样本...
分类:
其他好文 时间:
2014-09-09 16:17:19
阅读次数:
234
在大学毕业前立志要读完的四本书:
《模式分类》
《人工智能——一种现代方法》
《一种新科学》
《神经网络与机器学习》
现在感觉到压力山大了……顺便占个坑,不定期过来更新书单。...
分类:
其他好文 时间:
2014-09-09 16:15:48
阅读次数:
140
Weka算法Classifier-tree-J48源码分析(四)总结...
分类:
其他好文 时间:
2014-09-09 13:20:08
阅读次数:
248
Weka算法Classifier-tree-RandomForest源码分析(一)算法...
分类:
其他好文 时间:
2014-09-09 13:03:08
阅读次数:
398