第一章 统计学习方法概论 学习:如果一个系统能够通过执行某个过程改进它的性能,这就是学习 监督学习:从训练数据集中学习模型,对测试数据进行预测 回归问题:输入变量与输出变量均为连续变量的预测问题 分类问题:输出变量为有限个离散变量的预测问题 标注问题:输入变量与输出变量均为变量序列的预测问题 损失函 ...
分类:
其他好文 时间:
2017-07-20 17:24:19
阅读次数:
225
声明: 1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结。不得用作商用,欢迎转载,但请注明出处(即:本帖地址)。 2,因为本人在学习初始时有非常多数学知识都已忘记。因此为了弄懂当中的内容查阅了非常多资料。所以里面应该会有引用其它帖子的小部分内容,假设原作者看到能够私信我。我会将您的 ...
分类:
编程语言 时间:
2017-07-19 17:40:42
阅读次数:
220
手把手生成决策树(dicision tree) 标签: Python 机器学习 主要參考资料: Peter HARRINGTON.机器学习实战[M].李锐,李鹏,曲亚东,王斌译.北京:人民邮电出版社, 2013. 李航.统计学习方法[M].北京:清华大学出版社, 2012 原文链接:http://b ...
分类:
其他好文 时间:
2017-07-16 21:25:32
阅读次数:
214
学完机器学习cs229前10集,满心的疑惑,感觉找到了新世界,但是还没找到钥匙, 故总结一波,结合cs229讲义,课后作业,中文笔记,Coursera版机器学习的笔记,Coursera版编程作业,机器学习-周志华,统计学习方法-李航,相关章节,试图完善整个监督学习体系,尝试理解SVM(不做高要求,看 ...
分类:
其他好文 时间:
2017-07-14 21:19:56
阅读次数:
186
写在前面: 参考: 1 《统计学习方法》第二章感知机【感知机的概念、误分类的判断】 http://pan.baidu.com/s/1hrTscza 2 点到面的距离 3 梯度下降 4 NumPy-快速处理数据 属性shape:表示几行几列; dot(a,b) 计算数组、矩阵的乘积 感知器算法: Py ...
分类:
编程语言 时间:
2017-07-05 13:43:27
阅读次数:
257
本篇将依据《统计自然语言处理》(宗成庆),重新梳理统计学习相关理论知识,相关概率论与梳理统计的课本不再列出来,可以找任意相关的课本复(预)习。 概率 概率是表示事件发生的可能性,将随机试验中的事件映射到实数域。用$P(A)$表示事件A的概率,$\Omega$表示试验的样本空间(所有可能发生的事件), ...
分类:
其他好文 时间:
2017-07-02 14:24:52
阅读次数:
180
感知机 (一)概念 1,定义: (二),学习策略 1,线性可分 :存在一个超平面将正实例和负实例划分开来,反之不可分 2,学习策略:寻找极小损失函数,通过计算误分点到超平面的距离 3,学习算法 即求解损失函数最优化的算法,借用随机梯度下降法 3.1 原始形式 学习率也叫步长(0,1] 例题: 特点: ...
分类:
其他好文 时间:
2017-07-01 01:10:54
阅读次数:
277
统计学习方法概论: (一),统计学习 1,统计学习的特点 2,统计学习的对象 3,统计学习的目的 4,统计学习的方法 (二),监督学习重要概念 1,输入空间,特征向量空间,输出空间 (三),统计学习三要素 1,模型 决策函数模型: 条件概率模型: 2,策略 2.1 损失函数: 2.2 经验风险最小化 ...
分类:
其他好文 时间:
2017-06-30 23:53:33
阅读次数:
216
声明: 1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用,欢迎转载,但请注明出处(即:本帖地址)。 2,因为本人在学习初始时有非常多数学知识都已忘记,所以为了弄懂当中的内容查阅了非常多资料。所以里面应该会有引用其它帖子的小部分内容,假设原作者看到能够私信我,我会将您的 ...
分类:
编程语言 时间:
2017-06-30 22:22:02
阅读次数:
232
概率无向图模型 又称马尔可夫随机场(Markov random field)或马尔可夫网络,是一个由无向图表示的联合概率分布。 图是由结点和边组成,无向图中的边没有方向。概率无向图中结点表示随机变量,边表示结点之间的概率依赖关系。 成对马尔可夫性: 设u和v是无向图G中任意两个没有连接边的结点,对应 ...
分类:
其他好文 时间:
2017-06-13 11:29:01
阅读次数:
258