系统的学习机器学习课程让我觉得受益匪浅,有些基础问题的认识我觉得是非常有必要的,比如机器学习算法的类别。
为什么这么说呢?我承认,作为初学者,可能无法在初期对一个学习的对象有全面而清晰的理解和审视,但是,对一些关键概念有一个初步并且较为清晰的认识,有助于让我们把握对问题的认识层次,说白了,就是帮助我们有目的的去学习心得知识,带着问题去学习,充满对解决问题的动力去实验,我觉得这种方式是有益并且良性的。...
分类:
编程语言 时间:
2014-12-04 12:19:28
阅读次数:
164
当我们成功实现一个机器学习算法并将其用于解决实际问题时,常常会发现它的性能(分类、回归准确度)达不到我们足够满意的状态。在这种情况下,我们有以下六种选项来提高当前算法的性能1 增加training set的数目 这种方法适合模型发生过拟合的情况2 减小feature的数量(使用更少featur...
分类:
编程语言 时间:
2014-12-03 19:01:49
阅读次数:
234
监督学习的任务就是学习一个模型(或者得到一个目标函数),应用这一模型,对给定的输入预测相应的输出。这一模型的一般形式为一个决策函数Y=f(X),或者条件概率分布P(Y|X)。
监督学习方法又可以分为生成方法(generative approach)和判别方法(discriminative approach)。所学到的模型分别为生成模型(generative model)和判别模型(discriminative model)。...
分类:
其他好文 时间:
2014-12-03 15:49:32
阅读次数:
174
“机器学习”是人工智能的核心研究领域之一, 其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。
事实上,由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一。...
分类:
其他好文 时间:
2014-12-03 15:47:53
阅读次数:
128
目前最流行的做机器学习的语言当属python了,两大库numpy和scipy十分强大。但本人学习perl的初衷是做爬虫,但做数据挖掘又不得不碰到科学计算,而perl中没有一个像numpy和scipy这么强大的module,更多的是零散的分布在许多module中,所以只能自己写点函数,以备自用。学.....
分类:
其他好文 时间:
2014-12-03 01:39:44
阅读次数:
419
基于Spark On Yarn的淘宝数据挖掘平台:http://www.doc88.com/p-7804379529208.htmlSpark之MLLib机器学习库:http://blog.csdn.net/johnny_lee/article/details/25656343Spark之ALS(推...
分类:
其他好文 时间:
2014-12-02 23:49:03
阅读次数:
230
经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)今天给大家介绍一下经典的开源机器学习软件:编 程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和 C/C++,这...
分类:
其他好文 时间:
2014-12-02 22:14:59
阅读次数:
219
第一章的主要目的是为了了解一下基本概念,如什么是机器学习、无监督学习、监督学习等等。一、什么是机器学习1、机器学习是一门新的研究领域,主要是指在不需要显示编程情况下,计算机具有学习的能力Field of study that gives computers the ability to learn ...
分类:
其他好文 时间:
2014-12-02 22:12:55
阅读次数:
135
前面两个系列分别讲诉了SVM的基本原理和代码实现,如何解决线性不可分情况。这一次我们讲解一下SVM的最后一篇:SVM解决多类分类问题。...
分类:
其他好文 时间:
2014-12-02 17:22:52
阅读次数:
244
今天,我要介绍我们早就知道的一种分布,它叫做高斯分布。高斯分布在概率论中算是比较核心的一种分布了,而在机器学习中,高斯分布也随处可见,比如单高斯模型,高斯混合模型,高斯过程等等,它们都是基于高斯分布的。作为理解连续性随机变量的基础和深入理解在机器学习中的广泛应用,高斯分布是十分有必要学习的。
高斯分布又叫做正态分布,高斯分布概率密度函数的函数形式是由德国著名的天才数学家、统计学家、物理学家...
分类:
其他好文 时间:
2014-12-02 11:50:57
阅读次数:
262