考虑一个代价函数C , 它根据参数向量
计算出当前迭代模型的代价,记作C().
机器学习中,我们的任务就是得到代价的最小值,在机器学习中代价函数通常是损失函数的均值,或者是它的数学期望。见下图:
这个叫做泛化损失,在监督学过程中,我们知道z=(x,y) ,并且 f(x)
是对y的预测。
什么是这里的梯度呢?
当 是标量的时候,代价函数的梯度可表示如下:
当...
分类:
其他好文 时间:
2014-12-17 22:43:44
阅读次数:
323
什么是机器学习?
传统的教科书会用一大堆高等数学,线性代数,概率论,统计学等知识把你拒之门外,这里博主俺决定用一个很简单的例子给不用你任何高深的数学知识来理解。
在写机器学习之前,我们来举个例子。假设你是个古代的国王,那里没有现代的科技,你想找个预报天气比较准的人来帮你预报天气。你要怎么办呢?通常,我们会找一个人,让他预报10000天,看它的准确率如何,然后再找一个人,再预报1...
分类:
其他好文 时间:
2014-12-17 22:41:29
阅读次数:
275
我记得科学松鼠会的姬十三曾在一篇文章中写到,开始干一件好事情就像拿着锣一敲,然后志同道合的人就从四面八方赶来。开源之美,仅在于此。
不要问怎么入门,直接上路吧。
您刚才那个问题是说大数据跟人工智能和深度学习怎么划等号?是这么一个关系,大数据是一个研究对象,人工智能是一个目标,我们要达到人工智能的目标,要理解数据,方法论是机器学习或者是智能计算。深度学习是机器学习里面十个手指头里面的一个...
分类:
其他好文 时间:
2014-12-17 18:37:41
阅读次数:
206
1.Google在研究博客中总结了他们2011年的精彩论文《Excellent Papers for 2011》,包括社会网络、机器学习、人机交互、信息检索、自然语言处理、多媒体、系统等各个领域,很精彩的论文集锦。http://googleresearch.blogspot.com/2012/03/...
分类:
其他好文 时间:
2014-12-17 16:10:15
阅读次数:
323
本文是用Python编程语言来进行机器学习小实验的第一篇。主要内容如下:
读入数据并清洗数据
探索理解输入数据的特点
分析如何为学习算法呈现数据
选择正确的模型和学习算法
评估程序表现的准确性...
分类:
编程语言 时间:
2014-12-17 09:49:44
阅读次数:
223
最近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重量级的适用于工业系统的 Mahout、Oryx、EasyRecd等,供大家参考。PS:这里的top 10仅代表个人观点。
1.SVDFeature
主页:http://svdfeature.apexlab.org/wiki/Main_Page 语...
分类:
其他好文 时间:
2014-12-16 21:08:09
阅读次数:
523
KNN(K Nearest Neighbors,K近邻 )算法是机器学习所有算法中理论最简单,最好理解的一种监督学习算法。KNN是一种基于实例的学习,通过计算新数据与训练数据特征值之间的距离,然后选取K(K>=1)个距离最近的邻居进行分类判断(投票法)或者回归。使用KNN算法时我们必须有接近实际数据的训练样本数据。K-近邻算法必须保存全部数据集,如果训练数据集的很大,必须使用大量的存储空间。此外,由于必须对数据集中的每个数据计算距离值,实际使用时可能非常耗时。k-近邻算法的另一个缺陷是它无法给出任何数据的基...
分类:
编程语言 时间:
2014-12-16 21:04:43
阅读次数:
286
http://blog.csdn.net/ice110956/article/details/17090061整理至11月中旬在重庆参加的自然语言处理与机器学习会议,第一讲为自然语言处理。由基本理论到实际运用,整理了基本的框架。1.自然语言处理基础词性标注(POS):为句子中的每个词语标注词性,可看...
分类:
编程语言 时间:
2014-12-16 13:18:08
阅读次数:
303