0 引言机器学习(machine learning)是人工智能的核心研究领域,是智能信息处理的重要途径。监督学习(supervised learning)是机器学习中研究最多、应用最广泛的一种学习途径。在传统的监督学习中,学习系统通过对大量的有标记训练样本(labeled examples)进行学习...
分类:
其他好文 时间:
2014-10-17 23:08:53
阅读次数:
502
半指导学习(Semi-supervised Learning)的概念说起来一点儿也不复杂,即从同时含有标注数据和未标注数据的训练集中学习模型。半指导学习是介于有指导学习与无指导学习之间的一种机器学习方式。在NLP领域的很多任务中,标注数据其实是很难获取的。尤其像句法、语义等训练资源在标注时往往需要比...
分类:
其他好文 时间:
2014-10-17 18:24:53
阅读次数:
243
1、C4.5机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。从数...
分类:
编程语言 时间:
2014-10-17 11:48:04
阅读次数:
166
机器学习有着丰富的理论,分为有监督学习和无监督学习,有监督学习包括分类和回归,无监督学习包括聚类等。各种机器学习算法的基本思想都不难理解(这里的基本思想我的理解是各个算法的模型建立),而难点在于对于模型的求解,这里边有着优美的理论还有一些技巧,如SVM,EM,CA..
分类:
编程语言 时间:
2014-10-17 05:25:44
阅读次数:
619
Self-taught 自我学习器实验报告1.Self-taught 自我学习实验描述 自我学习是无监督特征学习算法,自我学习意味着算法能够从未标注数据中学习,从而使机器学习算法能够获得更大数量的数据,因而更有可能取得更好的性能。在本实验中,我们将按照自我学习的步骤,使用稀疏自编码器和softmax...
分类:
其他好文 时间:
2014-10-17 00:23:43
阅读次数:
371
在机器学习或者是模式识别当中有一种重要的分类器叫做:SVM 。这个被广泛的应用于各个领域。但是其计算的复杂度以及训练的速度是制约其在实时的计算机应用的主要原因。因此也很很多的算法被提出来,如SMO,Kernel的方法。
但是这里要提到的 Regularized
least-squares classification 是一个和他有着同样的效果的分类器。比较而言计算却比较的简单(We ...
分类:
其他好文 时间:
2014-10-16 16:55:33
阅读次数:
268
回归: 在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二次回归,回归还有很多的变种,如locally weighted回归,logistic回归,等等。训练集(training set)或者训练数据(traini...
分类:
其他好文 时间:
2014-10-16 00:42:01
阅读次数:
165
昨天开始看Ng教授的机器学习课,发现果然是不错的课程,一口气看到第二课。 第一课 没有什么新知识,就是机器学习的概况吧。 第二课 出现了一些听不太懂的概念。其实这堂课主要就讲了一个算法,梯度下降算法。到了教授推导公式的时候感觉有点蒙,不过后来仔细想想,也大概理解了,这个算法并没有...
分类:
编程语言 时间:
2014-10-15 21:56:21
阅读次数:
179
前言本篇文章同样是继续微软系列挖掘算法总结,前几篇主要是基于状态离散值或连续值进行推测和预测,所用的算法主要是三种:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,当然后续还补充了一篇结果预测篇,所涉及的应用场景在前几篇文章中也有介...
分类:
数据库 时间:
2014-10-14 18:59:49
阅读次数:
335