贝叶斯定理的思想出现在18世纪,但真正大规模派上用途还得等到计算机的出现。因为这个定理需要大规模的数据计算推理才能凸显效果,它在很多计算机应用领域中都大有作为,如自然语言处理,机器学习,推荐系统,图像识别,博弈论等等。本文先介绍贝叶斯定义,然后对定义进行解释,再通过一些列子分析,力图让贝叶斯定理通俗易懂。...
分类:
其他好文 时间:
2014-10-22 08:46:21
阅读次数:
301
贝叶斯定理的思想出现在18世纪,但真正大规模派上用途还得等到计算机的出现。因为这个定理需要大规模的数据计算推理才能凸显效果,它在很多计算机应用领域中都大有作为,如自然语言处理,机器学习,推荐系统,图像识别,博弈论等等。本文先介绍贝叶斯定义,然后对定义进行解释,再通过一些列子的分析,力图让贝叶斯定理通...
分类:
其他好文 时间:
2014-10-22 08:44:06
阅读次数:
308
大数据的热门使得非常多人都想往这个方向发展,做一些像数据挖掘,数据分析之类的工作。可是该从何開始呢?要如何才干高速学到一些实用的知识,技能呢?我认为有三个切入点,按照个人特点能够自行选择顺序切入。1机器学习/数据挖掘数据挖掘主要依赖于大部分机器学习算法,近些年因为深度学习算法的开发以及无人驾驶汽车等...
分类:
其他好文 时间:
2014-10-21 21:14:11
阅读次数:
239
HaarTraining关键的部分是建立基分类器classifier,OpenCV中所采用的是CART(决策树的一种):通过调用cvCreateMTStumpClassifier来完成。
这里我讨论利用回归的方法来分裂结点,分类的方法只是在分裂结点的方法与之不同而已。...
分类:
其他好文 时间:
2014-10-21 19:41:50
阅读次数:
255
http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=MachineLearninghttp://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorialhttp:/...
分类:
其他好文 时间:
2014-10-19 21:20:01
阅读次数:
187
1.什么是MLBaseMLBase是Spark生态圈的一部分,专注于机器学习,包含三个组件:MLlib、MLI、ML Optimizer。ML Optimizer: This layer aims to automating the task of ML pipeline construction....
分类:
编程语言 时间:
2014-10-19 18:30:41
阅读次数:
336
通常预测的点击率都是不准的,需要校准。例如,boosted trees and SVM预测结果趋于保守,即预测的概率偏向于中值;而对于NaiveBayes预测的概率,小概率趋于更小,大概率趋于更大。常用的校准方法有Binning和Pair‐Adjacent
Violators (PAV);下面分别说说这两种方法。
Binning思想比较简单,也容易实现。
需要说明的是,通常校准算法...
分类:
其他好文 时间:
2014-10-18 22:24:00
阅读次数:
713
集成学习:是目前机器学习的一大热门方向,所谓集成学习简单理解就是指采用多个分类器对数据集进行预测,从而提高整体分类器的泛化能力。 我们在前面介绍了。所谓的机器学习就是通过某种学习方法在假设空间中找到一个足够好的函数h逼近f,f是现实数据的分布函数模型,这个近似的函数就是分类器。 我们以分类问...
分类:
其他好文 时间:
2014-10-18 22:12:54
阅读次数:
305
本文主要讲解在matlab中实现Linear Regression和Logistic Regression的代码,并不涉及公式推导。具体的计算公式和推导,相关的机器学习文章和视频一大堆,推荐看Andrew NG的公开课。一、线性回归(Linear Regression)方法一、利用公式 :funct...
分类:
其他好文 时间:
2014-10-18 03:00:32
阅读次数:
357
前言本篇继续我们的微软挖掘算法系列总结,前几篇我们分别介绍了:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法、Microsoft 时序算法,后续还补充了二篇结果预测篇、Microsoft 时序算法——结果预算+下期彩票预测篇,看样子...
分类:
数据库 时间:
2014-10-17 23:18:59
阅读次数:
325