Machine Learning Algorithms Study Notes 高雪松 @雪松Cedro Microsoft MVP 本系列文章是Andrew Ng 在斯坦福的机器学习课程 CS 229 的学习笔记。Machine Learning Algorithms Study Notes系列文...
分类:
系统相关 时间:
2014-11-14 10:30:14
阅读次数:
279
本人还没有做过自然语言处理,但是基于Deep Learning 的关注,自然也了解了一些Word2vec的强大。
Word2vec 是google 在2013年提供的一款将词表征为实数值向量的高效工具。而Word2vec
输出的词向量可用于做NLP 相关的工作,比如聚类、找同义词、词性分析等。Word2vec 大受欢迎的一个原因是其高效性, Tomas Mikolov 在[1]...
分类:
其他好文 时间:
2014-11-13 16:47:26
阅读次数:
192
基于 Apache Mahout 实现高效的协同过滤推荐 Apache Mahout 是 Apache Software Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用...
分类:
编程语言 时间:
2014-11-13 13:07:07
阅读次数:
270
目前,SPARK在大数据处理领域十分流行。尤其是对于大规模数据集上的机器学习算法,SPARK更具有优势。一下初步介绍SPARK在linux中的部署与使用,以及其中聚类算法的实现。...
分类:
编程语言 时间:
2014-11-12 21:21:04
阅读次数:
264
《PRML》中Logistic回归(逻辑回归,LR)的推导...
分类:
其他好文 时间:
2014-11-12 21:16:56
阅读次数:
280
前几天有幸参加了3wcoffee组织的一场产品发布会,就是图灵机器人,真的是让我大开眼界,现场邀请的嘉宾也是行业资深专家,有前百度首席科学家、机器学习博士张栋,九合创投王啸嘉宾助阵,给在场的观众讲解了未来智能时代的大势所趋及自己对机器人的理解。真的是受益匪浅。 说了这么多的题外话,现在还是进入主题....
分类:
其他好文 时间:
2014-11-12 16:19:42
阅读次数:
155
本文主要通过一个典型的例子介绍什么是机器学习以及机器学习里常见的一些概念。例子一个顾客想申请招商银行信用卡,招商银行让这个顾客填写一些基本资料,假设整个申请表一共只有五项(真实的申请表会被这五个选项要多得多)。性别女年龄23工作年限0.5年收入10万负债1万假如你是招商银行信用卡负责人,你会给她发放...
分类:
其他好文 时间:
2014-11-11 20:57:14
阅读次数:
526
3. Model Representation I 1 神经网络是在模仿大脑中的神经元或者神经网络时发明的。因此,要解释如何表示模型假设,我们不妨先来看单个神经元在大脑中是什么样的。 我们的大脑中充满了如上图所示的这样的神经元,神经元是大脑中的细胞。其中有两点值得我们注意,一是神经元有像这样的细胞主...
分类:
Web程序 时间:
2014-11-11 14:03:14
阅读次数:
295
在机器学习领域,集成学习由于可以提高学习系统的泛化能力,因此被广泛关注使用。对于集成学习可以分为两个阶段: 1)对训练数据集构造出多个基分类器。 这些基分类器的构造通常采用数据子集或者特征子集的方法进行构造,加上随机子集的方法,保证构造出的多个基分类器相互之间具有差异性 ...
分类:
其他好文 时间:
2014-11-10 21:35:02
阅读次数:
1935
八、核(kernel)
如果样本点为线性不可分,那么,需要将数据映射到高维空间,使在原始空间内其线性可分变为线性可分。如下图所示:
上文提到,分类器可以写成:
}+b" alt="">
那么,如果使用一种映射的方法,将低维数据映射到高维(),使得线性不可分变为线性可分。称为特征映射函数,这样,分类器就变为:
}+b" alt="">
(1)实例
低维映射到高维能否...
分类:
其他好文 时间:
2014-11-10 13:55:52
阅读次数:
421