开这个博客主要是监督自己做学习笔记:1.数学上的以及学术上的。2.机器学习,视觉,数据挖掘,NLP。3.算法以及语言。Never ever forget pushing yourself out of your fucking comfort zone!
分类:
其他好文 时间:
2014-11-17 20:58:28
阅读次数:
129
最近神经网络实在太火了,其本质上来说就是人们模拟人脑的思维结构去有意识地去赋予一台机器在既定的程序下去学习某一问题的规律~如深度学习,他可以从给定的素材中自主地学习得到其特征,并进行一些分类或者预测活动,就如人类通过思考去判断。
这样的人工智能化必将是以后的趋势,其可以代替人类做很多事情。
但是问题来了,我们现在所谓的机器学习算法只能称为小众型,如深度学习,他的成功还在于能...
分类:
其他好文 时间:
2014-11-17 00:34:12
阅读次数:
291
本文基本按照《统计学习方法》中第一章的顺序来写,目录如下:1. 监督学习与非监督学习2. 统计学习三要素3.过拟合与正则化(L1、L2)4.交叉验证5. 泛化能力6. 生成模型与判别模型7. 机器学习主要问题8. 提问正文:1. 监督学习与非监督学习 从标注数据中学习知识的规律以及训练模型的方法叫....
分类:
其他好文 时间:
2014-11-16 21:18:33
阅读次数:
281
python安装scikit-learn问题解决,scikit-learn一个你值得拥有的python机器学习工具包。...
分类:
编程语言 时间:
2014-11-15 21:52:52
阅读次数:
15757
1.统计学习 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。统计学习是数据驱动的学科。统计学习是一门概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科。 统计学习的对象是数据,它从数据出发,提取数据的特征,...
分类:
其他好文 时间:
2014-11-15 20:13:40
阅读次数:
223
1 首先需要安装Cython,网上下载后进行本地安装 python setup.py install
2 下载Sklearn包,https://pypi.python.org/pypi/scikit-learn/0.14.1 ,进行本地安装(使用pip或easy_install总是出错,如can not import murmurhash3_32,最终本地安装成功)
3 安装后...
分类:
编程语言 时间:
2014-11-14 22:49:04
阅读次数:
294
EM算法,这是cv界比较有名的一种算法了,虽然很早就听说过,但真正深究还是最近几天看斯坦福公开课笔记的时候。之所以EM和MoG放在一起,是因为我们在求解MoG模型的时候需要用到EM算法,所以这里我们先来介绍下EM算法。 在介绍EM算法的之前,我们先来普及下Jensen不等式的知识。首先我们来给出.....
分类:
编程语言 时间:
2014-11-14 17:36:59
阅读次数:
532
从业务发展需求,大数据平台需要使用spark作为机器学习、数据挖掘、实时计算等工作,所以决定使用Cloudera Manager5.2.0版本和CDH5。
以前搭建过Cloudera Manager4.8.2和CDH4,在搭建Cloudera Manager5.2.0版本的时候,发现相应的Service Host Monitor 和 Service Monitor不能配置外部表,刚开是还以为是配置出错,后来才发现应该是新版本的Cloudera的存储改变方式了。查了很多文档,果然发现,新版本中Service ...
分类:
数据库 时间:
2014-11-14 12:39:43
阅读次数:
316
来源:36大数据 作者:LinkinPark现一个key-value的数据库,那么有很多种模式都可以实现,但是他们最终所达到的效果却是千差万别的。同样,在机器学习领域,如果我想实现一个分类器,也有很多种算法,但是每种算法都对数据做了不同的前提假设。曾经当我们处理少量数据的时候,我们往往可以先设计若干...
分类:
其他好文 时间:
2014-11-14 12:04:29
阅读次数:
128