1:如何选择合适的算法
2:python简介
(1) python的优势:相对于matlab,matlab单个软件授权就要花费数千美元,也没有一个有影响力的大型开源项目。相对于c++/c/java,完成简单的操作就需要编写大量的代码;而如今我们应该花费更多的时间去处理数据内在的含义,而无需花费太多精力解决计算机如何得到数据结果(python简洁)
(2) python...
分类:
其他好文 时间:
2014-07-18 21:37:59
阅读次数:
218
Microsoft Azure云服务推出机器学习的模块,用户只需上传数据,利用机器学习模块提供的一些算法接口和R语言或别的语言接口,就能利用Microsoft Azure强大的云计算能力来实现自己的机器学习的任务。本文浅尝了该机器学习模块,参照官方实例和帮助文档,完成了一个简单的应用实例,具体步骤如...
分类:
其他好文 时间:
2014-07-16 18:25:20
阅读次数:
240
1. 统计学习统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。学习就是如果一个系统能够通过执行某个过程改进它的性能,这就是学习。统计学习的对象是数据,它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去...
分类:
其他好文 时间:
2014-07-16 12:42:25
阅读次数:
275
2013-5-3 Yongwu Shen
Future AI system would be the one that is able to grow from the rootby itself, rather than being created brick by brick like existing ones.
Building an AI system in the future w...
分类:
其他好文 时间:
2014-07-16 08:51:57
阅读次数:
347
从搬完宿舍以来,过的一天不如一天,甚至每天早上6点钟自然醒的能力都开始慢慢丧失了,而且白天还比较嗜睡,一躺下没两个小时肯定不够。这两天也基本上没学什么东西,浪费了好多时间,感觉心里老是毛毛的,也有一丝的愧疚。就以这个状态,怎么去参加秋招。。。
再回想前一段时间,复习操作系统那一周最充实了,不光只看了操作系统,还看了《饥饿游戏》三部曲,另外,开始看Andrew
Ng机器学习公开课...
分类:
其他好文 时间:
2014-07-16 08:17:04
阅读次数:
172
高维数据的可伸缩最近邻算法FLANN
1. 简介
在计算机视觉和机器学习中,对于一个高维特征,找到训练数据中的最近邻计算代价是昂贵的。对于高维特征,目前来说最有效的方法是 the randomized k-d forest和the priority search k-means tree,而对于二值特征的匹配 multiple hierarchical clusteringtrees则...
分类:
其他好文 时间:
2014-07-15 10:42:24
阅读次数:
727
一、决策树原理 决策树是用样本的属性作为结点,用属性的取值作为分支的树结构。 决策树的根结点是所有样本中信息量最大的属性。树的中间结点是该结点为根的子树所包含的样本子集中信息量最大的属性。决策树的叶结点是样本的类别值。决策树是一种知识表示形式,它是对所有样本数据的高度概括决策树能准确地识别所有样本的类别,也能有效地识别新样本的类别。 决策树算法ID3的基本思想: 首先找出最有...
分类:
编程语言 时间:
2014-07-14 20:34:04
阅读次数:
391
1.背景 采样算法是机器学习中比较常用,也比较容易实现的(出去分层采样)。常用的采样算法有以下几种(来自百度知道): 一、单纯随机抽样(simple random sampling)
将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。
优点:操作简单,均数、率及相应的标准误计算简单。
缺点:总体较大时,难以一一编号。
二、系统抽样(systemat...
分类:
编程语言 时间:
2014-07-14 18:08:55
阅读次数:
339