#一,自己写KNNdf 0.5, 1, 0) } return(predictions)}#添加预测列df 0)sum(predictions != test.y)#结果是50行预测错了16个点,正确率只有68%,因此结论是如果问题完全不是线性时,K近邻的表现好过GLM#三、以下进行推荐案...
分类:
系统相关 时间:
2015-11-14 16:26:06
阅读次数:
559
基于实例的学习方法中,最近邻法和局部加权回归法用于逼近实值或离散目标函数,基于案例的推理已经被应用到很多任务中,比如,在咨询台上存储和复用过去的经验;根据以前的法律案件进行推理;通过复用以前求解的问题的相关部分来解决复杂的调度问题。基于实例方法的一个不足是,分类新实例的开销可能很大。这是因为几乎所....
分类:
编程语言 时间:
2015-11-10 22:20:38
阅读次数:
343
一、概述 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经....
分类:
编程语言 时间:
2015-11-04 17:18:28
阅读次数:
189
前言 本文是基于Exercise:PCA and Whitening的练习。 理论知识见:UFLDL教程。 实验内容:从10张512*512自然图像中随机选取10000个12*12的图像块(patch),然后对这些patch进行99%的方差保留的PCA计算,最后对这些patch做PCA Whi...
分类:
其他好文 时间:
2015-11-02 16:58:22
阅读次数:
345
前言这节主要是练习下PCA,PCA Whitening以及ZCA Whitening在2D数据上的使用,2D的数据集是45个数据点,每个数据点是2维的。一些matlab函数彩色分散点图函数:scatter(x,y,c,s) x, y为两个矢量,用于定位数据点,s为绘图点的大小,c为绘图所使用的色彩,...
分类:
其他好文 时间:
2015-11-02 13:52:38
阅读次数:
294
数据预处理技术数据清理:空缺值处理、格式标准化、异常数据清除、错误纠正、重复数据的清除数据集成:将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。数据变换:平滑、聚集、规范化、最小 最大规范化等数据归约:维归(删除不相关的属性(维))、数据压缩(PCA,LDA,SVD、小...
分类:
其他好文 时间:
2015-10-28 21:14:34
阅读次数:
546
主题模型(topic modeling)是一种常见的机器学习应用,主要用于对文本进行分类。传统的文本分类器,例如贝叶斯、KNN和SVM分类器,只能将测试对象分到某一个类别中,假设我给出三个分类:“算法”、“网络”和“编译”让其判断,这些分类器往往将对象归到某一类中。但是如果一个外行完全给不出备选类别...
分类:
其他好文 时间:
2015-10-28 20:51:38
阅读次数:
247
数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现:网址:http://blog.csdn.net/yangliuy/article/details/7494983数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAV...
分类:
编程语言 时间:
2015-10-26 13:39:30
阅读次数:
287
具体描述见《统计学习方法》第三章。 1 // 2 // main.cpp 3 // kNN 4 // 5 // Created by feng on 15/10/24. 6 // Copyright © 2015年 ttcn. All rights reserved. 7 //...
分类:
系统相关 时间:
2015-10-25 16:13:26
阅读次数:
237