//数据挖掘&机器学习实践1.简单的手写数字识别原理:可以先通过多次手写的图片生成训练集,然后利用knn就行了……代码如下(下面代码需要安装PIL/numpy库,PIL安装有点坑==官方的貌似还有点问题。。。) 1 //knn.py 2 from numpy import * 3 import...
分类:
其他好文 时间:
2015-10-22 14:09:20
阅读次数:
437
识别: 不是分类问题!!一方面,“类”很多,一“类”的数据特别少。显然用分类类解决出现问题。一个可能并且直观的想法是:KNN。但是,我们知道,KNN算法一般对于数据少的时候可以解决问题,数据量大了就会出现问题了。1)训练 于是,我们尝试从另一个角度突破。训练时,存在一个映射,我们希望输入两幅照片.....
分类:
其他好文 时间:
2015-10-19 20:40:56
阅读次数:
144
数据计算和结果展示一直是数据挖掘领域的难点,一般情况下,数据都拥有超过三维,维数越多,处理上就越吃力。所以,采用降维技术对数据今夕简化一直是数据挖掘工作者感兴趣的方向。对数据进行简化的好处:使得数据集更易于使用,降低很多算法的计算开销,去除噪声,使得结果易懂。主成分分析法(PCA)是一种常用的降维技...
分类:
其他好文 时间:
2015-10-14 23:44:00
阅读次数:
252
《zw版·Halcon-delphi系列原创教程》 Halcon分类函数002·AI人工智能AI人工智能:包括knn、gmm、svm等为方便阅读,在不影响说明的前提下,笔者对函数进行了简化::: 用符号“**”,替换:“procedure”:: 用大写字母“X”,替换:“IHUntypedObjec...
PCA: PCA的具有2个功能,一是维数约简(可以加快算法的训练速度,减小内存消耗等),一是数据的可视化。 PCA并不是线性回归,因为线性回归是保证得到的函数是y值方面误差最小,而PCA是保证得到的函数到所降的维度上的误差最小。另外线性回归是通过x值来预测y值,而PCA中是将所有的x样本都同等...
分类:
其他好文 时间:
2015-10-09 21:25:03
阅读次数:
185
应用kNN算法预测豆瓣电影用户的性别摘要本文认为不同性别的人偏好的电影类型会有所不同,因此进行了此实验。利用较为活跃的274位豆瓣用户最近观看的100部电影,对其类型进行统计,以得到的37种电影类型作为属性特征,以用户性别作为标签构建样本集。使用kNN算法构建豆瓣电影用户性别分类器,使用样本中的90...
分类:
编程语言 时间:
2015-10-07 12:04:53
阅读次数:
498
本文实现基于SVD奇异矩阵分解的PCA主成分分析,使用该算法来完成对人脸图像的识别,主要讲解SVD实现PCA的原理,如何利用SVD实现图像特征的降维,以及SVD在文本聚类方面的使用,例如弱化同义词、多...
分类:
其他好文 时间:
2015-10-04 01:39:04
阅读次数:
331
input_data = rand(1000,3);%随机生成1000个样本,每个样本有x,y,z三个属性 figure(1);%控制画图的窗口为1 hold off;%使当前轴和图形不再具备被刷新的性质,关闭在此基础上再画图 plot3(input_data(:,1), input_d...
分类:
其他好文 时间:
2015-10-03 23:18:47
阅读次数:
1471
PCA的数学原理PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的...
分类:
其他好文 时间:
2015-10-02 19:57:54
阅读次数:
259