本实验的目的是学习和掌握k-均值聚类算法。k-均值算法是一种经典的无监督聚类和学习算法,它属于迭代优化算法的范畴。本实验在MATLAB平台上,编程实现了k-均值聚类算法,并使用20组三维数据进行测试,比较分类结果。实验中初始聚类中心由人为设定,以便于实验结果的比较与分析。...
分类:
其他好文 时间:
2015-06-10 21:02:51
阅读次数:
337
(1)几个简单的入门级函数c(),length(),mode(),rbind(),cbind();R语言的很多函数基本上都能做到见名知义。先及时如下:c():函数c()用于生成一个向量,向量的内容可以是数值,也可以是字符串,甚至可以是向量,但必须是同一种类型;length():用于获取对象的长度;mode():获..
分类:
其他好文 时间:
2015-06-10 01:17:18
阅读次数:
189
作者:iamlaosong
工作表中保存妥投邮件记录,并已根据时限判断该邮件是否及时妥投,及时妥投标记为1,否则为0,及时妥投率的计算公式是:及时妥投率=及时妥投量/妥投邮件总量。统计各城市的邮件及时妥投率,只需要增加一个对标记求和字段,一个计数字段,以二者的比值就可以得到及时妥投率。如下图所示:
可是这样需要三个字段,如果行列是收寄城市和寄达城市的矩阵,中间只有一个字段的位置怎么办?...
分类:
其他好文 时间:
2015-06-09 17:27:00
阅读次数:
101
有n个物品的重量和价值分别是Wi和Vi,从中选出K个物品使得单位重量的价值最大。
最大化平均值的经典,一般最先想到可能的方法是按照单位价值排序,从大到小的进行选取,但是这个方法对于下面一组例子来说:
n=3; k=2; (w,v)=(2,2),(5,3),(2,1);则可能得出的结果是5/7=0.714,所以这个方法是要排除的,那么如何想到最大化平均值这个方向呢?实际上,对于这个问题我们...
分类:
其他好文 时间:
2015-06-08 19:39:40
阅读次数:
104
/// /// 求出数据平均值,并保留三位小数 /// /// 数据集合 /// public static double average(List Valist) { d...
分类:
其他好文 时间:
2015-06-08 17:10:56
阅读次数:
157
简单的举个例子:一张表有两个变量,一个是体重kg,一个是身高cm。假设一般情况下体重这个变量均值为60(kg),身高均值为170(cm)。1,这两个变量对应的单位不一样,同样是100,对于身高来说很矮,但对于体重来说已经是超重了。2,单位越小,数值越大,对结果的影响也越大,譬如170cm=1.7m。...
分类:
其他好文 时间:
2015-06-08 14:50:26
阅读次数:
106
非季节性数据的时间序列分解数据http://robjhyndman.com/tsdldata/misc/kings.dat分析非季节性的数据包含两个组成成分,分别为随机噪声和趋势。为了能使用加性模型(Additive Model)描述非季节性数据的趋势成分,我们使用平滑法(SMA)来计算一个时间序列的移动平均。在使用SMA计算时间序列的移动平均值时,需设定跨度n。R代码library("TTR")...
分类:
其他好文 时间:
2015-06-05 00:50:13
阅读次数:
203
本文章是Matlab图像处理系列的第二篇文章,介绍了空间域图像处理最基本的概念————模版和滤波器,给出了均值滤波起和中值滤波器的Matlab实现,最后简要讨论去躁效果...
分类:
其他好文 时间:
2015-06-05 00:45:36
阅读次数:
2963
题目链接:click here~~
【题目大意】有n个物品的重量和价值分别是Wi和Vi,从中选出K个物品使得单位重量的价值最大,输出物品的编号
【解题思路】:最大化平均值的经典.参见click here~~
代码:
//#include
#include
#include
#include
#include
#include
using namespace std;
const...
分类:
其他好文 时间:
2015-06-04 17:07:06
阅读次数:
270
数据预处理是数据挖掘的重要步骤,数据挖掘者的大部分时间和经历都要花在预处理阶段。数据预处理涉及的策略和技术非常广泛,主要包括如下技术:1)聚集 聚集(Aggregation)就是将两个或多个对象合并为单个对象。一般来说,定量数据通常通过求和或求平均值进行聚集,定性数据通常通过汇总进行聚集。聚集可能....
分类:
其他好文 时间:
2015-06-04 15:11:35
阅读次数:
116