前面的7次笔记介绍的都是分类问题,本次开始介绍聚类问题。分类和聚类的区别在于前者属于监督学习算法,已知样本的标签;后者属于无监督的学习,不知道样本的标签。下面我们来讲解最常用的kmeans算法。
1:kmeans算法
Kmeans中文称为k-均值,步骤为:(1)它事先选定k个聚类中心,(2)然后看每个样本点距离那个聚类中心最近,则该样本就属于该聚类中心。(3)求每个聚类中心的样本...
分类:
其他好文 时间:
2014-09-09 16:17:19
阅读次数:
234
据调查,网页大小在2013年平均增长了32%,平均达到了1.7M,单独的HTTP请求达到96个。这是令人震惊的数字,而且这只是个平均值,有一半的网站会大于这个值。网站也得了肥胖症,而我们这些开发者就是罪魁祸首。
分类:
其他好文 时间:
2014-09-09 12:19:58
阅读次数:
147
来源:http://www.imooc.com/code/1677小伙伴们,请根据所学知识,参考注释,在代码编辑器中补充代码,完成JAVA 程序,实现输出数组中的最大值、最小值和平均值运行效果:任务任务要求:1、定义一个整型数组,并赋初值 61, 23, 4, 74, 13, 148, 202、定义...
分类:
移动开发 时间:
2014-09-07 23:39:55
阅读次数:
407
据调查,网页大小在2013年平均增长了32%,平均达到了1.7M,单独的HTTP请求达到96个。这是令人震惊的数字,而且这只是个平均值,有一半的网站会大于这个值。网站也得了肥胖症,而我们这些开发者就是罪魁祸首。 一个超重的网站会对你产生如下影响: 1. 网站代码越多,用户下载的就越多,加载速度就.....
分类:
其他好文 时间:
2014-09-07 21:08:35
阅读次数:
253
据调查,网页大小在2013年平均增长了32%,平均达到了1.7M,单独的HTTP请求达到96个。这是令人震惊的数字,而且这只是个平均值,有一半的网站会大于这个值。网站也得了肥胖症,而我们这些开发者就是罪魁祸首。 一个超重的网站会对你产生如下影响: 1. 网站代码越多,用户下载的就越多,加载速度就.....
分类:
其他好文 时间:
2014-09-07 15:57:55
阅读次数:
188
//写个简单的先练习一下,测试通过//k-均值聚类算法C语言版 #include #include #include #include #define TRUE 1 #define FALSE 0 int N;//数据个数 int K;//集合个数 int...
分类:
其他好文 时间:
2014-09-05 21:07:42
阅读次数:
184
本题要求编写程序,计算4个整数的和与平均值。题目保证输入与输出均在整型范围内。输入格式: 输入在一行中给出4个整数,其间以空格分隔。输出格式: 在一行中按照格式“Sum = 和; Average = 平均值”顺序输出和与平均值,其中平均值精确到小数点后1位。输入样例:1 2 3 4输出样例:Sum ...
分类:
其他好文 时间:
2014-09-05 17:56:01
阅读次数:
260
awk是一个非常棒的数字处理工具。相比于sed常常作用于一整行的处理,awk则比较倾向于将一行分为数个“字段”来处理。运行效率高,而且代码简单,对格式化的文本处理能力超强。先来一个例子: 文件a,统计文件a的第一列中是浮点数的行的浮点数的平均值。用awk来实现只需要一句话就可以搞定$cat a1.....
分类:
其他好文 时间:
2014-09-05 02:09:50
阅读次数:
195
TBOX的线程池通过在每个worker中批量一次拉取多个task,对锁的竞争进行了优化。
由于每个task的函数实现不会太多,所以可以根据每个task的函数地址做hash,统计出每个task执行所花费的平均时间。然后根据这个平均值来动态计算每个worker一次拉取的task的数量,TBOX里面...
分类:
编程语言 时间:
2014-09-02 11:55:44
阅读次数:
223
链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=4736
题意:有最多10000次操作,在一个初始为空的数列中添加或移除元素并保持数列有序,每次操作后,如果数列个数为奇数就输出中间值,如果为偶数就输出中间两个值得平均值。
思路:刚开始写了一发multiset模拟,看吴琦TLE了估计他也是multiset写的,就...
分类:
其他好文 时间:
2014-09-01 17:56:43
阅读次数:
226