K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:
其他好文 时间:
2014-05-26 06:00:31
阅读次数:
239
#!/usr/bin/python
# -*- coding: utf-8 -*-
#6–5. 字符串
# (a)更新你在练习2-7 里面的方案,使之可以每次向前向后都显示一个字符串的一个字符.
# (b)通过扫描来判断两个字符串是否匹配(不能使用比较操作符或者cmp()内建函数)。
# 附加题:在你的方案里加入大小写区分.
# (c)判断一个字符串是否重现(后面跟...
分类:
编程语言 时间:
2014-05-26 05:45:39
阅读次数:
420
线段树的单点更新,区域查询操作。
#include
#include
#include
#include
#include
using namespace std;
#define lmin 1
#define rmax n
#define lson l,(l+r)/2,rt<<1
#define rson (l+r)/2+1,r,rt<<1|1
#define root lmin,rmax,1...
分类:
其他好文 时间:
2014-05-26 05:25:50
阅读次数:
187
【译者:这个系列教程是以Kitware公司出版的《VTK User’s Guide -11th edition》一书作的中文翻译(出版时间2010年,ISBN: 978-1-930934-23-8),由于时间关系,我们不能保证每周都能更新本书内容,但尽量做到一周更新一篇到两篇内容。敬请期待^_^。欢迎转载,另请转载时注明本文出处,谢谢合作!同时,由于译者水平有限,出错之处在所难免,欢迎指出订正!】...
分类:
其他好文 时间:
2014-05-26 05:24:30
阅读次数:
161
html dom与xml dom关系:
什么是 DOM?
DOM 是 W3C(万维网联盟)的标准。
DOM 定义了访问 HTML 和 XML 文档的标准:
“W3C 文档对象模型 (DOM) 是中立于平台和语言的接口,它允许程序和脚本动态地访问和更新文档的内容、结构和样式。”
W3C DOM 标准被分为 3 个不同的部分:
核心 DOM - 针对任何结构化文档的标准模型
XM...
分类:
Web程序 时间:
2014-05-26 04:51:28
阅读次数:
331
在Qualnet里添加了一个应用层协议,编译完全通过,但在运行时总是在63s内存读取错误。可以肯定是路由表更新处指针调用错误了.为了定位错误,最可靠的办法就是使用VS进行调试。但按照官方手册设置调试时,却出现了如下错误信息:
'qualnet.exe': Loaded 'C:\snt\qualnet\5.0\bin\qualnet.exe', Symbols loaded.
'qualnet....
分类:
Web程序 时间:
2014-05-26 04:11:21
阅读次数:
438
flag[i]:标记i这个区间的值。
val[i]:i这个区间的长度
#include
#include
#include
#include
#include
using namespace std;
#define INF 99999999
#define lmin 1
#define rmax n
#define lson l,(l+r)/2,rt<<1
#define rson (l+r...
分类:
其他好文 时间:
2014-05-26 03:37:19
阅读次数:
203
CREATE INDEX 语句
CREATE INDEX 语句用于在表中创建索引。
在不读取整个表的情况下,索引使数据库应用程序可以更快地查找数据。
索引
您可以在表中创建索引,以便更加快速高效地查询数据。
用户无法看到索引,它们只能被用来加速搜索/查询。
注释:更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想...
分类:
数据库 时间:
2014-05-24 22:21:22
阅读次数:
377
本人觉得有了这个更新,Qt Creator可谓几乎没有缺点了,起码仅仅开发C/C++,是不用再去安装VS了。Qt 5.3放出,更新无数,具体参考:http://qt-project.org/wiki/New-Features-in-Qt-5.3有一个功能,属于超级好的改进了,就是C++控制台程序的输出,不再是弹出一个CMD,执行程序,而是直接在应用程序输出结果:这个修改,让我振奋不已,以前弹出CM...
分类:
编程语言 时间:
2014-05-24 19:35:37
阅读次数:
411
线段树的区域更新,然后单点查询。
x1 x2 c:区域更新x1-x2为c。
全部染色之后,从0-8000依次查询每个点的颜色。然后存贮每一种颜色有几块。
#include
#include
#include
#include
#include
using namespace std;
#define lmin 0
#define rmax 8000
#define lson l,(l+r)/...
分类:
其他好文 时间:
2014-05-24 19:10:12
阅读次数:
221