带固定精度和小数位数的数值数据类型。decimal(p[ ,s]) 和 numeric(p[ ,s])固定精度和小数位数。 使用最大精度时,有效值的范围为 - 10^38 +1 到 10^38 - 1。 decimal 的 ISO 同义词为 dec 和 dec(p、s)。 numeric 在功能上等...
分类:
数据库 时间:
2015-04-17 20:20:14
阅读次数:
172
windows制作iso文件通过ultraiso可以实现。linux下用mkisofs这个命令就可以最简单的用法mkisofs -o target.iso source要制作可以启动的iso文件用如下命令mkisofs -r -J -T -V "Custom RHEL4 Build" -o /c5....
分类:
系统相关 时间:
2015-04-17 19:48:47
阅读次数:
192
char[ (n) ]固定长度,非 Unicode 字符串数据。n用于定义字符串长度,并且它必须为 1 到 8,000 之间的值。存储大小为n字节。char的 ISO 同义词为character。varchar[ (n|max) ]可变长度,非 Unicode 字符串数据。n用于定义字符串长度,并且...
分类:
其他好文 时间:
2015-04-17 19:46:32
阅读次数:
128
聚类查询所针对的对象是表的其中一列,譬如如下的testtable表,要查出username这一列中,各个项所出现的次数,则用到聚类查询
显然,聚类查询之后,得到的结果必须与id,number这两列半点关系都没有。因此,也就是正如上门,所说,聚类查询所针对的对象是表的其中一列。
聚类查询往往配合count(*),sum(*),avg(*)等聚类语句,用来对表进行统计。由于查询的字段往往是...
分类:
数据库 时间:
2015-04-17 13:59:17
阅读次数:
287
K-means算法属于无监督学习聚类算法,其计算步骤还是挺简单的,思想也挺容易理解,而且还可以在思想中体会到EM算法的思想。K-means 算法的优缺点:
1.优点:容易实现
2.缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢
使用数据类型:数值型数据以往的回归算法、朴素贝叶斯、SVM等都是有类别标签y的,因此属于有监督学习,而K-means聚类算法只有x,没有y在聚类问题中,我们的...
分类:
编程语言 时间:
2015-04-17 13:54:08
阅读次数:
162
前面我们在是实现K-means算法的时候,提到了它本身存在的缺陷:
1.可能收敛到局部最小值
2.在大规模数据集上收敛较慢
对于上一篇博文最后说的,当陷入局部最小值的时候,处理方法就是多运行几次K-means算法,然后选择畸变函数J较小的作为最佳聚类结果。这样的说法显然不能让我们接受,我们追求的应该是一次就能给出接近最优的聚类结果。其实K-means的缺点的根本原因就是:对K个质心的初始选...
分类:
编程语言 时间:
2015-04-17 13:52:12
阅读次数:
357
基本知识:算法标签:聚类、贪心、划分算法算法目标:使得簇尽可能紧凑和独立(低耦合,高聚合)评价准则:所有对象的误差平方和算法复杂度:O(nkt),n是样本数目,k是簇数,t是迭代次数算法限制:簇的均值是有定义的(标称属性无法计算均值,此时可以改用k众数)算法缺点:k值需给定,初始点选择对算法有影响,...
分类:
其他好文 时间:
2015-04-17 09:38:08
阅读次数:
130
地理信息空间参考大体可以分为两类,ISO给出了分类:Spatial referencing by geographical identifiers(根据地理标识符的空间定位,ISO 19112)与Spatial referencing by coordinates(根据坐标的空间定位,ISO 191...
分类:
其他好文 时间:
2015-04-16 12:11:07
阅读次数:
125
在使用mahout之前要安装并启动hadoop集群将mahout的包上传至linux中并解压即可mahout下载地址:点击打开链接mahout中的算法大致可以分为三大类:聚类,协同过滤和分类其中常用聚类算法有:canopy聚类,k均值算法(kmeans),模糊k均值,层次聚类,LDA聚类等常用分类算...
分类:
编程语言 时间:
2015-04-15 21:13:03
阅读次数:
170
canopy是聚类算法的一种实现它是一种快速,简单,但是不太准确的聚类算法canopy通过两个人为确定的阈值t1,t2来对数据进行计算,可以达到将一堆混乱的数据分类成有一定规则的n个数据堆由于canopy算法本身的目的只是将混乱的数据划分成大概的几个类别,所以它是不太准确的但是通过canopy计算出...
分类:
编程语言 时间:
2015-04-15 21:00:35
阅读次数:
230