本人还没有做过自然语言处理,但是基于Deep Learning 的关注,自然也了解了一些Word2vec的强大。
Word2vec 是google 在2013年提供的一款将词表征为实数值向量的高效工具。而Word2vec
输出的词向量可用于做NLP 相关的工作,比如聚类、找同义词、词性分析等。Word2vec 大受欢迎的一个原因是其高效性, Tomas Mikolov 在[1]...
分类:
其他好文 时间:
2014-11-13 16:47:26
阅读次数:
192
K 均值聚类算法 K 均值是典型的基于距离的排他的划分方法:给定一个 n 个对象的数据集,它可以构建数据的 k 个划分,每个划分就是一个聚类,并且 k<=n,同时还需要满足两个要求: 每个组至少包含一个对象 每个对象...
分类:
编程语言 时间:
2014-11-13 14:49:34
阅读次数:
144
目前,SPARK在大数据处理领域十分流行。尤其是对于大规模数据集上的机器学习算法,SPARK更具有优势。一下初步介绍SPARK在linux中的部署与使用,以及其中聚类算法的实现。...
分类:
编程语言 时间:
2014-11-12 21:21:04
阅读次数:
264
rcnn开创性工作,但是计算时间太长,重复计算太大。spp_net将重复计算避免了。hcp是yan shuicheng那边的,是用bing生成regions,然后用normalized cut将这些regions进行聚类,然后将聚类后剩下较小数量的regions进cnn,其实整体思路也是rcnn,只...
分类:
Web程序 时间:
2014-11-10 11:49:03
阅读次数:
250
Clojure数据分析秘笈
目录
1
导入分析数据2
清洗和校验数据3
使用并发编程管理复杂度4
使用并行编程提高性能5
Cascalog6
使用Incanter数据集7
使用Incanter准备并执行数据分析8
使用Mathematica和R9
聚类、分类和使用Weka10
使用Incanter绘图11
创建网页图表
导入分析数据
...
分类:
其他好文 时间:
2014-11-10 10:02:17
阅读次数:
241
Mean Shift,我们 翻译为“均值飘移”。其在聚类,图像平滑。图像切割和跟踪方面得到了比較广泛的应用。因为本人眼下研究跟踪方面的东西,故此主要介绍利用Mean Shift方法进行目标跟踪,从而对MeanShift有一个比較全面的介绍。 (下面某些部分转载常峰学长的“Mean Shift概述”)...
分类:
其他好文 时间:
2014-11-09 16:34:18
阅读次数:
343
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:
编程语言 时间:
2014-11-09 15:08:43
阅读次数:
348
Arcgis for JS扩展GraphicLayer实现区域对象的聚类统计与展示...
分类:
Web程序 时间:
2014-11-06 23:40:46
阅读次数:
502
将一群物理对象或者抽象对象的划分成相似的对象类的过程。其中类簇是数据对象的集合,在类簇中所有的对象都彼此相似,而类簇与类簇之间的对象是彼此相异。聚类除了可以用于数据分割(data segmentation),也可以用于离群点检测(outlier
detection),所谓的离群点指的是与“普通”点相对应的“异常”点,而这些“异常”点往往值的注意。
很多人在学习聚类之初,容易将...
分类:
其他好文 时间:
2014-11-05 13:04:06
阅读次数:
252