码迷,mamicode.com
首页 >  
搜索关键字:iso 聚类    ( 7861个结果
FastDateFormat
1 public static final FastDateFormat ISO_DATE_FORMAT = FastDateFormat.getInstance("yyyy-MM-dd"); 上面的final 字段代表一个不可变的FastDateFormat,然而要让FastDateFormat....
分类:其他好文   时间:2014-07-07 12:23:31    阅读次数:274
利用LDA进行文本聚类(hadoop, mahout)
项目原理概述利用sqoop将数据从MySQL导入到HDFS中,利用mahout的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。数据流向图如下mahout算法分析输入数据格式为的matrix矩阵,key为待聚类文本的数字编号,value为待聚类文本的单词向量Vector, Vector...
分类:其他好文   时间:2014-07-07 10:43:16    阅读次数:1186
openStack工具集
Openstack发展很猛,很多朋友都很认同,2013年,会很好的解决OpenStack部署的问题,让安装,配置变得更加简单易用。很多公司都投入人力去做这个,新浪也计划做一个Openstack的iso,集成OS,当你决定去做这个的时候,那么先了解一下目前的现状。说到部 署,肯定和OS有关,对于Ope...
分类:其他好文   时间:2014-07-07 10:14:02    阅读次数:737
0长度数组的使用
0长度的数组在ISO C和C++的规格说明书中是不允许的,但是GCC的C99支持的这种用法。GCC对0长度数组的文档参考:“Arrays of Length Zero”如下代码片段,哪个更简洁更灵活,看一眼就知道了:#include #include typedef struct tagArray....
分类:其他好文   时间:2014-07-07 08:25:56    阅读次数:235
C99标准的新特性
C语言标准的发展C语言的发展历史大致上分为4个阶段:Old Style C、C89、C99和C11.C89是最早的C语言规范,于1989年提出,1990年先由ANSI(美国国家标准委员会,American National Standards Institute)推出ANSI版本,后来被接纳为ISO...
分类:其他好文   时间:2014-07-07 00:01:21    阅读次数:559
用python计算lda语言模型的困惑度并作图
转载请注明:电子科技大学EClab——落叶花开http://www.cnblogs.com/nlp-yekai/p/3816532.html困惑度一般在自然语言处理中用来衡量训练出的语言模型的好坏。在用LDA做主题和词聚类时,原作者D.Blei就是采用了困惑度来确定主题数量。文章中的公式为:perp...
分类:编程语言   时间:2014-07-02 18:03:38    阅读次数:827
聚类相关
归一化:可以将大量重复特征聚合为单一特征,降低重复带来的相似度差异。方法: Vx = Vx /abs(v1)+...abs(Vn)词干处理:(变形词,同意词,近义词聚合) 减少特征的重复性 imaging-images buy-bought 我-俺 早餐-早饭.......停用词:(弱特征)大量出现的没有实际特征意义的虚词,副词,语气词等  I ,am, is ,a,an,always 我,啊,了...
分类:其他好文   时间:2014-07-02 10:41:28    阅读次数:267
EM算法原理
在聚类中我们经经常使用到EM算法(i.e. Estimation - Maximization)进行參数预计, 在该算法中我们通过函数的凹/凸性,在estimation和maximization两步中迭代地进行參数预计,并保证能够算法收敛,达到局部最优解。PS:为了不在11.11这个吉祥的日子发bl...
分类:其他好文   时间:2014-07-02 09:56:51    阅读次数:234
<Autel>汽车诊断基础知识
汽车诊断器,属于车载电子,用于汽车后市场。它是诊断分析系统。汽车诊断系统,主要是ECU(电子控制单元)、传感器和执行单元组成。汽车诊断器,主要是解释分析ECU中信息。初级是诊断故障码,高级是编程设码来清除码。它是在主板上诊断(OBD),通过灯的闪烁显示出来。在汽车诊断协议中,有ISO国际标准...
分类:其他好文   时间:2014-07-01 11:59:32    阅读次数:154
我写过的软件之FileExpert
公司要做一个项目,跟MP4有点关系,到网上找了规范文档看了看,理解还是不够深入。干脆花点时间做一个Parser,取名FileExpert,目前只支持解析ISO_IEC_14496-12的文件格式。取名成FileExpert的原因是因为想把它做成一个比较通用的框架,以后可以用于解析其他格式的文件。(以前曾经想过做一个小工具,解析一下PE文件格式。) MP4文件就是一个个的box组合成的,b...
分类:其他好文   时间:2014-07-01 11:34:14    阅读次数:148
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!