一、中文分词:分词就是利用计算机识别出文本中词汇的过程。
1.典型应用:汉字处理:拼音输入法、手写识别、简繁转换 ;信息检索:Google 、Baidu ;内容分析:机器翻译、广告推荐、内容监控
;语音处理:语音识别、语音合成 。 2.分词难点:歧义、新词等。 3.分词技术:机械分词(查词典FMM/...
分类:
其他好文 时间:
2014-06-07 06:04:35
阅读次数:
511
下面内容摘自互联网并作了整理。名词:BI(Business
Intelligence):商业智能,DW(Data Warehouse):数据仓库,详见正文Q1部分。OLTP(On-Line Transaction
Processing):联机事务处理也称为面向交易的处理系统,其基本特征是顾客的原始数...
分类:
其他好文 时间:
2014-06-07 05:32:53
阅读次数:
263
声明:
1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究。2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好)。如不清楚配置可看《Hadoop之词频统计小实验初步配置》3)本文由于过长,无法一次性上传。下面是五个部分....
分类:
其他好文 时间:
2014-06-07 02:55:09
阅读次数:
178
关键词Assembly使用Assembly定义和加载程序集,加载在程序集清单中列出模块,以及从此程序集中查找类型并创建该类型的实例。Module通过它可以获取包含模块的程序集以及模块中的类等,还可以获取在模块上定义的所有全局方法或其他特定的非全局方法。MemberInfo这是一个基类,它定义了Eve...
分类:
其他好文 时间:
2014-06-07 02:47:49
阅读次数:
258
声明:
1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究。2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好)。如不清楚配置可看《Hadoop之词频统计小实验初步配置》3)本文由于过长,无法一次性上传。其相邻相关的博....
分类:
其他好文 时间:
2014-05-30 13:26:48
阅读次数:
538
声明:
1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究。2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好)。如不清楚配置可看《Hadoop之词频统计小实验初步配置》3)本文由于过长,无法一次性上传。其相邻相关的博....
分类:
其他好文 时间:
2014-05-30 13:25:19
阅读次数:
400
一、概念:微博中经常会有些词被一起提及,如:郭美美VS红会,表哥VS房叔;超市为提高销售额,会把用户经常买的物品放在一起。
a)Apriori算法: 频繁项集产生强关联规则: b)FP-树进行频繁模式挖掘: *Partition-based Projection: *比较:
分类:
其他好文 时间:
2014-05-29 07:58:22
阅读次数:
370
"3S"技术是英文遥感技术(Remote Sensing
RS)、地理信息系统(Geographical information System GIS)、全球定位系统(Global Positioning System
GPS)这三种技术名词中最后一个单词字头的统称。人类有一个梦想,就是想只用一种方...
分类:
其他好文 时间:
2014-05-28 21:13:51
阅读次数:
325
GPU 的硬件基本概念Nvidia的版本: 实际上在 nVidia 的 GPU
里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVidia 的 GPU 里,会有非常多的 SP 可以同时做计算;而数个
SP 会在附加一些其他单元,一起组成一个 SM(Strea....
分类:
其他好文 时间:
2014-05-28 18:59:32
阅读次数:
292
序:关于标题:
说是教学,实在愧不敢当,但苦与本人文笔有限,实在找不到更合理,谦逊的词语表达,只能先这样定义了。
其实最真实的想法,只是希望这个关键词能让更多的人浏览到这篇文章,也算是对于自己写文章的一个肯定吧。^_^!关于内容:
再写这系列文章之前,本人和许多人一样都是伸手党,并深深的了解咱...
分类:
编程语言 时间:
2014-05-28 09:55:46
阅读次数:
583