码迷,mamicode.com
首页 >  
搜索关键字:词语    ( 1170个结果
hadoop家族的各个成员
这篇文章不提原理,讲讲hadoop及其周边项目的作用。hadoop这个词已经流行好多年了,一提到大数据就会想到hadoop,那么hadoop的作用是什么呢?官方定义:hadoop是一个开发和执行处理大规模数据的软件平台。核心词语是平台,也就是说我们有大量的数据,又有好几个电脑,我们知道应该把处理数据...
分类:其他好文   时间:2014-07-19 21:30:03    阅读次数:179
Android开发经验之—intent传递大数据
在Activity或者组件之前传递信息时,一般采用intent绑定bundle的方式传值,但在使用过程中需要注意的是不要用bundle传递大容量数据:        在做项目的过程中,需要将听写界面的听写结果信息传递到听写记录界面供显示用,但是由于传递的数据量过大导致程序ANR,甚至直接报异常(传递的信息里面有bitmap转换成的byte数组、每一个词组的拼音、词语、语音信息),经过分析发现是由...
分类:移动开发   时间:2014-07-18 14:05:30    阅读次数:273
Python TF-IDF计算100份文档关键词权重
上一篇博文中,我们使用结巴分词对文档进行分词处理,但分词所得结果并不是每个词语都是有意义的(即该词对文档的内容贡献少),那么如何来判断词语对文档的重要度呢,这里介绍一种方法:TF-IDF。 一,TF-IDF介绍 TF-IDF(Term Frequency–Inverse Document F...
分类:编程语言   时间:2014-07-18 08:30:03    阅读次数:620
Remoting 的“传递的引用”理解
WCf是集大成者,具有其他微软的很多技术,其中分布式上很多借助于Remoting,所以研究一下Remoting有助于理解WCF 提到Remoting就不得不涉及到MarshalByRefObject这个对象,网络上对这个词语的解释非常的模糊不清,特别是说“跨域访问,Remoting是引用传递,不是值...
分类:其他好文   时间:2014-07-16 15:04:12    阅读次数:162
Python 结巴分词
今天的任务是对txt文本进行分词,有幸了解到"结巴"中文分词,其愿景是做最好的Python中文分词组件。有兴趣的朋友请点这里。jieba支持三种分词模式: *精确模式,试图将句子最精确地切开,适合文本分析; *全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; *...
分类:编程语言   时间:2014-07-15 23:14:45    阅读次数:679
Linux下的目录创建命令使用实践
【文章摘要】       本文以实际的C源程序为例子,介绍了Linux下的目录创建命令(mkdir)的使用方法,为相关开发工作的开展提供了有益的参考。【关键词】       C语言  Linux  目录创建  makefile  开发 一、mkdir命令简介        mkdir命令用来创建指定名称的目录,其命令格式为:mkdir [选项] 目录...       其中,[选项]可以是“-m”...
分类:系统相关   时间:2014-07-15 12:56:09    阅读次数:422
一个关于汉字查找的算法的猜想
有没有想过当你按下ctrl+F的时候程序是怎样做到查找你要查找的内容,例如在这篇文章里查询“程序设计”我的猜想是它首先会查找到所有有“程”字的词语,将下标存在一个数组里,在查找,直到把这片文章查完,然后再在含有“序”字的地方,过程同上,然后查“设”字,然后再查“..
分类:其他好文   时间:2014-07-15 10:59:14    阅读次数:178
sphinx
sphinx编译安装:./configure--prefix=/usr/local/sphinx--with-msyql=/usr/local/mysql使用mysql作为数据源静sphinx监听在9312端口,给其他程序提供调用sphinx索引词-->词所对应的文本IDphp请求sphinx一个词语,shpinx去索引检索这个词语所对应的文本ID,然后返回文本ID,p..
分类:其他好文   时间:2014-07-14 11:32:00    阅读次数:259
中文分词实践(基于R语言)
背景:分析用户在世界杯期间讨论最多的话题。 思路:把用户关于世界杯的帖子拉下来,然后做中文分词+词频统计,最后将统计结果简单做个标签云,效果如下 后续:中文分词是中文信息处理的基础,分词之后,其实还有特别多有趣的文本挖掘工作可以做,也是个知识发现的过程,以后有机会再学习下。...
分类:其他好文   时间:2014-07-13 18:53:55    阅读次数:367
linux初体验
第一次听到linux这个‘词语’是在一次偶然的朋友聊天中朋友提到的,之前压根没听到过‘这个东西’,所以我可以说是个linux的新新手,菜鸟都不算。截至到目前,我已经开始linux系统运维学习有差不多10天时间了。在没接触linux之前,我对它的认识仅仅是:它是个计算机系统。决定..
分类:系统相关   时间:2014-07-10 18:09:08    阅读次数:332
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!