1. 现在手机一般都是有内置的一个sd卡,也提供了外置的内存卡插槽,TF卡。Environment.getExternalStorageDirectory().getAbsoluteFile()获取的是手机内置的sd卡路径。如果要获取外置TF卡路径,百度上面的各种复杂。最简单的方:Environme...
分类:
其他好文 时间:
2015-06-23 19:50:35
阅读次数:
150
FastDFS是一款类GoogleFS的开源分布式文件系统,它用纯C语言实现,支持Linux、FreeBSD、AIX等UNIX系统。它只 能通过专有API对文件进行存取访问,不支持POSIX接口方式,不能mount使用。准确地讲,GoogleFS以及FastDFS、 mogileFS、HDFS、TF...
分类:
其他好文 时间:
2015-06-18 18:38:48
阅读次数:
167
BM25算法的全称是 Okapi BM25,是一种二元独立模型的扩展,也可以用来做搜索的相关度排序。Sphinx的默认相关性算法就是用的BM25。Lucene4.0之后也可以选择使用BM25算法(默认是TF-IDF)。如果你使用的solr,只需要修改schema.xml,加入下面这行就可以BM25也...
分类:
编程语言 时间:
2015-06-15 18:15:05
阅读次数:
409
Lucene在进行关键词查询的时候,默认用TF-IDF算法来计算关键词和文档的相关性,用这个数据排序TF:词频,IDF:逆向文档频率,TF-IDF是一种统计方法,或者被称为向量空间模型,名字听起来很复杂,但是它其实只包含了两个简单规则某个词或短语在一篇文章中出现的次数越多,越相关整个文档集合中包含某...
分类:
编程语言 时间:
2015-06-15 18:03:03
阅读次数:
199
UITextField *tf=[[UITextField alloc]initWithFrame:CGRectMake(40,60,240,40)];tf.placeholder=@"请输入账号";//给提示框加一个提示语tf.borderStyle=UITextBorderStyleRounde...
分类:
其他好文 时间:
2015-06-12 16:53:03
阅读次数:
77
刚拿到MiZ702,就被他的“外貌”深深的吸引,核心板加底板的形式让她看上去,强大而神秘~~ 华丽的外表之下是否有着与之相当的内含呢,我们拿Linux将其检验一番! 板载的TF卡里已经为我们准备好了,启动文件,以及镜像文件。只要打开电源Linux就可以在MiZ702上流畅运行。在按下电源键之前,我们...
分类:
系统相关 时间:
2015-06-11 09:23:29
阅读次数:
481
批量解锁源代码管理器的文件命令如下:Tf undo /workspace:ZHANGLIXIN-PC;zhanglei262 /Collection:http://10.124.3.18:8080/tfs/cBSSCollection /recursive "$/IT集中研发管理系统/01需求管理/...
分类:
其他好文 时间:
2015-06-09 19:33:35
阅读次数:
80
jar: java的压缩包,主要用于存储类文件,或者配置文件等。命令格式: jar -cf 包名.jar 包目录解压缩: jar -xvf 包名.jar将jar包目录列表重定向到一个文件中: jar -tf 包名.jar > c:\目录.txt 复制去Google翻译翻译结果
分类:
编程语言 时间:
2015-06-06 11:54:31
阅读次数:
150
1. TF-IDF的误区
TF-IDF可以有效评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。因为它综合表征了该词在文档中的重要程度和文档区分度。但在文本分类中单纯使用TF-IDF来判断一个特征是否有区分度是不够的。
1)它没有考虑特征词在类间的分布。也就是说该选择的特征应该在某类出现多,而其它类出现少,即考察各类的文档频率的差异。如果一个特征词,在各个类间分布比较均匀...
分类:
其他好文 时间:
2015-06-04 19:27:23
阅读次数:
1273
(一)LDA作用 传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的。 举个例子,有两个句子分别如下: “乔布斯离我们而去了。” “苹果...
分类:
其他好文 时间:
2015-06-02 12:54:29
阅读次数:
143