TF-IDF(termfrequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著.....
分类:
其他好文 时间:
2015-09-01 16:36:39
阅读次数:
305
转自: http://lutaf.com/210.htm Lucene在进行关键词查询的时候,默认用TF-IDF算法来计算关键词和文档的相关性,用这个数据排序 TF:词频,IDF:逆向文档频率,TF-IDF是一种统计方法,或者被称为向量空间模型,名字听起来很复杂,但是它其实只包含了两个简单规则 某个...
分类:
Web程序 时间:
2015-08-30 19:09:12
阅读次数:
166
稍微用脑子想了一下,图形控件没有句柄,因此先把自己的坐标改一改,然后只要把父控件的某些区域Invalidate一下就可以了,WM_PAINT消息一来,父控件就会重绘所有子图形控件,就达到了相应的效果。怪不得没看到调用SetWindowPos这样的函数。有空详细跟踪一下。举例:procedure TF...
分类:
其他好文 时间:
2015-08-28 19:26:46
阅读次数:
144
英文分词的算法和原理 根据文档相关性计算公式 TF-IDF:http://lutaf.com/210.htm BM25:http://lutaf.com/211.htm 分词质量对于基于词频的相关性计算是无比重要的 英文(西方语言)语言的基本单位就是单词,所以分词...
分类:
编程语言 时间:
2015-08-17 06:35:08
阅读次数:
273
/*
*
*/
import java.awt.*;
import java.awt.event.*;
public class MouseAndEvent {
private Frame f;
private Button but;
private TextField tf;
MouseAndEvent()
{
init();
}
//对图形化界面进行初始化。...
分类:
编程语言 时间:
2015-08-13 22:23:05
阅读次数:
217
为了搞清楚elastic search背后是如何计算文档搜索时候的相关度,我决定自己做实验去探索
这篇博客讲得还不错
http://blog.csdn.net/dm_vincent/article/details/42099063
而博客本身也只是翻译了官方文档
https://www.elastic.co/guide/en/elasticsearch/guide/current/scori...
分类:
其他好文 时间:
2015-08-13 01:12:19
阅读次数:
216
前言:
本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源:http://download.csdn.net/detail/solomon1558/8971649
第3章通过词袋模型+K均值聚类实现...
分类:
其他好文 时间:
2015-08-12 23:40:54
阅读次数:
206
tartar -cvf filename #打包 ,*.tar后缀名tar -tf filename.tar #查看包的内容tar -xvf filename。tar #解包tar -c dir filename。tar#指定解包路径
分类:
系统相关 时间:
2015-08-11 18:23:38
阅读次数:
118
解决上一篇的问题,上代码了。 C 语言程序的入口为 main 函数,Lua 编译器的入口为 luac.c 文件里的 main 函数。 先来看一下 main 函数: int?main(int?argc,?const?char*?argv[])
{
?Proto**?P,*tf;
?i...
分类:
其他好文 时间:
2015-08-10 15:04:31
阅读次数:
122
下载链接百度网盘(提取码:bi9f)使用说明TF卡或U盘先在车机上初始化,然后插入电脑,打开音乐e栈PC端。用管理员身份运行程序。点击“Start Crack!”按钮。在音乐e栈客户端上,打开充值界面,卡号密码随便填。点击确定,不出意外的话,即会提示充值成功,并且服务有效期也延长了99天。可以随意下...
分类:
其他好文 时间:
2015-08-07 13:02:09
阅读次数:
392