码迷,mamicode.com
首页 >  
搜索关键字:tf    ( 1725个结果
tf-idf hadoop map reduce
package com.jumei.robot.mapreduce.tfidf;import java.io.IOException;import java.util.Collection;import java.util.Comparator;import java.util.Map.Entry;...
分类:其他好文   时间:2014-11-28 21:15:21    阅读次数:475
基础知识《二》
目录:一 计算两个字符串之间的相似度二、TF-IDF与余弦相似性的应用(二):找出相似文章一 计算两个字符串之间的相似度本文转载自cscmaker(1)余弦相似性 通过测量两个向量之间的角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。从而两...
分类:其他好文   时间:2014-11-27 21:47:42    阅读次数:304
一行代码设置TForm颜色的前世今生
来自万一的帖子:http://www.cnblogs.com/del/archive/2008/04/27/1173658.html的确做到了一行代码设置颜色的TForm控件。真实的情况是,VCL框架在这个过程中做了大量的工作,经过多次消息的发送,才达到了目的,大致顺序如下:procedure TF...
分类:其他好文   时间:2014-11-24 00:50:13    阅读次数:252
让apache2不开机启动,管理Ubuntu的开机启动项
今天在网上发现了一个很好用的管理Ubuntu下开关启动的软件,叫做sysv-rc-conf使用命令行:tf@ubuntu:/etc/apache2$ sudo update-rc.d -f apache2 remove Removing any system startup links for /e...
分类:Web程序   时间:2014-11-19 10:39:16    阅读次数:194
香蕉派路由功Openwrt、Android功耗对比测试
路由这个东西是要长期通电使用的,所以功耗也是需要关注的。现在香蕉派路由已经有了openwrt和android两个 系统,这两个系统的功耗是否一样呢?     测试工具:QUIGG的德国产功耗测试仪一个、手机充电器一个          香蕉派路由:除网线、调试串口外,没有接任何外部设备,当然TF卡必不可少。没有开启无线      ...
分类:移动开发   时间:2014-11-17 08:05:24    阅读次数:307
TF-IDF算法及其编程实现
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果...
分类:编程语言   时间:2014-11-15 11:31:57    阅读次数:363
自动控制基础MATLAB 2
例3-5num=5*[1 5 6];den=[1 6 10 8];%函数阶跃响应sys0=tf(num,den) step(sys0) %零极点形式的传递函数[z p k]=tf2zp(num,den); sys=zpk(z,p,k) %部分分式展开[r p k]=residue(num,[den ...
分类:其他好文   时间:2014-11-10 23:18:55    阅读次数:261
信息检索的知识点的整理
这里是我整理的一些自己知道的信息检索知识的备忘document: 相当于数据块里的一条记录field: 相当于数据库里的一列term: 指某个field的词,英文单词一般会转词的原型tf:term在field内的词频率函数df:term在全文档集合内的频率函数idf:term在全文档集合内的逆向频率...
分类:其他好文   时间:2014-11-06 01:59:40    阅读次数:174
MSSQL中数据库对象类型解释
public string GetObjectTypeName(object oType){switch (oType+""){case "U":return "用户表";case "V":return "视图";case "P":return "存储过程";case "TF":return "表函...
分类:数据库   时间:2014-11-05 19:00:06    阅读次数:244
搜索相关知识
1,TF-IDF (Term Frequence - Inverse Document Frequency)这个算法用来评价一个词(Term)对整个文档的重要程度,它只考虑了两个因素:(1) 这个词条在本文档中出现的次数是否高 (2) 这个词在所有文档中出现的次数是否高。算法的思想很容易搞懂:在本文...
分类:其他好文   时间:2014-11-02 23:49:24    阅读次数:398
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!