//将字符转换为Unicode码中字符对应十进制数字int byte0 = 'A' & 0xff;//byte0=65参考文档:http://baike.baidu.com/view/2602518.htm http://blog.idf.cn/2014/02/unicode-isnt-har...
分类:
其他好文 时间:
2015-01-11 20:23:10
阅读次数:
207
set_charset('utf8'); $cws->set_duality(true); $cws->set_ignore(true); $cws->set_multi(false); $cws->send_text($text); $idf = array(); ...
分类:
其他好文 时间:
2015-01-08 12:45:15
阅读次数:
798
前天花了一个下午的时间刷了几道IDF实验室的题目, 这个网站实在是有点冷清, 题目也比较少, 所以就被我和师兄们刷榜了2333...因为我最先开始做, 所以就干脆刷到第一去了.题目很水, 切莫见怪.牛刀小试http://ctf.idf.cn/index.php?g=game&m=list&a=ind...
分类:
其他好文 时间:
2015-01-02 06:26:33
阅读次数:
5415
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
根据过滤子集来提升(Boosting Filtered Subsets)
回到在忽略TF/IDF(Ignoring TF/IDF)中处理的那个问题,我们需要根据每个度假酒店拥有的卖点数量来对它们的相关度分值进行计算。我们希望利用缓存的过滤器来影响分值,而function_...
分类:
其他好文 时间:
2014-12-28 00:34:32
阅读次数:
323
Josef和Andrew在2003年的ICCV上发表的论文[10]中,将文档检索的方法借鉴到了视频中的对象检测中。他们首先将图像的特征描述类比成单词,并建立了基于SIFT特征的vusual word dictionary,结合停止词、TF-IDF和余弦相似度等思想检索包含相同对象的图像帧,最后基于局...
分类:
其他好文 时间:
2014-12-27 06:40:23
阅读次数:
326
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
忽略TF/IDF
有时我们不需要TF/IDF。我们想知道的只是一个特定的单词是否出现在了字段中。比如我们正在搜索度假酒店,希望它拥有的卖点越多越好:
WiFi花园(Garden)泳池(Pool)
而关于度假酒店的文档类似下面这样:
{ "descript...
分类:
其他好文 时间:
2014-12-26 01:02:19
阅读次数:
342
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
Lucene中的Practical Scoring Function
对于多词条查询(Multiterm Queries),Lucene使用的是布尔模型(Boolean
Model),TF/IDF以及向量空间模型(Vector
Space Model)来将它们结合...
分类:
Web程序 时间:
2014-12-24 11:53:03
阅读次数:
273
发现一个学CTF的好地方,IDF实验室的CTF训练营。。
刚接触CTF,来玩下牛刀小试,AK了。。好爽好爽。。
1、摩斯密码
嘀嗒嘀嗒嘀嗒嘀嗒 时针它不停在转动
-- --- .-. ... .
嘀嗒嘀嗒嘀嗒嘀嗒 小雨它拍打着水花
-.-. --- -.. .
——>>题目是摩斯密码,搜索下“摩斯密码”,发现了嘀(.)嗒(-)和英文字...
分类:
其他好文 时间:
2014-12-21 11:33:14
阅读次数:
266