从外部看协同过滤 从互联网上寻找有用的信息越来越难,这催生了三类方法:信息检索、信息过滤和推荐系统。信息检索是指Google、百度这样的搜索引擎,这是一种被动的方式;信息过滤是指先对信息进行分类,再根据用户的偏好进行过滤,比如我们注册知乎/豆瓣/微博等时都会要求选择感兴趣的领域,之后会对我们选定领域...
分类:
其他好文 时间:
2014-08-24 01:32:51
阅读次数:
196
#javascript状态机及在工作流中的应用##状态机什么叫状态机(Finite State Machine),书面上的解释可以自己借助搜索引擎寻找到。通俗地来讲是一个状态定义、查找与切换等一系列的代码的集合。与之对应的设计模式叫状态机模式,常用于游戏编程,而在工作流的应用中也会用到。在工作流中,...
分类:
编程语言 时间:
2014-08-24 00:16:41
阅读次数:
275
Solr(http://lucene.apache.org/solr),Apache Lucene项目的子项目,是一个基于Lucene的Java搜索引擎服务器。
Solr 包装并扩展了 Lucene,所以Solr的基本上沿用了Lucene的相关术语,更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容,通过对Solr 进行适当的配置,某些情况下可能需要进行编码,Solr
可以...
分类:
其他好文 时间:
2014-08-23 20:25:01
阅读次数:
395
找做IT的男朋友会不会没有隐私你不觉得自己在网上不断的“秀”啊,“晒”啊的行为才是根本所在吗?你应该怕自己的这种行为才对吧~———————————————————————————————————————————其实得到你的信息并不一定需要高手。普通人直接使用搜索引擎就可以找到很多不注重网络隐私的人的...
分类:
其他好文 时间:
2014-08-23 20:16:31
阅读次数:
247
禁止搜索引擎收录的方法(robots.txt)一、什么是robots.txt文件?搜索引擎通过一种程序robot(又称spider),自己主动訪问互联网上的网页并获取网页信息。您能够在您的站点中创建一个纯文本文件robots.txt,在这个文件里声明该站点中不想被robot訪问的部分,这样,该站点的...
分类:
其他好文 时间:
2014-08-23 11:19:10
阅读次数:
338
为了不让搜索引擎索引网站的后台页面或其它隐私页面,我们将这些路径在robots.txt文件中禁用了。但矛盾的是,robots.txt文件任何人都可以访问,包括黑客。为了禁止搜索引擎,我们把隐私泄露给了黑客。 robots.txt干什么的?robots.txt基本上每个网站都用,而且放到了网站的根目录...
分类:
Web程序 时间:
2014-08-22 17:42:09
阅读次数:
189
在优化过程中,404出错处理对搜索引擎收录的影响也是非常大的,ecshop没做到这方面,ECSHOP程序文件category.php及goods.php等页面多处存在以下这样的代码:ecs_header("Location: ./\n");exit;它的意思是,如果...
分类:
其他好文 时间:
2014-08-22 13:08:39
阅读次数:
236
第十四天起点:1.手把手教你做关键词匹配项目(搜索引擎)---- 第一天回顾:13.手把手教你做关键词匹配项目(搜索引擎)---- 第十三天小帅帅收到于老大的代码后,觉得看起来有点吃力,也不知道用了什么设计模式。小帅帅也挺聪明的,小帅帅看设计模式这个书的时候只对图感兴趣,在加上小帅帅对以前UML的了...
分类:
其他好文 时间:
2014-08-22 12:50:59
阅读次数:
152
Java是开源的世界,如何快速的搜索到你需要的Java源码呢?2009年7月17日,GrepCode团队发布了一个有趣的 Java源码搜索引擎-GrepCode 。与现有的各种搜索引擎相比,Java源码搜索引擎-GrepCode把Java源码搜索带到了一个新的高度。Java源码搜索引擎-GrepCo...
分类:
系统相关 时间:
2014-08-22 12:19:26
阅读次数:
274
《信息检索》是图书馆学专业的基础性核心课程,主要讲授信息检索的基本理论与常用方法、国内外重要的搜索引擎、综合性信息检索与资源发现系统、专题信息检索、信息检索的应用。融合课堂讲授、检索案例分析、课外检索实践、知识竞赛等多种教学形式,提高学生的信息素养和灵活运用信息解决问题的能力。课程概述1、课程性质与...
分类:
其他好文 时间:
2014-08-21 14:39:14
阅读次数:
1151