为了不让搜索引擎索引网站的后台页面或其它隐私页面,我们将这些路径在robots.txt文件中禁用了。但矛盾的是,robots.txt文件任何人都可以访问,包括黑客。为了禁止搜索引擎,我们把隐私泄露给了黑客。 robots.txt干什么的?robots.txt基本上每个网站都用,而且放到了网站的根目录...
分类:
Web程序 时间:
2014-08-22 17:42:09
阅读次数:
189
在优化过程中,404出错处理对搜索引擎收录的影响也是非常大的,ecshop没做到这方面,ECSHOP程序文件category.php及goods.php等页面多处存在以下这样的代码:ecs_header("Location: ./\n");exit;它的意思是,如果...
分类:
其他好文 时间:
2014-08-22 13:08:39
阅读次数:
236
第十四天起点:1.手把手教你做关键词匹配项目(搜索引擎)---- 第一天回顾:13.手把手教你做关键词匹配项目(搜索引擎)---- 第十三天小帅帅收到于老大的代码后,觉得看起来有点吃力,也不知道用了什么设计模式。小帅帅也挺聪明的,小帅帅看设计模式这个书的时候只对图感兴趣,在加上小帅帅对以前UML的了...
分类:
其他好文 时间:
2014-08-22 12:50:59
阅读次数:
152
Java是开源的世界,如何快速的搜索到你需要的Java源码呢?2009年7月17日,GrepCode团队发布了一个有趣的 Java源码搜索引擎-GrepCode 。与现有的各种搜索引擎相比,Java源码搜索引擎-GrepCode把Java源码搜索带到了一个新的高度。Java源码搜索引擎-GrepCo...
分类:
系统相关 时间:
2014-08-22 12:19:26
阅读次数:
274
《信息检索》是图书馆学专业的基础性核心课程,主要讲授信息检索的基本理论与常用方法、国内外重要的搜索引擎、综合性信息检索与资源发现系统、专题信息检索、信息检索的应用。融合课堂讲授、检索案例分析、课外检索实践、知识竞赛等多种教学形式,提高学生的信息素养和灵活运用信息解决问题的能力。课程概述1、课程性质与...
分类:
其他好文 时间:
2014-08-21 14:39:14
阅读次数:
1151
第十三天自从小帅帅被于老大批了之后,心里非常不爽,因为有这样的理由:我已经做到了你想要的,为什么还得不到肯定。什么样的程序员才是优秀的?小帅帅带着这样的疑问去了解设计模式。尽管他把设计模式看了很多遍,甚至连设计模式的名字背得滚瓜烂熟,单例模式、抽象工厂模式、建造者模式、工厂模式、原型模式...等。但...
分类:
其他好文 时间:
2014-08-21 13:16:54
阅读次数:
235
谷歌彻底被禁让人惋惜,百度的“道德”,能力让人堪忧。对于程序员来说,使用百度就代表被他折磨。希望天朝的国民早日醒悟过来,切不可闭关锁国,妄自尊大。中国已经拉下了无数步,如果还继续这样会不会被拖死。
分类:
其他好文 时间:
2014-08-21 11:02:33
阅读次数:
260
语义化这个词在 HTML 中用的比较多,即根据内容的结构化选择合适的标签。起作用不容小觑:赋予标签含义,让代码结构更加清晰,虽然我们可以在标签上添加 class 来标识,但这种通过属性来表示本体的形式会显得不够直接,而且在一定程度上也有冗余。优化搜索引擎(SEO),结构良好的网页对搜索引擎的亲和力是...
分类:
编程语言 时间:
2014-08-21 00:09:13
阅读次数:
173
Luke是一个用于Lucene搜索引擎的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改。可以看每篇文档建立了哪些索引,验证有没有成功建立了索引。不然建立了,不能确定有没有成功。可以用luke看文章怎么分的词。当搜索query过来以后,query也会被分词,拿这个分好的词去索引中查询...
分类:
其他好文 时间:
2014-08-20 23:56:23
阅读次数:
296
你的网站内容很有价值,希望被google,百度等正规搜索引擎爬虫收录,却不想让那些无节操的山寨爬虫把你的数据扒走坐享其成。本文将探讨如何在网站中加入优雅的反爬虫策略。 【思路】 反爬虫策略要考虑以下几点: ...
分类:
Web程序 时间:
2014-08-20 19:45:53
阅读次数:
298