1、 爬虫(Spider)——数据来源 作为搜索引擎海量数据的来源,爬虫是搜索引擎技术的重要一环,闻道软件工作室有自己开发的爬虫,所以对此技术很熟悉。 爬虫的英文是Spider,其实翻译成蜘蛛更容易理解,无数网站的链接构成了一张巨大的网,搜索引擎的内容采集程序就像一只只勤劳的蜘蛛在这张网上爬...
分类:
其他好文 时间:
2014-09-22 02:11:11
阅读次数:
308
任何一个站长都希望让新的网站在短期内获得排名?因为网站有了排名之后,站长们才能继续接下来的操作,从而让排名能够更加稳定。那应当怎么样才能达到成功呢?许多人虽做了大量的功课却达不到明显的效果,下面简单和大家分享几点经验,希望对大家有所帮助。 首先是网站代码要简单。众所周知搜索引擎的蜘蛛喜欢简单...
分类:
Web程序 时间:
2014-09-22 01:14:41
阅读次数:
190
四、更新策略 互联网是实时变化的,具有很强的动态性。网页更新策略主要是决定何时更新之前已经下载过的页面。常见的更新策略又以下三种: 1.历史参考策略 顾名思义,根据页面以往的历史更新数据,预测该页面未来何时会发生变化。一般来说,是通过泊松过程进行建模进行预测。 2.用户体验策略 尽管搜索引擎针对于....
分类:
其他好文 时间:
2014-09-22 00:31:21
阅读次数:
219
随着Internet技术的迅速发展,使得用户要想在信息海洋里查找目标信息,就如大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是人们获取网络资源的主要工具,然而搜索引擎在给网络用户带来巨大便捷的同时, 由于其信息检索技术智能水平的限制以及对自然语言理解的制约,在网络信息的检索中存在许多不足。因此,搜索引擎优化(Search Engine Optimization,SEO)技术应运而生。
...
分类:
Web程序 时间:
2014-09-21 21:56:01
阅读次数:
301
“当人们通过谷歌找不到某些信息时,他们会认为没人能找到。但这不是真的。” ——搜索引擎Shodan创始人John Matherly
Shodan被媒体称作互联网上“最惊人的搜索引擎”。与谷歌不同,Shodan帮助人们查看互联网的背后通道
,因此可以被称作“暗世界的谷歌”。Shodan关注服务器、摄像头、打印机、路由器,以及所有一切连接至互联网,并成为互联网组成元素的东西。...
分类:
其他好文 时间:
2014-09-21 16:53:10
阅读次数:
244
1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模...
分类:
其他好文 时间:
2014-09-21 15:40:30
阅读次数:
241
byzhangxinxufromhttp://www.zhangxinxu.com本文地址:http://www.zhangxinxu.com/wordpress/?p=3432一、本文就是个实例展示三点:我就TM想找个例子,知道如何个使用,使用语法什么的滚粗跟搜索引擎搞基自己备忘精力总是有限的,昨...
分类:
Web程序 时间:
2014-09-20 21:47:39
阅读次数:
193
1. 网站结构 对于搜索引擎优化,网站的结构是最重要的因素之一。网站结构是所有关于你的网页是如何联系在一起。搜索引擎爬虫的基础上它的设置方式判断你的网站的价值。文件层次结构和站点地图起到无论是否获得高排名第至关重要的作用。 如果你想受到广大用户寻找你相关的关键字可以找到,你的网站需要逻辑布局,易.....
分类:
其他好文 时间:
2014-09-20 21:08:09
阅读次数:
309
Elasticsearch安装中文分词插件ik...
分类:
其他好文 时间:
2014-09-19 23:56:56
阅读次数:
490
可能大多数站长在网站建立之初,内容来源主要是采集或者是伪原创,因为草根站长手里没有资源来自己创造属于自己的、绝对原创的优质内容,所以如果新站没有处理好内容方面的因素,那么就没有办法获得搜索引擎的信任,那后面的工作就没有办法进行,要巧妙地将采集和伪原创而来的文章,变成自己的原创,提高网站收录,只要用这...
分类:
其他好文 时间:
2014-09-19 23:50:16
阅读次数:
270