码迷,mamicode.com
首页 >  
搜索关键字:web爬虫    ( 71个结果
web爬虫
第一、爬虫及其行为方式 1.根集 2.连接的提取和相对链接的标准化 从页面提取出链接,然后把相对链接转化为绝对链接 3.避免环路的出现 4.循环和复制 5.记录爬过得链接 树和散列表有损的存在位图集群和索引 6.规范URL 7.避免循环和重复 规范URL广度优先的爬行节流:限制一段时间内机器人可以从一个WEB站点获取的页面的数量限制URL的大小URL/站点黑...
分类:Web程序   时间:2014-06-08 17:18:02    阅读次数:264
71条   上一页 1 ... 6 7 8
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!