码迷,mamicode.com
首页 >  
搜索关键字:robots    ( 529个结果
robots协议
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。Robots协议的本质是网站和搜索引擎爬虫的沟通方式,用来指导搜索引擎更好地抓取网站内容,而不是 ...
分类:其他好文   时间:2017-08-12 11:06:21    阅读次数:167
开源蜘蛛集合(转自haizhiguang博客,链接:http://blog.csdn.net/haizhiguang/article/details/20209573)
各种蜘蛛: Heritrix 点击次数:1458 Heritrix是一个开源,可扩展的web爬虫项目。Heritrix设计成严格按照robots.txt文件的排除指示和META robots标签。 Heritrix 点击次数:1458 Heritrix是一个开源,可扩展的web爬虫项目。Heritr ...
分类:Web程序   时间:2017-08-09 11:27:33    阅读次数:238
反射式光电开关QRE1113
The QRE1113 is a small IR reflectance sensor. This sensor is often used in line following robots because, if it can sense if a surface is white or bla ...
分类:其他好文   时间:2017-08-01 20:48:08    阅读次数:137
Python 爬虫-Robots协议
2017-07-25 21:08:16 一、网络爬虫的规模 二、网络爬虫的限制 ? 来源审查:判断User‐Agent进行限制 检查来访HTTP协议头的User‐Agent域,只响应浏览器或友好爬虫的访问? 发布公告:Robots协议 告知所有爬虫网站的爬取策略,要求爬虫遵守 三、Robots 协议 ...
分类:编程语言   时间:2017-07-25 22:39:15    阅读次数:523
Robots.txt详解
Robots协议(爬虫协议、机器人协议)的全称是“网络爬虫排除标准”,网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取; 优化蜘蛛爬行: 1、提高爬行效率 2、减少带宽消耗 3、防止双收录 如何在自己的网站设置robots.txt? 1、新建Robots.txt 2、编辑内容 ...
分类:其他好文   时间:2017-07-23 18:23:43    阅读次数:137
requests库的基础知识
1.安装。 cmd >> pip install requests. 2. 七种操作方法。 2.Response对象的属性。 小结:通过 r.status_code 返回的状态码,判断是否连接成功。 3.通用代码框架。 4.ROBOTS.txt协议。 实战练习。 1.京东页面的提取。 2.亚马逊。 ...
分类:其他好文   时间:2017-07-22 19:54:31    阅读次数:652
POJ 2632 Crashing Robots(模拟)
题目网址:http://poj.org/problem?id=2632 题目: Crashing Robots Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 10880 Accepted: 4614 Description In ...
分类:其他好文   时间:2017-07-22 19:37:13    阅读次数:176
cracer教程3
本章内容主要包括: 基本信息收集 网站后台查找 CDN绕过方法 1、信息收集 域名信息收集 使用layer可扫到子域名,使用时把www去掉 知道ip可用御剑查域名也可以查C段 查旁站 2、敏感目录 搜集敏感目录搜集信息 robots.txt:判断CMS 后台目录:弱口令,万能密码,爆破 安装包:获取 ...
分类:其他好文   时间:2017-07-22 18:19:25    阅读次数:329
被忽视的META标签之特效(页面过渡效果)
在web设计中使用js可以实现很多的页面特效,然而很多人却忽视了HTML标签中META标签的强大功效,其实meta标签也可以实现很多漂亮的页面过渡效果。 META标签是HTML语言HEAD区的一个辅助性标签,Meta 标签放在每个网页的<head>...</head> 中间,我们大家比较熟悉的如: ...
分类:Web程序   时间:2017-07-19 17:53:37    阅读次数:292
529条   上一页 1 ... 25 26 27 28 29 ... 53 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!