以百度为例 GET /favicon.ico HTTP/1.1 Host: www.baidu.com Connection: keep-alive Pragma: no-cache Cache-Control: no-cache User-Agent: Mozilla/5.0 (Windows N ...
分类:
Web程序 时间:
2020-07-28 16:58:47
阅读次数:
177
import requests #UA伪装: #UA:User-Agent(请求载体的身份标识)检测: #门户网站的服务器会检测对应请求的身份载体标识,如果检测到请求的载体身份标识为某一款浏览器 #说明该请求是一个正常的请求,但是,如果检测到请求的载体身份标识不是某一款浏览器的,则表示该请求不是正常 ...
分类:
Web程序 时间:
2020-07-28 10:17:22
阅读次数:
79
#!/usr/bin/python import requests from lxml import etree #需求:爬取58二手房中的房源信息 if __name__ == "__main__": headers = { 'User-Agent':'Mozilla/5.0 (Windows N ...
分类:
其他好文 时间:
2020-07-28 10:12:45
阅读次数:
79
#!/usr/bin/python import requests from lxml import etree #项目需求:解析出所有的城市名称https://www.aqistudy.cn/historydata/ if __name__ == "__main__": # headers = { ...
分类:
其他好文 时间:
2020-07-28 10:10:33
阅读次数:
61
#编码流程: #1.验证码的识别,获取验证码图片的文字数据 #2.对post请求进行发送(处理请求函数) #3.对响应函数进行持久化存储 import requests from lxml import etree from CodeClass import YDMHttp #1.对验证码图片进行捕 ...
分类:
其他好文 时间:
2020-07-28 10:08:07
阅读次数:
164
import requests from lxml import etree import re from multiprocessing.dummy import Pool #需求:爬取梨视频的视频数据 headers = { 'User-Agent':'Mozilla/5.0 (Windows ...
分类:
编程语言 时间:
2020-07-28 10:02:06
阅读次数:
77
zabbix自定义监控项没中没权限读取文件问题 标题有点长,通是这个问题也让我卡了一会,因此在这里记录下! 首先看看我的自定义监控项: 编辑‘/etc/zabbix/zabbix_agentd.conf’在尾部添加下面的参数: UserParameter=kg_pv,awk '!/favicon/{ ...
分类:
其他好文 时间:
2020-07-27 23:35:18
阅读次数:
121
1. ZABBIX备份 [root@iZ2zeapnvuohe8p14289u6Z /]# mkdir -p /soft/zabbixback/zabbix-backup [root@iZ2zeapnvuohe8p14289u6Z /]# cp /etc/zabbix/zabbix_server.c ...
分类:
其他好文 时间:
2020-07-26 19:48:46
阅读次数:
123
1 Flume 定义 Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构,灵活简单。 2 Flume 组成架构 Flume 组成架构如图 1-1,图 1-2 所示: 2.1 Agent Agent 是一个 JVM 进程,它 ...
分类:
Web程序 时间:
2020-07-26 02:04:24
阅读次数:
109
1 using System; 2 using System.Net; 3 using System.IO; 4 using System.Text; 5 using System.Text.RegularExpressions; 6 using System.Net.Security; 7 usi ...
分类:
其他好文 时间:
2020-07-25 23:19:26
阅读次数:
198