import requestsfrom urllib.parse import urlencode# requests内置的状态码,可判断url响应是否正确from requests import codesimport osfrom hashlib import md5from multiproc ...
分类:
其他好文 时间:
2019-10-05 20:49:34
阅读次数:
135
请求方法request 编码parse中的quote方式 UA伪装 POST请求 Ajax请求 抓取百度翻译结果 ...
分类:
Web程序 时间:
2019-10-05 14:38:52
阅读次数:
125
首先要使用的第类库有 urllib下的request 以及urllib下的parse 以及 time包 random包 之后我们定义一个名叫BaiduSpider类用来爬取信息 属性有 url:用来爬取的网址 headers:请求头 之后我们定义三个方法 不涉及清洗数据 获取页面 保存数据 主函数 ...
分类:
编程语言 时间:
2019-10-03 21:55:36
阅读次数:
98
python 函数嵌套及作用域链 1.三元运算if条件成立的结果 if 条件 else 条件不成立的结果例如: a=20 b=10 c=a if a>b else b print(c) 2.命名空间 全局命名空间:创建的存储“变量名与值的关系”的空间叫做全局命名空间 局部命名空间: ...
分类:
编程语言 时间:
2019-10-03 11:08:15
阅读次数:
81
参考链接:https://www.liaoxuefeng.com/wiki/1016959663602400/1019223241745024 Python 的内建模块urllib提供了一系列用于操作url的方法 Get urllib的request可以非常方便的抓取URL的内容,通过GET发送一个 ...
分类:
编程语言 时间:
2019-10-02 22:35:28
阅读次数:
171
from urllib import parse from urllib import request from lxml import etree import time class Novel: def __init__(self,*args): self.name = args[0] self... ...
分类:
编程语言 时间:
2019-10-01 14:02:07
阅读次数:
77
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 import os 5 import re 6 import urllib 7 import json 8 import socket 9 import urllib.request 10 im ...
分类:
其他好文 时间:
2019-09-26 14:42:36
阅读次数:
117
import urllib.request # cd C:\Python36-32\Scripts # pip install BeautifulSoup from bs4 import BeautifulSoup def vote(get_url, post_url, option): # 访问投... ...
分类:
编程语言 时间:
2019-09-26 11:54:48
阅读次数:
72
const http = require('http'); const fs = require('fs'); const querystring = require('querystring'); const urlLib = require('url'); var users = { //模拟用... ...
分类:
Web程序 时间:
2019-09-25 17:27:19
阅读次数:
92
一、写在前面 Requests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。Requests 的哲学是以 PEP 20 的习语为中心开发的,所以它比 ...
分类:
编程语言 时间:
2019-09-25 00:52:45
阅读次数:
80