>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 仅学习参考 说明:先将待提取的url提取出来,然后交给urllib.request.urlretrieve函数去下载, 自动调用schedule函数,显示当前下载的进 ...
分类:
其他好文 时间:
2020-06-13 19:13:36
阅读次数:
98
Python:闭包函数与装饰器 闭包函数: 定义:内层函数对外层函数非全局变量的引用,就叫做闭包函数。 ? 闭包会一直存在内存当中,不会因为函数执行结束而被释放。 闭包: 保护数据安全、保护数据干净性。 闭包的目的:要接受被装饰的函数和被装饰函数需要的参数 基本模型: def wrapper(): ...
分类:
编程语言 时间:
2020-06-10 21:11:14
阅读次数:
58
from urllib.parse import urlparseurl_change = urlparse('https://i.cnblogs.com/EditPosts.aspx?opt=1')#ParseResult(scheme='https', netloc='i.cnblogs.com ...
分类:
Web程序 时间:
2020-06-10 19:17:45
阅读次数:
57
requests模块和urllib模块爬取图片 requests模块 import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, lik ...
分类:
Web程序 时间:
2020-06-09 12:50:32
阅读次数:
65
Python简洁的语法使编写实现大量逻辑的单行表达式变得容易。 例如,假设我想解码来自URL的查询字符串。这里,每个查询字符串参数表示一个整数值: from urllib.parse import parse_qs my_values = parse_qs('red=5&blue=0&green=' ...
分类:
其他好文 时间:
2020-06-08 23:35:13
阅读次数:
67
本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。 1. 本节目标 本节中,我们要提取出猫眼电影TOP100的电影名称、时间、评分、图片等信 ...
分类:
编程语言 时间:
2020-06-08 14:16:46
阅读次数:
62
1、保存cookie信息 1 """保存cookie信息""" 2 3 4 from urllib import request 5 from http.cookiejar import MozillaCookieJar 6 7 cookieFilename = 'cookie.txt' 8 # 声 ...
分类:
其他好文 时间:
2020-06-08 13:04:44
阅读次数:
80
有些网站没有登录无法访问页面,登录后就可以访问。如人人网 所有程序要模拟登录状态,方法有手动方法和使用帐号密码自动登录方式。本篇使用手动复cookie请求要访问的网页,并把请求到网页保存到本地 1 """使用手动方式从浏览器中复制cookie请求网页""" 2 3 4 from urllib imp ...
分类:
Web程序 时间:
2020-06-08 11:09:22
阅读次数:
127
from urllib.request import urlretrieve from tkinter import * from selenium import webdriver import os #功能 #https://music.163.com/#/search/m/?s=%E4%B8% ...
分类:
其他好文 时间:
2020-06-08 09:26:38
阅读次数:
683
urllib是python的基本库之一,内置四大模块,即request,error,parse,robotparser,常用的request,error,一个用于发送HTTP请求,一个用于处理请求的错误。parse用于对URL的处理,拆分,合并等 1、urllib库之urlopen函数 1 """u ...
分类:
Web程序 时间:
2020-06-08 00:47:10
阅读次数:
69