一.正则解析 常用正则表达式回顾: 回顾练习: 项目需求:爬取糗事百科指定页面的糗图,并将其保存到指定文件夹中 二.Xpath解析 测试页面数据 常用xpath表达式回顾 代码中使用xpath表达式进行数据解析 安装xpath插件在浏览器中对xpath表达式进行验证:可以在插件中直接执行xpath表 ...
分类:
编程语言 时间:
2019-02-26 22:18:59
阅读次数:
249
一、安装Package Control 使用快捷键 ctrl+` 或者在菜单中点击 View > Show Console 将下面这段代码复制并黏贴到 Console 中: import urllib.request,os,hashlib; h = '6f4c264a24d933ce70df5ded ...
分类:
Web程序 时间:
2019-02-25 23:29:43
阅读次数:
476
1 import re 2 from pymysql import connect 3 import urllib.parse 4 import logging 5 6 7 URL_FUNC_DICT = dict() 8 9 def open_mysql(): 10 # 创建connect连接 1... ...
分类:
其他好文 时间:
2019-02-24 20:14:39
阅读次数:
173
1 import urllib.request 2 import urllib.parse 3 import random 4 5 #目标地址 6 url="http://tieba.baidu.com/f" 7 8 #伪造客户端 http请求头 9 ua_list = [ 10 "User-Age... ...
分类:
其他好文 时间:
2019-02-23 12:11:49
阅读次数:
231
什么是urllib Urllib是python内置的HTTP请求库包括以下模块urllib.request 请求模块urllib.error 异常处理模块urllib.parse url解析模块urllib.robotparser robots.txt解析模块 urlopen 关于urllib.re ...
分类:
Web程序 时间:
2019-02-22 12:13:27
阅读次数:
237
import socket from urllib import request,error try: response = request.urlopen('https://cuiqingcai.com/index/htm',timeout=0.01) except error.HTTPError... ...
分类:
Web程序 时间:
2019-02-22 00:32:48
阅读次数:
192
当我们在官网下载安装好sublime test3后 按+调出控制台后输入以下代码: import urllib.request,os,hashlib; h = '2915d1851351e5ee549c20394736b442' + '8bc59f460fa1548d1514676163dafc88 ...
分类:
系统相关 时间:
2019-02-20 21:26:09
阅读次数:
238
一、urllib模块 python标准库自带的发送网络请求的模块。 二、requests模块 requests模块是基于urllib模块开发,用于发送http请求。 ...
分类:
编程语言 时间:
2019-02-18 22:58:03
阅读次数:
238
import osimport timeimport urllib.requestimport urllib.parsefrom lxml import etree# 构建面向对象的代码方式class ZhanZhang(object): # 实例化参数,让参数能够全局调用 def __init__ ...
分类:
其他好文 时间:
2019-02-18 20:28:32
阅读次数:
202
本文将业务场景中最常用的几点实例,给大家列举出来,不常见的不再一一赘述。 使用urllib库可以模拟浏览器发送请求获得服务器返回的数据,下一步就是把有用的数据提取出来。数据分为两种形式:结构化和非结构化。 非结构化的数据一般指的是文本和HTML。文本的内容特别的杂乱,比如有电话号码,邮箱等信息,只能 ...
分类:
其他好文 时间:
2019-02-18 16:11:37
阅读次数:
212