### 方法一:urllib 模块 ### from urllib import request python 自带模块(标准模块) (不推荐使用) url = 'http://www.baidu.com' req = request.urlopen(url) 打开一个 url print(req. ...
分类:
其他好文 时间:
2018-05-14 19:53:12
阅读次数:
145
02,函数名的应用(第一对象)。 # 1,直接打印函数名得到的是函数的内存地址 # print(func1) #2,函数名可以赋值运算。 # def func1(): # print(666) # f1 = func1 # f1() # 3, 函数名可以作为函数的参数。 # def func1():... ...
分类:
编程语言 时间:
2018-05-11 23:38:04
阅读次数:
222
爬虫的步骤:将要爬取的目标用户想读的图书的首页的url存储在元组中。通过urllib.request方法构造一个发送请求,在通过urllib.urlopen方法发出请求并取得响应(response)。通过response.read得到页面html,然后在通过beautifulsoup将html解析成 ...
分类:
其他好文 时间:
2018-05-10 17:32:26
阅读次数:
171
#GET: #!/usr/bin/env python# -*- coding:utf-8 -*-import urllib2def get(): URL = 'www.baidu.com' #页面的地址 response = urllib2.urlopen(URL) #调用urllib2向服务器发 ...
分类:
编程语言 时间:
2018-05-09 22:42:02
阅读次数:
239
open(name,...) 打开文件并返回一个文件对象 connect(...) 连接到数据库并返回一个连接对象 urllib.urlopen(url[, data[, proxies]]) 根据制定的URL打开一个类似于文件的对象 urllib.urlretrieve(url[, fname[, ...
分类:
其他好文 时间:
2018-05-06 20:06:06
阅读次数:
159
1. urllib.urlencode(params) 换成 urllib.parse.urlencode(params) 2. 在python3.3后urllib2已经不能再用,只能用urllib.request来代替 response=urllib2.urlopen(' File "b.py", ...
分类:
编程语言 时间:
2018-05-06 00:23:42
阅读次数:
334
Request 在我们第一个例子里,urlopen()的参数就是一个url地址; 但是如果需要执行更复杂的操作,比如增加HTTP报头,必须创建一个 Request 实例来作为urlopen()的参数;而需要访问的url地址则作为 Request 实例的参数。 浏览器 就是互联网世界上公认被允许的身份 ...
分类:
编程语言 时间:
2018-05-03 00:59:53
阅读次数:
202
1、爬虫 import re from urllib.request import urlopen def getPage(url): response = urlopen(url) return response.read().decode('utf-8') def parsePage(s): c ...
分类:
其他好文 时间:
2018-05-02 19:20:39
阅读次数:
116
本文爬取了掘金上关于前端前n页的标题。将文章的标题进行分析,可以看出人们对前端关注的点或者近来的热点。 获取动态网页的具体内容 爬取动态网页时标题并不能在html里直接找到,需要通过开发者工具里的Network去寻找。寻找到的是ajax发出的json数据。 获取json里面的具体某个数据 我们获取到 ...
分类:
Web程序 时间:
2018-04-30 14:30:22
阅读次数:
327
# from urllib import request## f=request.urlopen("http://123.178.101.29:81/xs_main.aspx?xh=201512102028")## result=str(f.read(),encoding='gb2312')# pr ...
分类:
编程语言 时间:
2018-04-30 13:26:34
阅读次数:
236