搜索关键字：urlopen，搜索到699个结果！码迷,mamicode.com！

关于爬虫使用 urllib.urlopen 提交默认 User-Agent值

在爬虫中经常会用到 urllib.request.urlopen(url）来打开网页的操作比如获取页面状态返回值问题是urlopen 在GET请求时发送的User-Agent 上会发送Python urllib的版本，看下面抓包看一下源码正常的请求应该是浏览器的 User-Agent 假如 ...

分类：Web程序时间：2017-04-09 13:58:27 阅读次数：4652

Python内置的urllib模块不支持https协议的解决办法

Django站点使用django_cas接入SSO（单点登录系统），配置完成后登录，抛出“urlopen error unknown url type: https”异常。寻根朔源发现是python内置的urllib模块不支持https协议。 >>> import urllib>>> urllib. ...

分类：编程语言时间：2017-04-09 12:37:04 阅读次数：214

简单爬虫-爬贴吧图片

#coding=utf-8 #urllib模块提供了读取Web页面数据的接口 import urllib #re模块主要包含了正则表达式 import re #定义一个getHtml()函数 def getHtml(url): page = urllib.urlopen(url) #urllib.u... ...

分类：其他好文时间：2017-04-08 23:45:18 阅读次数：236

Python学习（2）

爬取网页的部分链接#!/usr/bin/python#coding=utf8fromurllib.requestimporturlopenfrombs4importBeautifulSoupimportreimportrandompages=set()defgetlink(pageurl):globalpageshtml=urlopen(‘http://www.ftchinese.com‘+pageurl)bs_data=BeautifulSoup(html,‘lxml‘)#fromipdb..

分类：编程语言时间：2017-04-06 23:51:25 阅读次数：201

python中json模块dumps和loads的区分

b=urllib2.urlopen("http://www.baidu.com")a=b.read()#这里读取的是html中的json格式的内容a1=json.loads(a)#把读取到的内容从json转换成Python中的字典格式print a1['消息状态']#用Python中的字典取值方法 ...

分类：编程语言时间：2017-04-06 22:00:15 阅读次数：170

urllib模块

urllib.request 1、定义用于打开URL的可扩展库，定义了基本和摘要式身份验证、重定向、cookies等应用中打开URL（主要是HTTP）的函数和类。 2、函数 urllib.request.urlopen(url,data=None,url, data=None) url:网址 da ...

分类：Web程序时间：2017-04-05 23:17:29 阅读次数：187

第一个python爬虫程序

今天在学习python,于是自己动手写了一个简单的爬虫的例子，解析Html使用bs4，爬取的网页是没有反爬机制的，也没有代理 ...

分类：编程语言时间：2017-04-05 17:40:00 阅读次数：190

URL解析器urllib2

urllib2是Python的一个库（不用下载，安装，只需要使用时导入import urllib2）它提供了一系列用于操作URL的功能。 urlopen urllib2.urlopen可以接受Request对象,urllib不能，本文采用urllib2 urllib2.urlopen(url, *d ...

分类：Web程序时间：2017-04-05 14:41:09 阅读次数：173

使用python进行爬虫下载指定网站的图片

# coding=utf-8 import urllib import re def downloadPage(url): h = urllib.urlopen(url) return h.read() def downloadImg(content): pattern = r'src="(.+?\... ...

分类：编程语言时间：2017-04-01 09:20:37 阅读次数：135

python代理可用检测、代理类型检测

#coding:utf-8 import urllib2 def url_user_agent(proxy,url): proxy_support = urllib2.ProxyHandler({'http':proxy}) opener = urllib2.build_opener(proxy_s... ...

分类：编程语言时间：2017-03-29 13:22:26 阅读次数：240

共699条上一页 1 ... 41 42 43 44 45 ... 70 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)