码迷,mamicode.com
首页 >  
搜索关键字:urllib    ( 2222个结果
Why should i use url.openStream instead of of url.getContent?
I would like to retrieve the content of a url. Similar to pythons:html_content = urllib.urlopen("http://www.test.com/test.html").read()In examples(jav...
分类:Web程序   时间:2014-10-18 15:21:48    阅读次数:232
python解决urllib2乱码问题
举例: #!/usr/bin/env python # -*- coding: utf-8 -*- import urllib import urllib2 def main(): url = "http://www.douban.com" #浏览器头 headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1;...
分类:编程语言   时间:2014-10-17 16:54:14    阅读次数:183
urllib包
前言:urllib.parse模块按功能分为两大类:URL parsing(url解析) 和URL quoting(url引用)。一.URL parsing:主要是1.把URL字符串分割成组件2.把组件合并成url字符串1.1. urllib.parse.urlparse(urlstring, sc...
分类:Web程序   时间:2014-10-16 01:06:21    阅读次数:613
Python2 Python3 urllib方法对应
Python2 name Python3 nameurllib.urlopen() urllib.request.urlopen()urllib2.urlopen() urllib.request.urlopen()urllib.urlretrieve() urllib.request.urlret...
分类:编程语言   时间:2014-10-15 18:27:35    阅读次数:252
python urllib模块使用详解
简介:urllib2是python的一个获取url(Uniform Resource Locators,统一资源定址器)的模块。它用urlopen函数的形式提供了一个非常简洁的接口。这使得用各种各样的协议获取url成为可能。它同时 也提供了一个稍微复杂的接口来处理常见的状况-如基本的认证,cooki...
分类:编程语言   时间:2014-10-13 18:29:17    阅读次数:185
Python实践之网络编程1-简单的网络请求程序
import sys,urllib,urllib2,getpass#定义TerminalPwd类扩展HTTPPasswordMgr,允许在需要的时候询问操作员输入密码class TerminalPwd(urllib2.HTTPPasswordMgr): def find_user_passwo...
分类:编程语言   时间:2014-10-12 20:24:08    阅读次数:217
python爬取博客园首页文章
先上代码,比较长。 1 # -*- coding=utf-8 -*- 2 __author__ = 'lhyz' 3 4 import urllib 5 import re 6 import socket 7 import time 8 import os 9 10 #使用当前时间创建文件夹11 ....
分类:编程语言   时间:2014-10-12 02:35:37    阅读次数:517
20 行python代码抓取网页中所有JPG图片
#!/usr/bin/python import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.*?\.jpg)" width' imgre = re.compile(reg) ...
分类:编程语言   时间:2014-10-11 23:57:32    阅读次数:211
python 批量下载美剧 from 人人影视 HR-HDTV
本人比较喜欢看美剧,尤其喜欢人人影视上HR-HDTV 的 1024 分辨率的高清双字美剧,这里写了一个脚本来批量获得指定美剧的所有 HR-HDTV 的 ed2k下载链接,并按照先后顺序写入到文本文件。这个 python 爬虫比较短,就用到了 urllib.request 和 re 这两个模块,前者负责抓取网页,后者负责解析文本。想进一步加强爬虫的功能,可以用爬虫框架 Scrapy。还有就是,网页内容多是 javascript 生成,就需要一个 js 引擎了,PyV8 可以拿来试试,再有就是基于 js 的爬虫...
分类:编程语言   时间:2014-10-11 22:03:36    阅读次数:344
python的urllib2库详细使用说明
一直以来技术群里会有新入行的同学提问关于urllib和urllib2以及cookielib相关的问题。所以我打算在这里总结一下,避免大家反复回答同样的问题浪费资源。这篇属于教程类的文字,如果你已经非常了解urllib2和cookielib那么请忽略本篇。首先从一段代码开始,#cookieimport...
分类:编程语言   时间:2014-10-11 13:53:15    阅读次数:255
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!