http模块是一个底层基础模块,实现的功能比较少,正常情况下比较少用到.推荐用urllib, urllib2, httplib2.
?HTTPConnection 对象class httplib.HTTPConnection(host[, port[, strict[, timeout[, source_address]]]])
创建HTTPConnection对象HTTPConnection....
分类:
编程语言 时间:
2015-04-10 22:35:01
阅读次数:
203
Python爬虫Csdn系列II
By 白熊花田(http://blog.csdn.net/whiterbear) 转载需注明出处,谢谢。
说明:
在上一篇文章中,我们已经知道了只要将程序伪装成浏览器就能访问csdn网页。在这篇文章中,我们将设法获取某个csdn用户的所有文章的链接。
分析:
打开一个某一个的csdn用户的的专栏...
分类:
编程语言 时间:
2015-04-10 17:57:46
阅读次数:
225
首先可以先装package control 方法——按ctrl+`,然后在命令行里复制粘贴以下代码,import urllib2,os;pf='Package Control.sublime-package';ipp=sublime.installed_packages_path();os.make...
分类:
编程语言 时间:
2015-04-09 21:50:16
阅读次数:
169
Python爬虫Csdn系列I
By 白熊花田(http://blog.csdn.net/whiterbear)
说明:
我会在这个系列介绍如何利用python写一个csdn爬虫,并将给定的Csdn用户的博客的所有文章保存起来。嗯,实用性貌似不是很大,写着玩,这个系列后,会有更好玩的更高级的爬虫出现。
原因:
本来想学cooki...
分类:
编程语言 时间:
2015-04-09 19:51:14
阅读次数:
160
一:起因
(0)爬虫就是网络蜘蛛,爬取指定URL的html网页的内容,所以会需要urllib2包,字符串string的操作肯定也是需要的,以及字符串匹配包re。
(1)Python的嵌套类型,一般在基础教程里面很少涉及到的;Python的更高级应用肯定会涉及的,只是个人能力有限,如今没有深入,期待不就将来接触学习一下。
(2)说起嵌套类型,这要从Java 或则 c++的嵌套类型说起,只要你处...
分类:
编程语言 时间:
2015-04-07 12:07:31
阅读次数:
189
1. 利用ctrl + ~键调出控制台:
2. 安装package contro:
(1) sublime text2在控制台中输入如下命令:
import urllib2,os;pf='Package Control.sublime-package';ipp=sublime.installed_packages_path();os.makedirs(ipp) if not os....
分类:
其他好文 时间:
2015-04-03 15:35:09
阅读次数:
177
时间分为4周,全部自学,仅提供大纲。适用于Web方向:1、Week1:读完《简明Python教程》,适应Python开发环境2、Week2:写个爬虫,需要深入了解re、urllib2、sqlite3、threading,Queue等几个模块。需要用上多线程抓取,正则表达式分析,并发资源控制,重新开启...
分类:
编程语言 时间:
2015-04-01 19:46:40
阅读次数:
148
[About]http://www.python-requests.org/en/latest/[与urllib2比较]http://www.oschina.net/code/snippet_782578_27510[错误]requests.exceptions.SSLError:[Errno 1]...
分类:
编程语言 时间:
2015-03-31 12:17:34
阅读次数:
220
仿照http://blog.csdn.net/lming_08/article/details/44710779里面的方法, 获取指定URL 的所需的子链接及其描述.
#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys
import urllib2
import re
if len(sys.argv) != 2:
print ...
分类:
Web程序 时间:
2015-03-29 20:59:09
阅读次数:
170
###百度API实现 ##Step1:申请API Key >>以前用过BAE,已经有了Api Key,没有的可以去申请 ##Step2:挺简单,直接看实现的代码吧 >>···python #coding:utf-8 import urllib2 import urllib import json #采用g...
分类:
编程语言 时间:
2015-03-29 09:33:42
阅读次数:
169