使用2to3将代码移植到Python 3 概述# print语句# Unicode字符串# 全局函数unicode()# long 长整型# <> 比较运算符# 字典类方法has_key()# 返回列表的字典类方法# 被重命名或者重新组织的模块# http# urllib# dbm# xmlrpc#
分类:
编程语言 时间:
2016-03-10 00:13:57
阅读次数:
368
功能 自己主动获取CSDN文章列表,并对每篇文章添加点击量. 源代码 import urllib.request import re import time import random from bs4 import BeautifulSoup p = re.compile('/a359680405
分类:
编程语言 时间:
2016-03-07 18:35:51
阅读次数:
120
深入理解urllib、urllib2及requests
python
Python是一种面向对象、解释型计算机程序设计语言,由Guidovan
Rossum于1989年底发明,第一个公开发行版发行于1991年,Python源代码同样遵循GPL(GNUGeneralPublic
License)协议[1]。Python语法简洁而清晰,具有丰富和强大的类库。url..
分类:
编程语言 时间:
2016-03-03 11:34:37
阅读次数:
38313
一、python脚本的规范:#!/usr/bin/envpython#-*-coding:utf-8-*-importos,urllib,MySQLdb,time,platformmain():passif__name__=="__main__":main()二、每一个功能对应一个函数这一点我认为最重要,每一个功能就写一个函数,这样你的脚本清晰易懂,脚本其他复用这个功能也方便..
分类:
编程语言 时间:
2016-03-01 14:43:25
阅读次数:
244
转自:http://cuiqingcai.com/947.html 那么接下来,小伙伴们就一起和我真正迈向我们的爬虫之路吧。 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HT
分类:
编程语言 时间:
2016-02-29 21:36:44
阅读次数:
222
import urllib2 from urllib import quote f = open("data.in", "r") out = file("data2.out","w+") a = 1 for line in f: #print line str = quote(line) url =
分类:
编程语言 时间:
2016-02-16 16:45:41
阅读次数:
187
Python可以说是爬网的利器,本文主要介绍了一些python来模拟http请求的一些方法和技巧。 Python处理请求的类库有两个,urllib,urllib2。 这两个类库并不是一个类库的两个不同版本,urllib主要用来处理一些url相关的内容,发送请求的时候,请求对象只能是一个url。url
分类:
编程语言 时间:
2016-02-05 19:13:51
阅读次数:
235
模拟人人登陆 #encoding=utf-8 import urllib2 import urllib import cookielib def renrenBrower(url,user,password): #登陆页面,能够通过抓包工具分析获得,如fiddler。wireshark login_
分类:
编程语言 时间:
2016-02-04 09:48:01
阅读次数:
242
python使用代理访问服务器主要有一下3个步骤: 1.创建一个代理处理器ProxyHandler: proxy_support = urllib.request.ProxyHandler(),ProxyHandler是一个类,其参数是一个字典:{ '类型':'代理ip:端口号'} 什么是Handl
分类:
编程语言 时间:
2016-02-01 23:49:58
阅读次数:
1641