以 POST/GET 方式向 http://127.0.0.1:8000/test/index 提交数据。 1 # coding:utf-8 2 import httplib 3 import urllib 4 5 class HttpClient(object): 6 METHOD_PO...
分类:
编程语言 时间:
2015-07-13 15:27:48
阅读次数:
135
论坛里有人问如何写个简单的爬虫.要求如下:每天的最新文章里面的附件如何做到定时下载#看了一下这个网站,还好.好久没折腾过urllib什么的,然后写了一个,测试可以.在正则匹配时,建议把数据的编码方式转为脚本编码方式一致.脚本如下:#!/usr/bin/envpython
#-*-coding:utf-8-*-
im..
分类:
编程语言 时间:
2015-07-09 22:51:42
阅读次数:
203
来在Sublime text3上安装Package Control使用Ctrl+`(ESC下边的那个~)快捷键或者通过View->Show Console菜单打开命令行,粘贴如下代码:import urllib.request,os; pf = 'PackageControl.sublime-pac...
分类:
其他好文 时间:
2015-07-09 00:40:30
阅读次数:
118
Selenium 介绍 Selenium 提供了一种更为简便的网络爬虫技术,根据橘子目前的体验,Selenium具有以下特点: 开源,免费 简单,是一种OO方式,容易上手。 适应网络编码改变。相比urllib库,由于urllib趴出的网页是html格式,提取有用信息需要通过re进行过滤,网站代码若有...
分类:
其他好文 时间:
2015-07-07 19:10:25
阅读次数:
127
1 #!/use/bin/env python 2 # -*- coding: utf-8 -* 3 # Author : nick 4 # Desc : v2ex每日签到 5 6 import urllib 7 import urllib2 8 ...
分类:
其他好文 时间:
2015-07-05 23:57:42
阅读次数:
197
#获取数据, urllib/urllib2#分析数据,正则、分析xml工具beautifulsoup#存入数据库;tuple:元组virtuaenv使用;沙盒模式安装virtualenv:apt-get install virtualenv;virtualenv test1;cd tes1 && ....
分类:
编程语言 时间:
2015-07-05 13:43:01
阅读次数:
133
示例:#!/usr/bin/env python# -*- coding: utf-8 -*-import urllib import urllib2 def main(): url = "http://www.douban.com" #浏览器头 headers = {'User-Agent':'....
分类:
编程语言 时间:
2015-07-02 15:38:35
阅读次数:
137
在做登录的post请求时,需要记住cookie,否则不能访问登录后的页面。下面是登录的代码:#coding:utf-8import urllibimport http.cookiejarurl = "http://c.highpin.cn/Users/CLogin"postdata =urllib....
分类:
编程语言 时间:
2015-06-29 19:50:40
阅读次数:
111
urllib.request.urlopen(url).read().decode('utf-8')url中带中文参数会出错:UnicodeEncodeError: 'ascii' codec can't encode characters in position 84-86: ordinal no...
分类:
编程语言 时间:
2015-06-27 22:39:29
阅读次数:
197
http://www.cnblogs.com/sysu-blackbear/p/3629420.htmlhttp://www.cnblogs.com/wly923/archive/2013/05/07/3057122.html标记:2015-06-25笔记内容整理和更新到51cto之前使用python中,访问页面网站时,都是使用curl,再被supprocess的方式,真的很笨.req="curl--max-time5--conn..
分类:
Web程序 时间:
2015-06-25 17:40:00
阅读次数:
156