下面是一个 Python 爬虫最简单的例子,使用网络库urllib2 和正则表达式库re,模拟浏览器的 User-Agent。#!/usr/bin/env python# -*- coding: utf-8 -*-#引入基础网络库import urllib2#引入正则表达式模块import re#模...
分类:
编程语言 时间:
2014-12-10 19:46:40
阅读次数:
248
importurllib2,urllib,osdefUrl1(url,files):#try:url=urllib2.urlopen(url)except:return'error'fp=file(files,'w+')fp1=url.read()fp.write(fp1)fp.close()url...
分类:
编程语言 时间:
2014-12-09 17:16:25
阅读次数:
241
#-*-coding:utf-8-*-__author__='Administrator'importurllib2,urllib,os,redefUrl1(url):#多个文件openr=urllib2.build_opener()#下载文件html代码,找出一楼的核心代码openr.add_ha...
分类:
编程语言 时间:
2014-12-09 17:07:10
阅读次数:
168
ulipad,看着蛮舒服的。图里的代码就是今天晚上的成果。突然就想看看python这个被很多人说是优雅的语言,于是晚上没事就配了配环境,做了个东西 1 #encoding: utf-8 2 import urllib 3 import urllib2 4 5 #name:要注册的名称 6 #判断n....
分类:
编程语言 时间:
2014-12-05 22:41:02
阅读次数:
262
#/usr/bin/envpython
#-*-coding:utf-8-*-
importtime,datetime,socket,urllib,urllib2,cookielib,re
importsmtplib,string
fromemail.mime.multipartimportMIMEMultipart
fromemail.mime.textimportMIMEText
fromemail.mime.p_w_picpathimportMIMEImage
log_url=‘http://ip地..
分类:
编程语言 时间:
2014-12-05 19:40:48
阅读次数:
323
1. 安装扩展器包管理器Package Control组件点击菜单 View -> Show Console 调出控制台或者按快捷键 “Ctrl + `”(1左边的符号,可能和QQ拼音输入法和搜狗浏览器的快捷键有冲突,改下就可以)输入下面的代码并按回车:import urllib2,os;pf='P...
分类:
其他好文 时间:
2014-12-05 16:57:15
阅读次数:
284
# -*- coding: utf-8 -*-
import string
import json
import urllib2
import urllib
import base64
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )
#调用优酷网API获取json数据
def GetYouku():
re...
分类:
编程语言 时间:
2014-12-05 12:52:35
阅读次数:
469
#-*-coding:cp936-*-importurllib2importredefu(url):#connecttoaURLwebsite=urllib2.urlopen(url)#readhtmlcodehtml=website.read()#usere.findalltogetallthel...
分类:
编程语言 时间:
2014-12-05 12:27:16
阅读次数:
122
#/usr/bin/envpython
#-*-coding:utf-8-*-
importtime,datetime,socket,urllib,urllib2,cookielib
#由于我是今天去取上周一的时间所以这里写成10,时间应该是2014年11月24上周星期一,
threeDayAgo=(datetime.datetime.now()-datetime.timedelta(days=10))
#时间格式化输出,由..
分类:
编程语言 时间:
2014-12-04 18:14:25
阅读次数:
257
最近在使用chardet检查网页编码格式时发现如下问题:用urllib打开网页再检查编码格式和用urllib2打开网页检查编码格式结果不一样,所以urllib2打开可能导致问题,需要注意。使用urllib2打开网页,检查编码格式:结果如下,结果中出现了新浪网的字符编码格式为None的情况:但如果使用...
分类:
编程语言 时间:
2014-11-29 15:49:02
阅读次数:
184