【代码】#encoding=utf-8
#author:walker
#date:2015-08-05
#function:通过断开连接时TP-LINK重新拨号,以切换IP
#memo:此代码经过python3.4测试(适用于TL-WR847N)
importbase64,requests,traceback
defChangeIP():
ip=‘192.168.1.1‘
user=‘admin‘
pwd=‘admin‘
desturl=‘htt..
分类:
编程语言 时间:
2015-08-05 22:41:17
阅读次数:
203
简单小爬虫#!/usr/bin/envpython#coding:utf-8importurllib2importbs4url=‘http://www.163.com‘content=urllib2.urlopen(url).read()content=content.decode(‘gbk‘)soup=bs4.BeautifulSoup(content)links=soup.select(‘lia[href]‘)result=[]forlinkinlinks:href=link.attrs[‘hr..
分类:
其他好文 时间:
2015-08-04 23:15:28
阅读次数:
230
BeautifulSoup 安装使用下载:http://www.crummy.com/software/BeautifulSoup/bs4/download/4.2/解压:tar -xzvfbeautifulsoup4-4.2.0.tar.gz安装:进入解压后的目录python setup.py b...
分类:
其他好文 时间:
2015-08-04 22:39:53
阅读次数:
115
0x00 起最近在做一个对时间要求比较高的扫描器,需要封装一下SOCKET模拟HTTP发包的一些常用函数。简单的说,就是重写一下requests中的get、post方法。今天在写的时候,遇到一枚很奇怪的问题,对同一个URL,POST请求能正常返回信息,而一旦切到GET,socket time out...
分类:
编程语言 时间:
2015-08-04 20:53:25
阅读次数:
339
众所周知,很多网站都设置了登录之后才能获取查看页面的权利,因此模拟登录成了爬取信息的第一步,这一步成功了,嘿嘿,just do it!
好,废话不多说,直接说重点:
首先,你应该要了解网站登录的流程以及你需要post的信息,以豆瓣为例:
这就是你需要提交的信息了,包括用户名和密码,以及验证码和验证码的ID,看到这可能有人会想我怎么知道验证码的ID,各位放心,在页面加载时就已经到客户端这边来了,也就是说你可以直接从浏览器中看到,是不是很炫酷!
第二步,需要了解一些requests这个库了,因为reque...
分类:
编程语言 时间:
2015-08-03 14:42:55
阅读次数:
183
图片处理 - 使用beautifulSoup模块标签(空格分隔): python使用beautifulSoup模块使用BeautifulSoup对HTML内容解析之后,HTML内容就变成了结构化数据,可以轻易对其中的DOM元素进行操作,比如获取数据,修改,删除等。from bs4 import BeautifulSoup
import urllib,urllib2def getContext(url...
分类:
其他好文 时间:
2015-08-02 18:18:14
阅读次数:
241
The scope of this project is to automate the current Credit Correction process of opening, editing, viewing and closing credit correction requests by ...
分类:
其他好文 时间:
2015-07-31 20:15:35
阅读次数:
121
1.1.4.HTTP实体(HTTP Entity)
HTTP报文能够携带与请求或相应相关联的内容实体。实体存在于某些请求、响应中,它门是可选的。使用实体的请求被称为内含实体请求【译者:原文为entity enclosing requests,我把它翻译为 内含实体请求】。HTTP规范定义了两种内含实体请求,POST和PUT。而响应总是内含实体。但有些响应不符合这一规则,比如,对HEAD方法的响应...
分类:
Web程序 时间:
2015-07-30 13:31:34
阅读次数:
3192
该脚本一直监测网络连接情况,若出现断网情况,自动连接网络。话不多说,直接贴代码:NetLogin.py 1 #coding: utf-8 2 3 import requests 4 import time 5 import datetime 6 import sys 7 8 re...
分类:
其他好文 时间:
2015-07-28 10:28:47
阅读次数:
204
一直都想做一个网页的excel导出功能,最近抽时间研究了下,使用urllib2与BeautifulSoup及xlwt模块实现 urllib2这个模块之前有用过,关于BeautifulSoup模块,可参看http://www.bkjia.com/Pythonjc/992499.html ,介绍的...
分类:
编程语言 时间:
2015-07-27 20:52:34
阅读次数:
2386