码迷,mamicode.com
首页 >  
搜索关键字:requests 、beautifulsoup    ( 5272个结果
Python3切换TP-LINK外网IP
【代码】#encoding=utf-8 #author:walker #date:2015-08-05 #function:通过断开连接时TP-LINK重新拨号,以切换IP #memo:此代码经过python3.4测试(适用于TL-WR847N) importbase64,requests,traceback defChangeIP(): ip=‘192.168.1.1‘ user=‘admin‘ pwd=‘admin‘ desturl=‘htt..
分类:编程语言   时间:2015-08-05 22:41:17    阅读次数:203
练习3
简单小爬虫#!/usr/bin/envpython#coding:utf-8importurllib2importbs4url=‘http://www.163.com‘content=urllib2.urlopen(url).read()content=content.decode(‘gbk‘)soup=bs4.BeautifulSoup(content)links=soup.select(‘lia[href]‘)result=[]forlinkinlinks:href=link.attrs[‘hr..
分类:其他好文   时间:2015-08-04 23:15:28    阅读次数:230
BeautifulSoup 安装使用
BeautifulSoup 安装使用下载:http://www.crummy.com/software/BeautifulSoup/bs4/download/4.2/解压:tar -xzvfbeautifulsoup4-4.2.0.tar.gz安装:进入解压后的目录python setup.py b...
分类:其他好文   时间:2015-08-04 22:39:53    阅读次数:115
Python socket模拟HTTP请求
0x00 起最近在做一个对时间要求比较高的扫描器,需要封装一下SOCKET模拟HTTP发包的一些常用函数。简单的说,就是重写一下requests中的get、post方法。今天在写的时候,遇到一枚很奇怪的问题,对同一个URL,POST请求能正常返回信息,而一旦切到GET,socket time out...
分类:编程语言   时间:2015-08-04 20:53:25    阅读次数:339
Python爬虫之模拟登录豆瓣获取最近看过的电影
众所周知,很多网站都设置了登录之后才能获取查看页面的权利,因此模拟登录成了爬取信息的第一步,这一步成功了,嘿嘿,just do it! 好,废话不多说,直接说重点: 首先,你应该要了解网站登录的流程以及你需要post的信息,以豆瓣为例: 这就是你需要提交的信息了,包括用户名和密码,以及验证码和验证码的ID,看到这可能有人会想我怎么知道验证码的ID,各位放心,在页面加载时就已经到客户端这边来了,也就是说你可以直接从浏览器中看到,是不是很炫酷! 第二步,需要了解一些requests这个库了,因为reque...
分类:编程语言   时间:2015-08-03 14:42:55    阅读次数:183
下载图片-使用beautifulSoup模块
图片处理 - 使用beautifulSoup模块标签(空格分隔): python使用beautifulSoup模块使用BeautifulSoup对HTML内容解析之后,HTML内容就变成了结构化数据,可以轻易对其中的DOM元素进行操作,比如获取数据,修改,删除等。from bs4 import BeautifulSoup import urllib,urllib2def getContext(url...
分类:其他好文   时间:2015-08-02 18:18:14    阅读次数:241
Jax
The scope of this project is to automate the current Credit Correction process of opening, editing, viewing and closing credit correction requests by ...
分类:其他好文   时间:2015-07-31 20:15:35    阅读次数:121
【HttpClient4.5中文教程】【第一章 :基础】1.1执行请求(二)
1.1.4.HTTP实体(HTTP Entity) HTTP报文能够携带与请求或相应相关联的内容实体。实体存在于某些请求、响应中,它门是可选的。使用实体的请求被称为内含实体请求【译者:原文为entity enclosing requests,我把它翻译为 内含实体请求】。HTTP规范定义了两种内含实体请求,POST和PUT。而响应总是内含实体。但有些响应不符合这一规则,比如,对HEAD方法的响应...
分类:Web程序   时间:2015-07-30 13:31:34    阅读次数:3192
校园网络维护脚本
该脚本一直监测网络连接情况,若出现断网情况,自动连接网络。话不多说,直接贴代码:NetLogin.py 1 #coding: utf-8 2 3 import requests 4 import time 5 import datetime 6 import sys 7 8 re...
分类:其他好文   时间:2015-07-28 10:28:47    阅读次数:204
Django+python实现网页数据的excel导出
一直都想做一个网页的excel导出功能,最近抽时间研究了下,使用urllib2与BeautifulSoup及xlwt模块实现 urllib2这个模块之前有用过,关于BeautifulSoup模块,可参看http://www.bkjia.com/Pythonjc/992499.html ,介绍的...
分类:编程语言   时间:2015-07-27 20:52:34    阅读次数:2386
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!