一、网络爬虫的定义网络爬虫,即Web
Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这...
分类:
编程语言 时间:
2014-05-27 00:15:52
阅读次数:
328
版本号:Python2.7.5,Python3改动较大,各位另寻教程。所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端,
然后读取服务器端的响应资源。在Python中,我们使用urllib2...
分类:
编程语言 时间:
2014-05-27 00:12:25
阅读次数:
323
function aa() { var defer = $.Deferred(); $.ajax({
url: "/Handler1.ashx", type: "post", ...
分类:
Web程序 时间:
2014-05-26 23:49:24
阅读次数:
431
在开始后面的内容之前,先来解释一下urllib2中的两个个方法:info and
geturlurlopen返回的应答对象response(或者HTTPError实例)有两个很有用的方法info()和geturl()1.geturl():这个返回获取的真实的URL,这个很有用,因为urlopen(或...
分类:
编程语言 时间:
2014-05-26 23:17:30
阅读次数:
352
HTTP 错误 404.3 - Not Found
由于扩展配置问题而无法提供您请求的页面。如果该页面是脚本,请添加处理程序。如果应下载文件,请添加 MIME 映射。
请求的 URL
http://localhost:5210/Font/fontawesome-webfont.woff?v=3.2.1
物理路径
F:\autoCode\Font\fonta...
分类:
其他好文 时间:
2014-05-23 01:56:23
阅读次数:
271
package com.example.android_http;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import android.app.Activity;
import android.os.Bundle;
import android.os.Handler...
分类:
其他好文 时间:
2014-05-23 01:41:36
阅读次数:
253
话不多少,直接上代码,思路还是挺简单的。
UIWebView *webView = [[UIWebView alloc]initWithFrame:self.view.frame];
// HTML文件来自Project
// 步骤:path - > url - > request with url - > loadRequest
NSStrin...
分类:
编程语言 时间:
2014-05-22 23:53:05
阅读次数:
442
Django 1.6 最佳实践: 如何正确使用 CBVs (Class-based views)
Class-based views是Django为解决建站过程中的常见的呈现模式而建立的. 在这节中, 我们着重讲一下CBVs的使用技巧和一般原则.
1. CBVs的使用原则
代码越少越好永远不要重复代码View应当只包含呈现逻辑, 不应包括业务逻辑保持view逻辑清...
分类:
其他好文 时间:
2014-05-22 23:22:14
阅读次数:
299
这个问题真是把我折腾的够呛:
package com.example.tupian;
import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import android.os.Bundle;
import android.os.Handler;
import android.os.Messag...
分类:
其他好文 时间:
2014-05-22 17:03:39
阅读次数:
241