仅以此纪念python标准库学习!翻译什么会有不顺或者错误,见谅啦。。。。 后边为案例。#coding:utf-8import urllib"""本模块提供了通过万维网抓取数据的高级接口。尤其是,urlopen()函数和内置的open()相似,只是接受的参数为Urls,而不是文件名称。有一些限制:该...
分类:
编程语言 时间:
2015-08-11 15:58:52
阅读次数:
172
1:tcpdumptcpdump-nn当前终端下,查看网卡流量-nn把域名和端口,显示为数字,而不是字符串tcpdump-nn-c100指定抓取100个包数据tcpdump-nn-ieth1指定抓取数据的网卡,不指定,默认eth0tcpdump-nnport22抓取指定端口的数据包tcpdump-nntcpandport22抓取tcp协议22端口的数据包tcp..
分类:
其他好文 时间:
2015-08-03 23:00:30
阅读次数:
207
最近换工作 从客户端转到Web端 第一个任务就是去页面上抓取数据 用到的是JSON 因为json的格式有点怪 所以 就在JSON反序列化上面 花了一点时间首先用到的工具是http://www.newtonsoft.com/json然后 根据JSON创建对应的对象类下面分三种JSON形式Demo1:j...
分类:
Web程序 时间:
2015-07-30 10:52:35
阅读次数:
143
今天在知乎中看到了一篇文章,讲的是金融的学生如何来获取数据。其中一种是花钱买数据,一种是使用网络爬虫在网络上抓取数据,还有一种是我最感兴趣的,从别人的图形中“提取”数据。 那么如何从图形中提取数据,这里介绍到(1)提取图形数据的利器:WebPlotDigitizer :http://arohatg....
分类:
Web程序 时间:
2015-07-26 23:52:49
阅读次数:
541
jsoup的主要功能如下:1. 从一个URL,文件或字符串中解析HTML;2. 使用DOM或CSS选择器来查找、取出数据;3. 可操作HTML元素、属性、文本;接下来介绍jsoup 是如何优雅的进行HTML 文档处理的。文档输入jsoup 可以从包括字符串、URL地址以及本地文件来加载HTML 文档...
分类:
Web程序 时间:
2015-07-26 20:34:56
阅读次数:
134
我的数据通过一个TextBox输入,这些代码是写在一个button的点击事件里的。 网页数据抓取大概分为两步,第一步是获取网页源代码: 具体注释如下: var currentUrl = TextBox1.Text;//获得要抓取的网页的URL地址 var request = WebRequest.C...
分类:
Web程序 时间:
2015-07-21 14:35:13
阅读次数:
107
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Data;using Stock.BLL;using System.Text.RegularExpressio...
分类:
其他好文 时间:
2015-07-01 22:08:22
阅读次数:
117
cheerio DOM化并解析的时候1.假如使用了 .text()方法,则一般不会有html实体编码的问题出现2.如果使用了 .html()方法,则很多情况下都会出现,这时,可能就需要转义一番了类似这些 因为需要作数据存储,所有需要转换Халк &#x...
分类:
Web程序 时间:
2015-07-01 20:36:14
阅读次数:
161
From :http://developer.51cto.com/art/200904/121739.htm下面是一个小例程:﹤?php// 初始化一个 cURL 对象$curl = curl_init();// 设置你需要抓取的URLcurl_setopt($curl, CURLOPT_URL, ...
分类:
Web程序 时间:
2015-06-01 20:21:37
阅读次数:
132
歌飘渺ios开发-程序压后台后,悄悄的抓取数据~~我们使用某个app的时候,当我们将程序压到后台之后,我们希望它还能从服务器抓取一些数据,类似微博,微信,qq这些程序压后台之后,我们依然能看到icon上显示未读数量。但是ios系统是伪多任务操作系统。当我们将程序压后台之后,大概过1分钟,程序就会被关...
分类:
移动开发 时间:
2015-05-28 17:46:11
阅读次数:
189