参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
放置方法的程序单元是类,类中提供一个或多个方法,为类执行任务。方法执行一个任务,并可返回一个结果。类的实例称为对象。给对象发送消息称为一个方法调用,告诉对象要执行一个任务。对象有属性,可以在程序中使用,这些属性在对象的类中用字段指定属性。public
class Count//每个类声明包含关键字c...
分类:
其他好文 时间:
2014-04-28 16:18:47
阅读次数:
472
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。
1、获得html文本。 python在获取html方面十分方便,寥.....
分类:
编程语言 时间:
2014-04-28 15:31:09
阅读次数:
712
原始DFA如下图所示最小化的定义:1.没有多余的状态(死状态);2.没有两个状态是相互等价的;两个状态等价的含义:1.兼容性(一致性)——同是终态或同是非终态;2.传播性(蔓延性)——从s出发读入某个a和从t出发经过某个a并且经过某个b到达的状态等价。令M为DFA中所有状态的集合。1.开始做粗略划分...
分类:
其他好文 时间:
2014-04-28 14:38:13
阅读次数:
966
sudo apt-get install
python-software-propertiessudo apt-add-repository ppa:brightbox/ruby-ngsudo
apt-get updatesudo apt-get install ruby2.1ruby2.1 -vr...
分类:
其他好文 时间:
2014-04-28 14:18:29
阅读次数:
445
1.ActivityManager类解析 获得实例 ActivityManager
activityManager= (ActivityManager)
context.getSystemService(Context.ACTIVITY_SERVICE); 内部类 1).Activi...
分类:
移动开发 时间:
2014-04-28 14:16:30
阅读次数:
670
2014-04-27
20:25题目:关于java中标有synchronized的成员方法?解法:这代表同一个对象实例的synchronized方法不能被多个线程同时调用。注意有这么多个地方都加粗了,如果这些条件有一个不满足的话,就是可以调用的。另外,如果此方法是静态成员方法,
那么总可以认为是“同...
分类:
编程语言 时间:
2014-04-28 01:16:06
阅读次数:
583
对于类而言,为了让使用者获取它自身的一个实例,最常见的方法就是提供一个公有的构造器。但是有一种方法,他就是静态工厂方法(static factory
method),它只返回类的实例的静态方法。比如说我们所有的基本类型的封装类中的valueOf()方法1 public static Boolean ...
分类:
其他好文 时间:
2014-04-28 00:34:52
阅读次数:
452
方法一GetWindowLong(hwnd,
GWL_HINSTANCE);获取该窗口句柄做用的实例句柄?方法二WM_CREATE? lpcs = (LPCREATESTRUCT) lParam;
lpcs->hInstance;
分类:
其他好文 时间:
2014-04-27 21:33:22
阅读次数:
428