参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。
1、获得html文本。 python在获取html方面十分方便,寥.....
分类:
编程语言 时间:
2014-04-28 15:31:09
阅读次数:
712
SELECT COUNT(*) AS 多少组数FROM( SELECT id FROM 表 GROUP
BY id) subQuery;Mysql,有一个表含有以下字段,uid 发帖人id,title 发帖标题,tc 发帖内容,time
发帖时间,用一条语句算出昨天发帖书大于10的,一...
分类:
数据库 时间:
2014-04-28 14:40:10
阅读次数:
937
sudo apt-get install
python-software-propertiessudo apt-add-repository ppa:brightbox/ruby-ngsudo
apt-get updatesudo apt-get install ruby2.1ruby2.1 -vr...
分类:
其他好文 时间:
2014-04-28 14:18:29
阅读次数:
445
默认行为 默认为SETXACT_ABORTOFF,没有事务行为。SETXACT_ABORTON
SETXACT_ABORTON分为两种: 1、总体作为一个事务,整体提交或整体回滚,格式为:SET XACT_ABORT ONBEGIN TRAN
--要执行的语句COMMIT TRANGO ...
分类:
其他好文 时间:
2014-04-28 12:55:42
阅读次数:
522
对于实际的业务系统,通常有一些热点的表,insert和delete的量非常大,这个时候就会发现一些查询语句的逻辑读比较偏高,这时可能就是oracle在构建一致性块的进行的consistent
read。下面做一个测试看下:第一步准备数据:create table test(col1 varchar2...
分类:
数据库 时间:
2014-04-28 03:57:41
阅读次数:
821
java中的Switch case 语句 在Switch语句中有4个关键字:switch,case
break,default.
在switch(变量),变量只能是整型或者字符型,程序先读出这个变量的值,然后在各个"case"里查找哪个值和这个变量相等,如果相等,则条件成立,程序执行相应...
分类:
编程语言 时间:
2014-04-28 01:23:56
阅读次数:
643
Java的基础语法中包含字符集、标识符和关键字、变量和常量、语句、注释、运算符和表达式这些基本要素。
一、关键字 编程语言都有一些保留的单词,用于定义该语言,这些单词对于编译器有特殊含义,不能作为标识符使用;
Java中的true、false、null这三个保留字,不能作为标识符使用,对于...
分类:
编程语言 时间:
2014-04-27 22:36:25
阅读次数:
639
Java语言中,对于变量,常量,函数,语句块名字,接口和自定义数据类型
统统称之为Java标识符。标识符是命名用的。
标识符组成Java标识符由数字,字母和下划线(_),美元符号($)组成,其他什么×%#符号都不能出现。在Java中是区分大小写的,而且还要求首位不能是数字。最重要的是,Java关键....
分类:
编程语言 时间:
2014-04-27 22:22:34
阅读次数:
606