参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。
1、获得html文本。 python在获取html方面十分方便,寥.....
分类:
编程语言 时间:
2014-04-28 15:31:09
阅读次数:
712
sudo apt-get install
python-software-propertiessudo apt-add-repository ppa:brightbox/ruby-ngsudo
apt-get updatesudo apt-get install ruby2.1ruby2.1 -vr...
分类:
其他好文 时间:
2014-04-28 14:18:29
阅读次数:
445
Java线程池使用说明一
简介线程的使用在java中占有极其重要的地位,在jdk1.4极其之前的jdk版本中,关于线程池的使用是极其简陋的。在jdk1.5之后这一情况有了很大的改观。Jdk1.5之后加入了java.util.concurrent包,这个包中主要介绍java中线程以及线程池的使用。为我...
分类:
编程语言 时间:
2014-04-28 13:27:01
阅读次数:
708
一转眼就过去了75天,对于工作开始有了一点眉目,但是要学习的东西还有太多,不免还是有些慌乱,看到什么都想学,又被时间所掣肘。只能忍痛割爱先解决技术基础这个当务之急。先对前期的工作生活做点总结,然后规划下个周期的工作计划。小插曲:上个星期三,刚发布给客户浏览软件新版本的第二天,客户打电话过来说有一些修...
分类:
其他好文 时间:
2014-04-28 12:47:41
阅读次数:
426
Xcode5.1默认不支持iOS5版本的模拟器开发调试,在OS X
Mavericks(10.9.x)下默认只能支持iOS6.1及以上版本的模拟器,在OS X Mountain
Lion(10.8.x)下默认只能支持iOS6.0及以上版本的模拟器进行开发和调试,在此条件之下的版本只能使用硬件设备进行...
分类:
移动开发 时间:
2014-04-28 11:10:42
阅读次数:
818
在使用opencv的过程中,无论使用原始的IplImage和CvMat类型,还是用最新C++版本的Mat类型,在创建和使用过程中,经常会遇到CV_8UC1、CV_8UC3、CV_32FC3等声明,我以前也经常遇到,曾经看懂了,现在又忘记了,现在把它写下来,方便以后查看,遇到同样问题的菜鸟也能尽快.....
分类:
其他好文 时间:
2014-04-28 10:38:57
阅读次数:
539
Oracle在9i或者早期的版本,对于性能优化方面,主要采用命中率模型,后面的版本,也保留着命中率模型,比如在awr报告中,Instance
Efficiency Percentages (Target 100%)就有关于buffer cache,library
cache等相关的命中率。命中率在性...
分类:
数据库 时间:
2014-04-28 03:20:03
阅读次数:
807
·为Web应用增加Struts2支持1.
登陆struts2官网下载struts2的最新版,本文所用的是Struts
2.3.16.2我们所下载的压缩包内内容应给如下其中,apps包含了struts2的实例应用,docs包含了struts2的相关文档,lib包含了Struts2框架的核心类库以及st...
分类:
编程语言 时间:
2014-04-27 22:26:38
阅读次数:
626