参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
在这里,我对于项目提出功能导航系统。即为每个导航地点分组,按功能属性统计并罗列在一起,在导航页面提供目的性查询,让客户通过勾选想要进行的活动来提供目的地和导航路线。并将各地点在功能搜索页面罗列出来并给出具体坐标。如:餐饮,上课,运动,购物,出行,标志建筑,专业分属等Need:需求方面,直接从导航的....
分类:
其他好文 时间:
2014-04-28 16:58:15
阅读次数:
595
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。
1、获得html文本。 python在获取html方面十分方便,寥.....
分类:
编程语言 时间:
2014-04-28 15:31:09
阅读次数:
712
最直观的解法,排序之后取下标为k的值即可。但是此处采取的方法为类似快速排序分块的方法,利用一个支点将序列分为两个子序列(支点左边的值小于支点的值,支点右边大于等于支点的值)。如果支点下标等于k,则支点就是查找的值,如果支点的下标大于k,则在左子序列里继续寻找,如果支点下标小于k,则继续在支点右子序列...
分类:
其他好文 时间:
2014-04-28 14:20:26
阅读次数:
458
sudo apt-get install
python-software-propertiessudo apt-add-repository ppa:brightbox/ruby-ngsudo
apt-get updatesudo apt-get install ruby2.1ruby2.1 -vr...
分类:
其他好文 时间:
2014-04-28 14:18:29
阅读次数:
445
默认统计信息收集:1.
11g默认启动了统计信息收集的任务,默认运行时间是周一到周五晚上10点和周6,周天的早上6点2.
你也可以关闭自动统计新收集任务,选择手工收集的方式,但是一般不建议这样操作。动态统计信息:1.
统计信息默认情况下是每天晚上10点半后收集,如果新建对象还没来得级收集统计信息,就...
分类:
数据库 时间:
2014-04-28 12:37:57
阅读次数:
844
赵静娜:物品跟随系统:1、N(需求)由于自己经常性的忘记东西放在哪里,到用的时候找不到。并且很多同学都有类此这种情况,所以为了缓解这个问题,想设计出物品跟随系统,可以利用系统对物品的行踪进行跟随,有利于对物品的查找。2、A(做法)首先要建立一个用户个人物品的数据库,统计记录个人物品的信息。其次要设计...
分类:
其他好文 时间:
2014-04-28 11:28:30
阅读次数:
528
统计SQL执行时间和次数的语句:SELECT top 50qt.text AS
SQL_text ,SUM(qs.total_worker_time) AS total_cpu_time,SUM(qs.execution_count) AS
total_execution_count,SUM(qs....
分类:
数据库 时间:
2014-04-28 11:14:38
阅读次数:
640
共生矩阵用两个位置的像素的联合概率密度来定义,它不仅反映亮度的分布特征,也反映具有同样亮度或者接近亮度的像素之间的位置分布特性,是有关图像亮度变化的二阶统计特征。它是定义一组纹理特征的基础。由于纹理是由灰度在空间位置上反复出现而形成的,因而在图像空间中像个某距离的两像素之间会存在一定的灰度关系,即图...
分类:
其他好文 时间:
2014-04-28 10:48:49
阅读次数:
547