1293: [SCOI2009]生日礼物Time Limit:10 SecMemory Limit:162 MBSubmit:983Solved:526[Submit][Status]Description小西有一条很长的彩带,彩带上挂着各式各样的彩珠。已知彩珠有N个,分为K种。简单的说,可以将彩带...
分类:
其他好文 时间:
2014-08-23 09:54:30
阅读次数:
254
题目链接http://acm.hdu.edu.cn/showproblem.php?pid=1201这个题目在比赛的时候提交了很多次,都是WA,主要错在,我没有考虑最后一年的,后一年,即y+18那一年如果是闰年并且月份m>=3||(m==2&&d==29)那么天数要多加一天。分三个部分 y y+1....
分类:
其他好文 时间:
2014-08-23 08:47:10
阅读次数:
256
七日python之路 七日python -- 第一天 七日python -- 第二天 ... scrapy爬虫 python爬虫----(1. 基本模块) ... pytnon基础 python基本 -- threading多线程模块的使用 python基本 -- mysql 的使用...
分类:
其他好文 时间:
2014-08-23 04:38:50
阅读次数:
171
所有类型的企业都可能受到攻击,但金融机构是最易受攻击的企业。根据趋势科技的报告显示,网络威胁、数据泄漏和高危漏洞继续主导着2014年的上半年,攻击感染者消费者的个人信息,包括窃取客户名称、密码、电子邮件地址、家庭住址、电话号码和出生日期等。 本季度记录的数据泄漏和分布式拒绝服务(DDoS)攻击...
分类:
其他好文 时间:
2014-08-22 19:37:19
阅读次数:
199
import mysql.connectorimport sys, osimport urllib.requestimport reimport itertoolsimport base64search_item='金融'#搜索项改这个就可以了#以后只需要修改search_item就可以了#转成by...
分类:
其他好文 时间:
2014-08-22 16:02:29
阅读次数:
197
使用 libtorrent 的python绑定库实现一个dht网络爬虫,抓取dht网络中的磁力链接。 dht 网络简介 p2p网络 在P2P网络中,通过种子文件下载资源时,要知道资源在P2P网络中哪些计算机中,这些传输资源的计算机称作pee...
分类:
编程语言 时间:
2014-08-22 14:40:39
阅读次数:
222
闲的时候一直在自己研究爬虫相关的东西,看过一两个开源框架,自己照猫画虎的写了一个,目前看来我的爬虫可以用了,但还是有很多不足,把我目前的经验写出来跟大家分享一下。 国外爬虫的局限 1.太守规矩(如果有Robot文件就要按着爬) 2.无法自由切换代理,如果切换代理对所有线程都有影响,...
分类:
其他好文 时间:
2014-08-22 10:35:25
阅读次数:
321
利用xpath()分析抓取数据还是比较简单的,只是网址的跳转和递归等比较麻烦。耽误了好久,还是豆瓣好呀,URL那么的规范。唉,亚马逊URL乱七八糟的.... 可能对url理解还不够. amazon
├──?amazon
│??...
分类:
编程语言 时间:
2014-08-22 05:03:45
阅读次数:
3369
本章描述:对于Protocol的封装 package?com.digitalpebble.storm.crawler.fetcher;
import?com.digitalpebble.storm.crawler.util.Configuration;
public?interface?Protocol?{
????public?Protoco...
分类:
其他好文 时间:
2014-08-21 19:45:55
阅读次数:
147
package?com.digitalpebble.storm.crawler;
import?backtype.storm.Config;
import?backtype.storm.metric.MetricsConsumerBolt;
import?backtype.storm.metric.api.IMetricsConsumer;
import?backtype.st...
分类:
其他好文 时间:
2014-08-21 17:25:44
阅读次数:
185