某城镇进行人口普查,得到了全体居民的生日。现请你写个程序,找出镇上最年长和最年轻的人。
这里确保每个输入的日期都是合法的,但不一定是合理的——假设已知镇上没有超过200岁的老人,而今天是2014年9月6日,所以超过200岁的生日和未出生的生日都是不合理的,应该被过滤掉。
输入格式:
输入在第一行给出正整数N,取值在(0, 105];随后N行,每行给出1个人的姓名(由不超过5个英文字母组成的字...
分类:
其他好文 时间:
2014-09-22 14:11:42
阅读次数:
355
生日(DATE)计算方法1:YEAR(CURDATE())-YEAR(birthday)-(RIGHT(CURDATE(),5)<RIGHT(birthday,5))计算方法2:year( from_days( datediff( now( ), birthdate))) now() 当前时间,精确...
分类:
数据库 时间:
2014-09-22 12:09:42
阅读次数:
195
最近在做项目的时候有一个需求:从网页面抓取数据,要求是首先抓取整个网页的html源码(后期更新要使用到)。刚开始一看这个简单,然后就稀里哗啦的敲起了代码(在这之前使用过Hadoop平台的分布式爬虫框架Nutch,使用起来是很方便,但是最后因为速度的原因放弃了,但生成的统计信息在后来的抓取中使用到.....
分类:
编程语言 时间:
2014-09-22 02:43:01
阅读次数:
301
1、 爬虫(Spider)——数据来源 作为搜索引擎海量数据的来源,爬虫是搜索引擎技术的重要一环,闻道软件工作室有自己开发的爬虫,所以对此技术很熟悉。 爬虫的英文是Spider,其实翻译成蜘蛛更容易理解,无数网站的链接构成了一张巨大的网,搜索引擎的内容采集程序就像一只只勤劳的蜘蛛在这张网上爬...
分类:
其他好文 时间:
2014-09-22 02:11:11
阅读次数:
308
四、更新策略 互联网是实时变化的,具有很强的动态性。网页更新策略主要是决定何时更新之前已经下载过的页面。常见的更新策略又以下三种: 1.历史参考策略 顾名思义,根据页面以往的历史更新数据,预测该页面未来何时会发生变化。一般来说,是通过泊松过程进行建模进行预测。 2.用户体验策略 尽管搜索引擎针对于....
分类:
其他好文 时间:
2014-09-22 00:31:21
阅读次数:
219
1. 网站结构 对于搜索引擎优化,网站的结构是最重要的因素之一。网站结构是所有关于你的网页是如何联系在一起。搜索引擎爬虫的基础上它的设置方式判断你的网站的价值。文件层次结构和站点地图起到无论是否获得高排名第至关重要的作用。 如果你想受到广大用户寻找你相关的关键字可以找到,你的网站需要逻辑布局,易.....
分类:
其他好文 时间:
2014-09-20 21:08:09
阅读次数:
309
1109: [POI2007]堆积木KloTime Limit:10 SecMemory Limit:162 MBSubmit:530Solved:172[Submit][Status]DescriptionMary在她的生日礼物中有一些积木。那些积木都是相同大小的立方体。每个积木上面都有一个数。M...
分类:
其他好文 时间:
2014-09-20 16:36:29
阅读次数:
212
一直以来,公司每遇到同事过生日,都有聚餐的习惯。一开始,大家都比较期待,吃饭,聊聊天、放松放松。随着次数越来越多,大家对聚在一起慢慢的也就逐渐失去了激情和期待,吃饭似乎成了一种形式和任务。每次聚餐,席间,往往是老板和几个女生闲聊几句,大部分人不发一言,整个聚餐似乎没有什么话题和其他有价值的事情。饭总...
分类:
其他好文 时间:
2014-09-19 17:04:55
阅读次数:
226
昨天晚上为了下载保存某位csdn大牛的全部博文,写了一个爬虫来自动抓取文章并保存到txt文本,当然也可以 保存到html网页中。这样就可以不用Ctrl+C 和Ctrl+V了,非常方便,抓取别的网站也是大同小异。
为了解析抓取的网页,用到了第三方模块,BeautifulSoup,这个模块对于解析html文件非常有用,当然也可以自己使用正则表达式去解析,但是比较麻烦。
由于csdn网站的robots.txt文件中显示禁止任何爬虫,所以必须把爬虫伪装成浏览器,而且不能频繁抓取,得sleep一会再抓,使用频繁会...
分类:
编程语言 时间:
2014-09-19 13:57:15
阅读次数:
284
近日本人维护的一个客户网站打开非常慢,于是便按照以往的排查步骤进行排查1,登录服务器top命令查看负载IO情况发现负载有点高并有很多php进程占了很大的资源2,进入mysql服务器查看数据库线程,并没有发现锁表情况。3,打开web访问日志发现有很多百度爬虫访问。导致点了很多..
分类:
Web程序 时间:
2014-09-18 16:51:24
阅读次数:
207