前言*Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook和Yahoo等等。对于我来说,最近的一个使用点就是服务集成平台的日志分析。服务集成平台的日志量将会很大,而这也正好符合了分布式计算的适用场景(日志分析和索引..
分类:
其他好文 时间:
2017-02-21 20:00:49
阅读次数:
269
本文由ArthurXF倾情奉献,转载请保留作者说明. 一直对股票编程很有兴趣,股票的数据从哪里来成了一个大问题,股票软件一般都是加密处理的,还有一些web services也是要帐号的,免费的方法只有一种了,经我网上查资料发现yahoo提供国内和国外股市每天的交易数据资料,这可谓一大幸事啊。http ...
分类:
其他好文 时间:
2017-02-13 13:53:24
阅读次数:
245
转自:http://www.cnblogs.com/lei2007/archive/2013/08/16/3262897.html
除了自己总结:1. 减少http请求,2.压缩并优化js/c...
分类:
其他好文 时间:
2017-02-13 11:32:54
阅读次数:
261
原网址https://segmentfault.com/a/1190000007062464 内容精简 资源这么多,多看看多学习再总结肯定是好的。多读读就算看重了不算浪费时间,毕竟一千个读者就有一千个林黛玉,还有温故而知新,说不定多读一些内容,就发现惊喜了呢。不过,在此也精简一些内容,就1~2项,只 ...
分类:
Web程序 时间:
2017-02-10 19:49:28
阅读次数:
345
前景 Python可以应用于众多领域,如:数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python,如:Youtube、Dropbox、BT、Quora(中国知乎)、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、 ...
分类:
编程语言 时间:
2017-01-21 22:15:02
阅读次数:
368
hourly job 周期生成outputpath,一个小时一个, daily job 检查hourly job的outputpath,检查过去24小时内的每个路径,只有全部路径全部存在才会执行daily任务。 具体参考 https://github.com/yahoo/oozie/wiki/Ooz ...
分类:
其他好文 时间:
2017-01-12 10:23:47
阅读次数:
407
原文链接: http://www.cnblogs.com/fnng/archive/2013/05/29/3106515.html 1.起因:在网页抓取的过程中,有些内容是通过js加载的,但是直接抓取是抓取不到的 2.selenium+python 映入眼帘 3.selenium 是一个web的自动 ...
分类:
编程语言 时间:
2017-01-12 08:13:03
阅读次数:
194
犹太复国有4点:1. 曾经复过国,创业的独创性是不用说的,反过来跟团队说,有人干成过,只是换了一个新载体而已。激发作用不可低估。 所有人在这个创业过程中,看到自己的希望。新浪说我是中国的yahoo,百度说我是中国的google。 到传统中寻找精神资源2. 历经苦难,但是没有被击垮 创业者应该赢得尊重 ...
分类:
其他好文 时间:
2017-01-05 00:52:00
阅读次数:
299
/**************************** 字符串转成16进制 作者:不得闲 QQ: 75492895 Email: appleak46@yahoo.com.cn ****************************/ --创建函数(suiyunonghen(不得闲)) Crea ...
分类:
其他好文 时间:
2017-01-03 15:29:38
阅读次数:
181
如何能让用户更快的打开我们的网页? 1、尽可能减少HTTP请求数 2、使用CDN(内容分发网络) 3、添加Expire/Cache-Control头 4、启用Gzip压缩 5、将CSS放在页面最上面 6、将Script放在页面最下面 7、避免在CSS中使用Expressions 8、将JavaScr ...
分类:
Web程序 时间:
2016-12-27 00:51:37
阅读次数:
146