1,采集网页用的curl 系列函数。 可以模拟登陆,模拟ip,抓取网页,通过抓取的网页来提取数据。 2,flock 文件锁。 ( LOCK_SH取得共享锁定(读取的程序)。 LOCK_EX 取得独占锁定(写入的程序。 LOCK_UN 释放锁定(无论共享或独占) ) 用在模拟进程锁方面的。 3,fso...
分类:
其他好文 时间:
2014-08-08 21:00:06
阅读次数:
314
今天实际操作了一下,正则表达式的提取,再此做一下总结。首先先介绍一下正则表达式需要使用到的符号,并解释一下:################################################################################################...
分类:
其他好文 时间:
2014-08-08 18:03:06
阅读次数:
178
本节介绍的数组处理函数能够完成一些更复杂的数组处理任务,可以把数组作为一个集合处理。例如,对两个货多个数组进行合并,计算数组间的差集或交集,从数组元素中提取一部分,以及完成数组的比较。
分类:
其他好文 时间:
2014-08-08 15:29:06
阅读次数:
207
为了记录工作中碰到的各种问题,以及学习资料整理,今天开始,将以往的文章进行了一个整理,以后也开始认真的记录学习过程中的各种问题在HTML里面的文件上传功能一直是个问题,为了实现上传文件大小限制,怎样显示进度条问题,以及上传前图片预览,也试过各种办法,直到有一天看到百度编辑器中的图片上传功能。花了点功...
分类:
其他好文 时间:
2014-08-08 12:16:45
阅读次数:
337
问题实例:海量日志数据,提取出某日访问百度次数最多的那个IP。答:对于ip,最多也就2^32个。所以可以很好地通过hash函数映射到内存中,再进行统计。原理简述:hash的基本原理网上也已经很多了,下面简单提一下。在ssh协议加密中,sha-1就是通过哈希来进行的。哈希就是将一个字符串或者其他数字之...
分类:
其他好文 时间:
2014-08-07 22:50:15
阅读次数:
290
request.getAttribute():是request时设置的变量的值,用request.setAttribute("name","您自己的值");来设置值,
request.getParameter():提取发送过来的参数如:本网页
request.getParameter
是用来接受来自get方法或post方法的参数
ok
只能接受java.lang.String
...
分类:
其他好文 时间:
2014-08-07 18:59:00
阅读次数:
189
就在刚刚,微信公众平台发布了数据统计功能更新,增加更多统计项,包括用户增长来源、用户使用的终端/机型、图文消息详细属性、图文阅读渠道、图文收藏统计、提取用户发送消息的关键词等相关功能,详情查看微信团队的公告。公众平台数据统计功能更新,增加更多统计项1. 用户增长页增加增长来源统计,可按来源查看新.....
分类:
微信 时间:
2014-08-07 18:40:51
阅读次数:
313
Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。将数据从ORACLE中抽取数据,经过hive进行分析转换,最后存放到ORACLE中去。本案例是纯demo级别,练手使用一、需求将emp和dept表的数据分析最后存放到result表。emp和de...
分类:
其他好文 时间:
2014-08-06 22:14:52
阅读次数:
371
收缩或者删除临时表空间很实用的方法,是从外国的文章中提取出来的。...
分类:
其他好文 时间:
2014-08-06 18:59:21
阅读次数:
180
说说:万万没想到会在这道题上花费这么多时间。这道题其实就是比较繁琐而已,需要一个比较大的结构记录一个队伍的所有信息。原以为最难的是对比赛结果字符串的提取,但事实证明这倒还挺简单的。关键是后面对比赛结果的排序,原理相对简单,代码较庞大。需要注意的是,最后如果按队名排序是不区分大小写的,并且队名不只是英文字母!而且这里提一下C的语言特性,如果在调用一个返回字符指针的函数,且返回的是被调用函数内定义的字...
分类:
其他好文 时间:
2014-08-06 11:56:31
阅读次数:
272