Parquet是Twitter贡献给开源社区的一个列数据存储格式,采用和Dremel相同的文件存储算法,支持树形结构存储和基于列的访问。Cloudera Impala也将使用Parquet作为底层的存储格式。在很多大数据的应用场景下面,比如电信行业,具有一定规则的数据,字段很多,但是每次查询仅仅针对 ...
分类:
其他好文 时间:
2017-03-14 13:14:35
阅读次数:
368
shuffle(),将一维数组打乱顺序,成功返回1,失败返回0; array_chunk($arr,$num),可以将一维数组$arr长度4个为一组,分割成若干个小数组 ...
分类:
编程语言 时间:
2017-03-14 13:08:54
阅读次数:
194
线程与进程的应用场合很多,主要处理并发与多任务。然而,当开启的线程与进程过多时,系统的开销过多会造成性能低下甚至崩溃。这时,希望出现一种方法能规定只能执行指定数量线程与进程的策略。特别是针对不知道要开启多少线程或进程,而有可能出现线程或进程过多的情况。于是,线程池与进程池出现了。python3以后增 ...
分类:
编程语言 时间:
2017-03-12 19:27:50
阅读次数:
243
浏览器加载和渲染html的顺序、如何加快HTML页面加载速度、HTML页面加载和解析流程等等,在本文将为大家详细介绍下,感兴趣的朋友不要错过 浏览器加载和渲染html的顺序 1. IE下载的顺序是从上到下,渲染的顺序也是从上到下,下载和渲染是同时进行的。 2. 在渲染到页面的某一部分时,其上面的所有 ...
分类:
Web程序 时间:
2017-03-09 15:27:09
阅读次数:
162
RTMP协议是一个互联网TCP/IP五层体系结构中应用层的协议。RTMP协议中基本的数据单元称为消息(Message)。当RTMP协议在互联网中传输数据的时候,消息会被拆分成更小的单元,称为消息块(Chunk)。 1 消息 消息是RTMP协议中基本的数据单元。不同种类的消息包含不同的Message ...
分类:
其他好文 时间:
2017-03-08 01:03:24
阅读次数:
215
首先nginx不分64位或者32位 nginx的简单说明 a. Nginx是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器,期初开发的目的就是为了代理电子邮件服务器室友:Igor Sysoev开发,源代码符合BSD开源。其特点就是占用内存少并发能力强,在天朝使用Ng ...
分类:
其他好文 时间:
2017-02-19 23:44:10
阅读次数:
220
以PHP代码为例 //这个是解析chuned块 get_chunk_data($fsock) { $data = ''; while(true) { $len = hexdec(fgets($fsock)); if($len == 0) { if(fgets($fsock) == "\r\n") b ...
分类:
Web程序 时间:
2017-02-17 23:03:59
阅读次数:
220
1 引言 NoSQL,全称是“Not Only Sql”,指的是非关系型的数据库。这类数据库主要有这些特点:非关系型的、分布式、开源的、水平可扩展的。原始目的是为了大规模web应用,这场全新的数据库革命运动早期就有人提出,发展至2009年趋势越发高涨。非关系型的数据存储通常的应用如:模式自有、支持简 ...
分类:
数据库 时间:
2017-02-17 21:48:24
阅读次数:
244
前言 前言 前言 通常在搜索打分完毕后,IndexSearcher会返回一个docID序列,但是仅仅有docID我们是无法看到存储在索引中的document,这时候就需要通过docID来得到完整Document信息,这个过程就需要对fdx/fdt文件进行读操作。为了更清楚地了解fdx/fdt文件的作 ...
分类:
编程语言 时间:
2017-02-13 21:52:55
阅读次数:
380
array() 创建数组array_combine() 通过合并两个数组来创建一个新数组range() 创建并返回一个包含指定范围的元素的数组compact() 建立一个数组array_chunk() 将一个数组分割成多个array_merge() 把两个或多个数组合并成一个数组array_slic ...
分类:
编程语言 时间:
2017-02-10 12:49:55
阅读次数:
195