Pig的自定义函数有三种:1、自定义过滤函数:相当于where条件2、自定义运算函数:3、自定义加载函数:使用load语句加载数据,生成一个bag 默认:一行解析成一个Tuple 需要MR的jar包 一.自定义过滤函数 二.自定义运算函数 三.自定义加载函数 注册jar包: register def ...
分类:
其他好文 时间:
2018-03-26 23:41:00
阅读次数:
378
一. HBase过滤器 二. HDFS上的mapreduce 建立表 create 'word','content' put 'word','1','content:info','I love Beijing' put 'word','2','content:info','I love China' ...
分类:
其他好文 时间:
2018-03-26 16:08:22
阅读次数:
184
"Portal" Description 模板题啦~ 推荐WJMZBMR在WC2012上的讲义 "《后缀自动机》" 。 Code ...
分类:
其他好文 时间:
2018-03-24 00:46:43
阅读次数:
181
比如: 北京时间比UTC时间早8小时,比如说UTC时间1月21日中午12:00,北京时间是1月21日20:00 12:00 + 8 = 20 ...
分类:
其他好文 时间:
2018-03-22 13:33:57
阅读次数:
194
【传送门:BZOJ2663】 简要题意: 给出n个人的坐标和n个宝石的坐标,坐标之间的距离为欧几里德距离,只有当一个人与一个宝石的距离<R时,这个人才能控制自己的身躯 求出满足恰好k个人能够控制自己的身躯的最小的R值和最大的R值(指的是最坏情况下,R的最大值,如果R为正无穷,则输出+INF) 题解: ...
分类:
其他好文 时间:
2018-03-21 11:34:08
阅读次数:
173
In the big cities, the subway systems always look so complex to the visitors. To give you some sense, the following figure shows the map of Beijing su ...
分类:
其他好文 时间:
2018-03-16 23:46:57
阅读次数:
435
1.date 默认直接输入 date 显示当前系统时间 高级使用方法: 1. date [OPTION]...[+FORMAT] 2. date [-u|--utc|--universal] [MMDDhhmm[[cc]YY][.ss]] 第一种用法是一种显示时间方法: 1 [root@centos ...
分类:
其他好文 时间:
2018-03-08 20:15:45
阅读次数:
230
1.索引作用 在索引列上,除了上面提到的有序查找之外,数据库利用各种各样的快速定位技术,能够大大提高查询效率。特别是当数据量非常大,查询涉及多个表时,使用索引往往能使查询速度加快成千上万倍。 例如,有3个未索引的表t1、t2、t3,分别只包含列c1、c2、c3,每个表分别含有1000行数据组成,指为 ...
分类:
数据库 时间:
2018-03-08 12:15:28
阅读次数:
165
1. 代理 北京的服务器:www.beijing.com/service.php 上海的服务器:www.beijing.com/proxy-shanghaiservice 比如在北京的web服务器后台(www.beijing.com/proxy-shanghaiservice)来调用上海服务器(ww ...
分类:
其他好文 时间:
2018-03-05 20:47:56
阅读次数:
131
突然发现打勾股数的表是不需要的。 但是打都打了,就不改了。 拆点,左边的点连向右边可匹配的点,然后直接费用流即可。因为对于最优解,两个数一定是相互选择的。所以答案除个2就行。 最大费用最大流把费用改成负数就可以直接用最小跑了。 ...
分类:
其他好文 时间:
2018-02-27 14:57:37
阅读次数:
195