来自:http://blog.csdn.net/macyang/article/details/7880671所谓的推测执行,就是当所有task都开始运行之后,Job Tracker会统计所有任务的平均进度,如果某个task所在的task node机器配置比较低或者CPU load很高(原因很多),...
分类:
其他好文 时间:
2014-07-09 21:05:18
阅读次数:
248
由于在生产环境中大量使用hive,而hive的权限又较弱,如果可以记录所有hive操作,在增强安全性的同时,还能够统计hive表的使用频率;同时如果能够记录hql的开始和结束时间,则能够找出系统中花费时间较多的job,针对性的进行优化,因此跟踪hive的使用轨迹,增强安全的同时也能方便问题定位。如何记录用户操作了?Hive Hook为我们提供的方便的开放接口。
我们对hive的使用主要有两种使用...
分类:
其他好文 时间:
2014-07-09 10:21:05
阅读次数:
233
线上一个job出错,报错信息如下:DiagnosticMessagesforthisTask:
Error
:
java.io.IOException:java.io.EOFException:Unexpectedendofinputstream
atorg.apache.hadoop.hive.io.HiveIOExceptionHandlerChain.handleRecordReaderNextException(HiveIOExceptionHandlerChain.jav..
分类:
其他好文 时间:
2014-07-09 08:40:55
阅读次数:
347
Max Sum
Time Limit: 2000ms Memory limit: 32768K 有疑问?点这里^_^
题目描述
Given a sequence a[1],a[2],a[3]......a[n], your job is to calculate the max sum of a sub-sequence. For example, given (6,-...
分类:
其他好文 时间:
2014-07-08 21:30:17
阅读次数:
205
#!/usr/bin/envpythonfromQueueimportQueuefromthreadingimportThreadimportrandomimporttimedefperson(i,q):whileTrue:#这个人一直处与可以接活干的状态q.get()print"Thread",i,"do_job"time.sleep(random.randint(1,5))#每个人干活的时间不一样,自然就会导致每个人分配的件..
分类:
编程语言 时间:
2014-07-08 09:48:06
阅读次数:
222
一、部署环境:服务器版本:CentOS6.5双主热备模式:VIP:192.168.3.30(MASTER上)VIP:192.168.3.32(BACKUP上)主机网络参数:接口MASTERBACKUP说明eth1192.168.3.23192.168.3.24内网管理IPeth2192.168.5.23192.168.5.24心跳线eth3192.168.2.23192.168.2.24外网(临时下载文..
分类:
其他好文 时间:
2014-07-08 09:31:20
阅读次数:
388
最近进行Jira升级,发现升级后,从Jira4.x中导出的zip备份文件不能导入到Jira 6.x最新版中,很是郁闷啊。 后来只能比对两个版本之间差异,然后挨个拷贝XML片段进行升级。 升级的大概步骤如下: 一、在新版本jira中,先backup一个文件样例,然后找到该zip包,解压缩后,可以看到:...
分类:
其他好文 时间:
2014-07-06 18:50:37
阅读次数:
182
RMAN高级设置.本章内容:Configuring Advanced Channel Options 高级通道选项Configuring Advanced Backup Options 高级备份选项Configuring Auxiliary Instance Data File Names 配置辅助...
分类:
其他好文 时间:
2014-07-05 22:46:32
阅读次数:
539
DAGScheduler的主要功能1、接收用户提交的job;2、将job根据类型划分为不同的stage,并在每一个stage内产生一系列的task,并封装成TaskSet;3、向TaskScheduler提交TaskSet;以如下示例描述Job提交过程:val sc = new SparkConte...
分类:
其他好文 时间:
2014-07-05 21:16:38
阅读次数:
198
今天在闲暇时间练习了一下oracle任务计划,具体详情如下1.创建表TBL_TIMEcreatetabletbl_time(
idnumbernotnull,/*id号*/
vsecondvarchar2(2),/*秒*/
vtimevarchar2(10)/*当前时间*/
)2.创建序列seq_tbltimecreatesequenceseq_tbltime
startwith1
incrementby1
nomaxval..
分类:
数据库 时间:
2014-07-04 06:03:32
阅读次数:
386