◎新媒体做自媒体的还不如玩QQ群的:人家轻松月赚10万东方卫视谈与阿里合作:拥抱互联网,是“我们最后的疯狂”社会化阅读:ZAKER进入瓶颈期◎大数据不打破数据割据,大数据还是“乌托邦”◎可穿戴设备/硬件糖尿病患者福音:iHealth推出小型血糖仪 可插在智能手机耳机孔内使用◎电商中小网站如何使用谷....
分类:
其他好文 时间:
2014-06-18 17:04:09
阅读次数:
223
我们知道,一个典型的Map-Reduce过程包 括:Input->Map->Partition->Reduce->Output。Partition负责把Map任务输出的中间结果 按key分发给不同的Reduce任务进行处理。Hadoop 提供了一个很有用的partitioner类KeyFieldBa...
分类:
编程语言 时间:
2014-06-18 17:00:55
阅读次数:
332
前言今天Spark最终跨出了里程碑的一步,1.0.0版本号的公布标志着Spark已经进入1.0时代。1.0.0版本号不仅增加了非常多新特性,而且提供了更好的API支持。Spark SQL作为一个新的组件增加,支持在Spark上存储和操作结构化的数据。已有的标准库比方ML、Streaming和Grap...
分类:
其他好文 时间:
2014-06-18 15:29:22
阅读次数:
208
sqoop版本为1.4.4,hadoop版本为2.2.0,hive版本为0.11.0,hive元数据存放位置为mysql,当使用sqoop 从mysql往hive中导入数据时,总是提示找不到所指定的hive数据库,事实上hive中已存在该数据库,sqoop中也设置了hive路 径,/etc/pro....
分类:
数据库 时间:
2014-06-18 15:06:57
阅读次数:
248
1、问题:start-all.sh结果jps发现namenode没有启动,其它进程都启动2、查看日志,没有namenode生产的日志3、奇了,检查其它进程的日志,都在重新连接namenode Zzzzzzz.....4、记得虚拟机是直接关机的,未执行stop-all.sh5、删除tmp目录(metd...
分类:
其他好文 时间:
2014-06-18 13:49:33
阅读次数:
252
【2014中国数据库技术大会】内存计算:百分点内存数据库架构演变Posted on2014 年 5 月 5 日byadmin【IT168数据库大会现场报道】2014年4月10日-12日,第五届中国数据库技术大会(DTCC 2014)在北京五洲皇冠国际酒店拉开序幕。在为期三天的会议中,大会将围绕大数据...
分类:
数据库 时间:
2014-06-18 13:37:42
阅读次数:
341
我们以前在开发大数据量的分页存储过程时,往往都为了怎么样实现高效的性能,而大伤脑筋,似乎总是想写出最佳的存储过程分页方法,我们假如建立一个学生基本信息表StudentInfo,我们看在Sql Server 2000中我们实现的存储过程:CREATEPROCEDURE p_GetStudentInfo...
分类:
数据库 时间:
2014-06-17 20:15:21
阅读次数:
292
http://www.lanceyan.com/tech/arch/mongodb_shard1.html按照上一节中《搭建高可用mongodb集群(三)—— 深入副本集》搭建后还有两个问题没有解决:从节点每个上面的数据都是对数据库全量拷贝,从节点压力会不会过大?数据压力大到机器支撑不了的时候能否做...
分类:
数据库 时间:
2014-06-17 13:07:58
阅读次数:
549