这篇文章不提原理,讲讲hadoop及其周边项目的作用。hadoop这个词已经流行好多年了,一提到大数据就会想到hadoop,那么hadoop的作用是什么呢?官方定义:hadoop是一个开发和执行处理大规模数据的软件平台。核心词语是平台,也就是说我们有大量的数据,又有好几个电脑,我们知道应该把处理数据...
分类:
其他好文 时间:
2014-07-19 21:30:03
阅读次数:
179
大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来。为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选择合适的技术,了解大数据各种技术之间的关系,选择合适的语言。 我们可以带着下面问题来阅读本文章: 1...
分类:
其他好文 时间:
2014-07-19 21:05:50
阅读次数:
236
用oracle账号登陆ORACLE数据库服务器
方法一:
查看表空间的名字及文件所在位置:
select tablespace_name, file_id, file_name,round(bytes/(1024*1024),0) total_space
from dba_data_files order by tablespace_name;
修改数据库dat...
分类:
数据库 时间:
2014-07-18 22:24:47
阅读次数:
435
原地址:http://blog.csdn.net/simdanfeg/article/details/9011863上篇博文跟大家一起走了一遍支付宝支付,今天我们来看看移动支付。众所周知目前付费通道的龙头老大还要当属三大运营商(移动、联通、电信)。运营商接入代码相对简单,但琐碎的要求太多,涉及到启动...
分类:
移动开发 时间:
2014-07-18 20:33:03
阅读次数:
372
又想速度快,又要大数据,又要保证数据不出错,还要拥抱变化,改需求的时候不那么痛苦,特别是字段的调整,按照以前的做法,想想就头疼。使用NoSQL,简直就是随心所欲,再奇葩的数据结构,处理起来也很容易。下面看我如何用NoSQL数据库实现高并发,高可靠的CRM系统。
分类:
数据库 时间:
2014-07-18 19:07:48
阅读次数:
419
当hive在执行大数据量的统计查询语句时,经常会出现下面OOM错误,具体错误提示如下:Possible error: Out of memory due to hash maps used in map-side aggregation.Solution: Currently hive.map.ag...
分类:
其他好文 时间:
2014-07-18 11:37:23
阅读次数:
305
转自http://blog.csdn.net/moshengtan/article/details/8990052
1 Web负载均衡
1.1 - 使用商业硬件实现
最常用的F5 与citrix netscaler。比如12306前端的web好像用的就是F5 的BIGIP。如果公司资金足够的话,相对使用开源软件来说理方便。
优点:维护方便,性能稳定
缺点:费用太高
...
分类:
Web程序 时间:
2014-07-17 19:30:38
阅读次数:
325
团购的用户习惯经过多年的“发酵”以后,大多数用户的团购习惯已经养成,同样一张电影票团购和直接现场购买的差价在一倍以上,当然O2O领域的其他情况也差不多,面对明显的“优惠”,用户当然乐意使用团购服务。很多人习惯把O2O称 之为闭环,从线上支付到线上所有购买活动,再重新回到线下进行消费,专家认为用户不离...
分类:
其他好文 时间:
2014-07-17 11:15:58
阅读次数:
198
美国零售商Target在基于购买记录分析的基础上,分析出一位少女怀孕,进而推送孕期相关的产品广告到这户人家,这位少女的父亲对此颇为不满。当然,最后证明他女儿真怀孕了,这位父亲也颇为尴尬。基于过去销售记录进行预测,并非需要大数据技术,传统的BI也许就能解决,但这个妇..
分类:
其他好文 时间:
2014-07-17 10:28:42
阅读次数:
214
在前面的博文实践记录之-Rsync镜像备份介绍了镜像备份工具Rsync的安装和使用.但在大数据时代,rsync的不足之处也暴露出来.首先.rsync本身实现不了实时备份.靠系统的crontab实现的话也受限于1分钟.因此这就导致了服务端和客户端数据可能出现不一致,更无法在应用故障时做到..
分类:
其他好文 时间:
2014-07-16 16:44:36
阅读次数:
391