我们老板理解的大数据是,从数据到知识的转化。大数据目前的应用如 支付宝金融大数据、腾讯出行大数据等。 大数据的工作就是从海量数据源中筛选,梳理对自己有用的数据,整合成合适的数据结构,存储并进行可视化。 大数据目前的代表框架是Hadoop和spark 大数据涉及到的技包括数据分布式存储、数据分布式计算 ...
分类:
其他好文 时间:
2019-03-02 10:25:13
阅读次数:
182
10.Redis分布式集群10.1 数据分布10.1.1 数据分布理论10.1.2 Redis数据分区10.1.3 集群功能限制10.2 搭建集群10.2.1 准备节点10.2.2 节点握手10.2.3 分配槽10.2.4 用redis-trib.rb搭建集群10.3 节点通信10.3.1 通信流程 ...
分类:
其他好文 时间:
2019-02-27 19:07:11
阅读次数:
172
1.AVL树介绍 前面我们已经介绍了二叉搜索树。普通的二叉搜索树在插入、删除数据时可能使得全树的数据分布不平衡,退化,导致二叉搜索树最关键的查询效率急剧降低。这也引出了平衡二叉搜索树的概念,平衡二叉搜索树在此前的基础上,通过一系列的等价变换使二叉搜索树得以始终处于"平衡"的状态,拥有稳定且高效的查询 ...
分类:
编程语言 时间:
2019-02-13 21:15:23
阅读次数:
272
大数据时代要求: 三V:Volume海量、Velocity实时、Variety多样; 三高:高并发、高可扩、高性能 高并发操作不建议使用关联查询,而使用冗余数据,分布式系统支持不了太多的并发。 横向 VS 纵向: 纵向有极限,好比一台服务器存储资源总是有限度的。 横向无极限,好比一群服务器集群形成一 ...
分类:
其他好文 时间:
2019-02-13 12:35:01
阅读次数:
185
52.1 网络介绍 使用远程资源 共享信息、程序和数据 分布处理 52.1.1 协议的概念 计算机网络中实现通信必须有一些约定,如对速率、传输代码、代码结构、传输控制步骤和出错控制等约定,这些约定即被称为通信协议 在两个节点之间要成功地进行通信,两个节点之间必须约定使用共同的“语言”,这些被通信各方 ...
分类:
系统相关 时间:
2019-02-02 23:15:29
阅读次数:
297
Redis cluster tutorial Redis集群提供一种方式自动将数据分布在多个Redis节点上。 Redis Cluster provides a way to run a Redis installation where data is automatically sharded a ...
分类:
其他好文 时间:
2019-02-01 11:21:44
阅读次数:
186
前言:马上要过年了,祝大家新年快乐!在过年回家前分享一篇关于Zookeeper的文章,我们都知道现在微服务盛行,大数据、分布式系统中经常会使用到Zookeeper,它是微服务、分布式系统中必不可少的分布式协调框架。它的作用体现在分布式系统中解决了配置中心的问题,以及解决了在分布式环境中不同进程之间争 ...
分类:
Web程序 时间:
2019-01-31 15:23:53
阅读次数:
254
原文:001.MySQL高可用主从复制简介一 简介 1.1 概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础。将Mysql的数据分布在多个系统之上,这种分布的机制,是通过将Mysql的某一台主机的数据复制到其它主机(slaves)上,并重新执行一遍来实现的。复制过程中一个服务器充当主服... ...
分类:
数据库 时间:
2019-01-28 12:00:23
阅读次数:
206
分布式数据库计算涉及到分布式事务、数据分布、数据收敛计算等等要求分布式数据库能实现高安全、高性能、高可用等特征,当然也带来了高成本(固定成本及运营成本),我们通过MongoDB及MySQLCluster从实现上来分析其中的设计思路,用以抽象我们在设计数据库时,可以引用的部分设计方法,应用于我们的生产系统首先说说关系及非关系数据库的特征MySQL的Innodb及Cluster拥有完整的ACID属性A
分类:
数据库 时间:
2019-01-26 11:46:44
阅读次数:
175
SPSS---交叉表分析 除了对单个变量的分析,在实际研究中,还需要对多个变量在不同取值情况下的数据分布情况,从而进一步分析变量之间的相互影响和关系,这就要用到交叉表分析。交叉表是一种行列交叉的分类汇总表格,行和列上至少各有一个分类变量,行和列的交叉处可以对数据进行多种汇总计算,如求和、平均值、计数... ...
分类:
其他好文 时间:
2019-01-18 10:19:06
阅读次数:
841