云计算是指通过将计算分布在大量的分布式计算机上,而不是在本地计算机或远程服务器上,企业数据中心将更像是在Internet上运行。这使得企业能够将资源切换到需要的应用上,根据需要访问计算机和存储系统。这就像从旧的单台发电机模式切换到集中供电模式。这意味着计算能力可以作为一种商品流通,就像天然气、电力和电力一样,既容易获得又便宜。最大的区别在于,它是通过互联网传输。云计算普遍接受的特征如下: (1)
分类:
其他好文 时间:
2019-03-19 18:30:28
阅读次数:
206
Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。 HDFS HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。 ...
分类:
其他好文 时间:
2019-03-15 19:05:06
阅读次数:
151
摘抄自:https://www.cnblogs.com/qingyunzong/p/8946637.html 一、概述 Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能 ...
分类:
其他好文 时间:
2019-03-03 16:06:42
阅读次数:
159
分布式系统概述 分布式计算机系统是由多台计算机组成并满足以下条件的系统: 系统中任意两台计算机通过通信方式交换信息; 系统中每一台计算机都具有同等的地位,即没有主机也没有从机; 每台计算机上的资源为所有用户共享; 系统中的任意若干台计算机都可以构成一个子系统,并且还能重构; 任何工作都可以分布在几台 ...
分类:
其他好文 时间:
2019-03-02 18:42:47
阅读次数:
188
我们老板理解的大数据是,从数据到知识的转化。大数据目前的应用如 支付宝金融大数据、腾讯出行大数据等。 大数据的工作就是从海量数据源中筛选,梳理对自己有用的数据,整合成合适的数据结构,存储并进行可视化。 大数据目前的代表框架是Hadoop和spark 大数据涉及到的技包括数据分布式存储、数据分布式计算 ...
分类:
其他好文 时间:
2019-03-02 10:25:13
阅读次数:
182
"一、HDFS概念" "二、HDFS优缺点" "三、HDFS如何存储" 一、HDFS概念 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服 ...
分类:
其他好文 时间:
2019-02-25 23:21:01
阅读次数:
222
原文链接 云计算最初是实现资源管理的灵活性 云计算不光管资源,也要管应用 大数据拥抱云计算 数据的收集 数据的传输:基于硬盘的分布式队列 数据的存储:分布式文件系统 数据的分析:分布式计算的方法 人工智能拥抱大数据 推理、 知识教授、 基于统计的知识自学(事物间的关联)、 模拟大脑的工作方式(数学单 ...
分类:
其他好文 时间:
2019-02-25 16:45:26
阅读次数:
214
https://github.com/Roemer/NetDist A Gearman powered application consists of three parts: a client, a worker, and a job server ...
分类:
其他好文 时间:
2019-02-15 13:35:32
阅读次数:
152
1 进程和线程 进程 Process:一个正在运行的应用程序在操作系统中被视为一个进程,进程可以包括一个或多个线程。线程是操作系统分配处理器时间的基本单元,在进程中可以有多个线程同时执行代码。进程之间是相对独立的,一个进程无法访问另一个进程的数据(除非利用分布式计算方式)。 线程 Thread: 线 ...
分类:
编程语言 时间:
2019-02-14 16:39:37
阅读次数:
188
1. CAP理论的历史 2000年7月,Eric Brewer教授提出CAP猜想;2年后,Seth Gilbert和Nancy Lynch从理论上证明了CAP;之后,CAP理论正式成为分布式计算领域的公认定理。 2. CAP的背景和定义 CAP理论讨论的对象是分布式场景。一个分布式系统需要满足三个最 ...
分类:
其他好文 时间:
2019-02-13 20:50:43
阅读次数:
190