欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯! 日常的大数据使用都是在服务器命令行中进行的,可视化功能仅仅依靠各个组件自带的web界面来实现,不同组件对应不同的端口号,如:HDFS(50070), ...
分类:
其他好文 时间:
2018-03-04 19:03:39
阅读次数:
249
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯! 一、背景: 随着互联网的发展、互联网用户的增加,互联网中的数据也急剧膨胀。每天产生的数据量数以万计,本地文件系统和单机CPU已无法满足存储和计算要求 ...
分类:
其他好文 时间:
2018-03-04 19:03:31
阅读次数:
162
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯! 一、spark SQL:类似于Hive,是一种数据分析引擎 什么是spark SQL? spark SQL只能处理结构化数据 底层依赖RDD,把sq ...
分类:
数据库 时间:
2018-03-04 19:01:51
阅读次数:
231
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯! 一、Flume的介绍: Flume由Cloudera公司开发,是一种提供高可用、高可靠、分布式海量日志采集、聚合和传输的系统,Flume支持在日志系 ...
分类:
Web程序 时间:
2018-03-04 19:01:17
阅读次数:
197
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似。一致性哈希修正了 ...
分类:
编程语言 时间:
2017-11-02 13:07:40
阅读次数:
183
前 端 gulp 今天在学习gulp的时候,由于要执行文件压缩和文件重命名和清除分配文件的内容,发生了一些冲突,写在这里督促一下自己。 每天进步一点点,希望越来越好~ 其实主要的问题出现在没有搞懂数据流的原因,对于数据流而言,代码语句的执行结束仅仅意味着数据操作的开始,唯一能确定数据操作结束的是最后 ...
分类:
其他好文 时间:
2017-11-01 19:38:35
阅读次数:
176
翻译:第一个系统“ASCI Purple”(显然这个能源部像生动的名字)将是世界上第一台超级计算机,它具有每秒100兆兆次的运行能力。ASCI Purple将具有基于POWER系列的IBM eServer系统和IBM存储系统的宏大组群。这台超级计算机代表模拟和计算机行动计划支持的第五代系统。它将作为 ...
分类:
其他好文 时间:
2017-10-24 13:06:44
阅读次数:
141
翻译:无代计算机观念提倡者声明,虽然技术的革新正快速的一个接一个的到来,但没有一种革新是,或将是足够重要作为另一代计算机的特征。 备注:advocate(提倡者、拥护者、主张、拥护)、innovation(革新、创新、新概念、新方法)、succession(一个接一个、连续不断、接替、继承)、spr ...
分类:
其他好文 时间:
2017-10-18 01:49:13
阅读次数:
103
翻译:第四代计算机期间,软件的发展从第三代开始发生了微小的变化。操作系统逐渐提高,并且新的语言被发明。数据库软件在这个时期被广泛使用。然而,最重要的趋势是小型机的革命。用于微型计算机的软件包随处可得,因此今天大多数软件可以购买,而不是从头开发。 备注:gradually(逐步地、渐渐地)、Datab ...
分类:
其他好文 时间:
2017-10-17 12:48:10
阅读次数:
134