搜索关键字：spark 大数据 hadoop spark-sql，搜索到29965个结果！码迷,mamicode.com！

win7+Myeclipse10开发Hadoop应用程序环境搭建

1、复制linux下已配置安装好的hadoop目录进入windows, 同时修改hadoo-env.sh文件的JAVA_HOME为windows下的jdk目录。2、复制hadoop-eclipse-1.2.jar插件进入myeclipse文件夹下dropins下下载：我的文件下有一个以hado.....

分类：Windows程序时间：2014-06-15 15:01:17 阅读次数：284

Hadoop Pipes Exception: Illegal text protocol command

Hadoop Pipes Exception: Illegal text protocol command对于Hadoop pipes 出现这样的错误,基本上编译代码依赖的.so和.a 版本不匹配网上也没有给出更多信息,我的同事最近回复了解决办法,可以参考https://groups.google....

分类：其他好文时间：2014-06-15 14:37:31 阅读次数：243

hadoop的第一次WordCount

1、新建MR工程 2、设置工程名字 3、finish 4、使用navicate浏览，使用package太长了。 5、将hadoop例子下的WordCount复制过来，当然我自己打的，重新熟悉一下。改改包名即可。一个示例完成。6、linux下准备数据文件 >hadoop dfs -m...

分类：其他好文时间：2014-06-15 10:51:31 阅读次数：293

hadoop日志分析

一、项目要求本文讨论的日志处理方法中的日志，仅指Web日志。其实并没有精确的定义，可能包括但不限于各种前端Web服务器——apache、lighttpd、nginx、tomcat等产生的用户访问日志，以及各种Web应用程序自己输出的日志。二、需求分析： KPI指标设计 PV(PageView): 页面访问量统计 IP: 页面独立IP的访问量统计 ...

分类：其他好文时间：2014-06-15 10:25:49 阅读次数：395

开口大数据闭口高并发，你们都是怎么回答

你需要了解大数据高并发的瓶颈在哪里，一般都是数据库层面的，机械硬盘承载不起非常快速的读写操作，cpu承载不起大量的逻辑运算，所以最基本的解决思路就是：1.换固态硬盘加快硬盘的读写效率。2.建立缓存中间件降低对硬盘的读写次数，缓存不用多说了，最最最基本和重要的优化策略。3.将硬盘的读写或者数据的计算分...

分类：其他好文时间：2014-06-14 17:13:23 阅读次数：179

hadoop 端口总结

localhost:50030/jobtracker.jsplocalhost:50060/tasktracker.jsplocalhost:50070/dfshealth.jsp1. NameNode进程 NameNode节点进程 – 运行在端口9000上INFO org.apache.hadoo...

分类：其他好文时间：2014-06-14 15:11:04 阅读次数：350

两步修改CentOS主机名称

在CentOS系统中，修改主机名称的步骤如下： 1. 修改network文件编辑network文件，配置如下： vi /etc/sysconfig/network 配置 NETWORKING=yes HOSTNAME=Hadoop-cluster 2 加载配置hostname Hadoop-cluster hostname...

分类：其他好文时间：2014-06-14 12:19:44 阅读次数：181

Spark：大数据的电花火石！

Apache Spark?is a fast and general engine for large-scale data processing：一种快速通用可扩展的数据分析引擎。如果想要搞清楚Spark是什么，那么我们需要知道它解决了什么问题，还有是怎么解决这些问题的。本文将带领你进入Spark的世界，首先阐述了为什么Spark能够在众多的大数据分析平台中脱颖而出：通用，易用，高性能和与Hadoop的有效整合。Spark All in One的解决方案使用一个通用栈解决了流式，交互式，实时查询，迭代...

分类：其他好文时间：2014-06-14 11:57:03 阅读次数：288

【甘道夫】NN HA 对于 Client 透明的实验

NN HA对于Client透明的实验...

分类：其他好文时间：2014-06-14 10:59:34 阅读次数：173

hadoop1学习系列2-hadoop伪分布安装

1.hadoop的伪分布安装(采用Host-only模式) 1.1 设置ip地址 1.1.1设置宿主机的VirtualBox Host-only Network网路设置 IP地址：192.168.56.1 子网掩码：255.255.255.0 默认网关：不填 ...

分类：其他好文时间：2014-06-14 09:50:02 阅读次数：207

共29965条上一页 1 ... 2942 2943 2944 2945 2946 ... 2997 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)