码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
大数据技术 vs 数据库一体机[转]
http://blog.sina.com.cn/s/blog_7ca5799101013dtb.html目前,虽然大数据与数据库一体机都很火热,但相当一部分人却无法对深入了解这两者的本质区别。这里便对大数据技术(如Hadoop等,主要指MapReduce与NoSQL)与数据库一体机(新一代的主流关系...
分类:数据库   时间:2014-06-29 06:09:08    阅读次数:298
Hadoop 2.4.0新特性介绍
在2014年4月7日,Apache公布了Hadoop 2.4.0 。相比于hadoop 2.3.0,这个版本号有了一定的改进,突出的变化能够总结为下列几点(官方文档说明):1 支持HDFS訪问控制列表(ACL,Access Control Lists) 这个特性攻克了在一定情况下,文件权限訪...
分类:其他好文   时间:2014-06-29 06:07:36    阅读次数:299
SparkSQL之旅
1.准备数据employee.txt1001,Gong Shaocheng,11002,Li Dachao,11003,Qiu Xin,11004,Cheng Jiangzhong,21005,Wo Binggang,3将数据放入hdfs[root@jfp3-1 spark-studio]# hdf...
分类:数据库   时间:2014-06-29 00:17:54    阅读次数:415
转】MapReduce: Simplified Data Processing(一)
摘要MapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集.然后再指定一个reduce函数合并所有的具有相同中间key的中间value.下面将列举许多可以用这个模型来表示的现实世界的工作.以这种方式写...
分类:其他好文   时间:2014-06-29 00:17:14    阅读次数:369
hive select查询语句底层实现的某些细微差别
最近,由于工作的需要,学习了基于Hadoop的一个数据仓库工具hive。遇到并解决了一些问题,但是有个select语句的细微差别值得注意。 首先来看两条hql语句: SELECT * FROM MY_TABLE where dt=2014031205 limit 10 SELECT ID,NAM.....
分类:其他好文   时间:2014-06-28 23:54:20    阅读次数:400
数据写入文本文件并读出到浏览器的PHP代码
gwbjx123 Item Quantity Tires oil Spark Plugs Address 以下是PHP文件:eg1.php"; $fp = fopen("egtext.txt","ab");//a是追加 fl...
分类:Web程序   时间:2014-06-28 23:53:40    阅读次数:409
真正通用的SQL分页存储过程
关于SQL分页的问题,网上找到的一些SQL其实不能真正做到通用,他们主要是以自增长ID做为前提的。但在实际使用中,很多表不是自增长的,而且主键也不止一个字段,其实我们稍做改进就可以达到通用。这里还增加了索引,以方便大数据量的使用(代码中是先抓到临时表的,从性能上说如果采用自增长式的ID表,当然可以不...
分类:数据库   时间:2014-06-28 23:20:50    阅读次数:292
Spark Streaming之旅
1. 打开spark-shell2. 建立StreamingContextimport org.apache.spark.streaming._import org.apache.spark.streaming.StreamingContext._import org.apache.spark.ap...
分类:其他好文   时间:2014-06-28 23:07:17    阅读次数:324
Hadoop通过c语言API访问hdfs
Hadoop给我们提供了使用c语言访问hdfs的API,下面进行简要介绍:环境:ubuntu14.04hadoop1.0.1jdk1.7.0_51访问hdfs的函数主要定义在hdfs.h文件中,该文件位于hadoop-1.0.1/src/c++/libhdfs/文件夹下,而相应的库文件是位于hado...
分类:Windows程序   时间:2014-06-28 22:50:43    阅读次数:374
一、Ubuntu14.04下安装Hadoop2.4.0 (单机模式)
一、在Ubuntu下创建hadoop组和hadoop用户增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。1、创建hadoop用户组2、创建hadoop用户 sudo adduser -ingroup hadoop hadoop回车后会提示输入...
分类:其他好文   时间:2014-06-28 21:59:24    阅读次数:257
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!