码迷,mamicode.com
首页 >  
搜索关键字:数据仓库    ( 1540个结果
svn命令
* 验证svn安装是否成功:svnadmin --version* 创建svn的数据仓库:svnadmin create E:\repository\svn\itcast* 启动svn服务:svnserve -d -r E:\repository\svn\itcast 单仓库启动 svn...
分类:其他好文   时间:2014-07-10 11:05:21    阅读次数:201
Apache Spark源码走读之12 -- Hive on Spark运行环境搭建
欢迎转载,转载请注明出处,徽沪一郎。楔子Hive是基于Hadoop的开源数据仓库工具,提供了类似于SQL的HiveQL语言,使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块...
分类:其他好文   时间:2014-07-07 14:17:47    阅读次数:295
Hive 实战(1)--hive数据导入/导出基础
前沿: Hive也采用类SQL的语法, 但其作为数据仓库, 与面向OLTP的传统关系型数据库(Mysql/Oracle)有着天然的差别. 它用于离线的数据计算分析, 而不追求高并发/低延时的应用场景. 最显著的特别是, Hive的数据是Schema On Read, 对数据的写入非常的自由和松散,....
分类:其他好文   时间:2014-07-07 09:53:53    阅读次数:262
BI开发(ETL-DW)
来到公司已经参与开发了一段时间的BI项目,但是仅仅是按照需求开发,今天下午公司给大家培训数据仓库的知识,老大(女程序员)在上面讲,我们在下面听,2到3个小时吧,什么纬度,主题,几乎听的一脸茫然,最后演示了基于BI的成本分析系统,感觉好复杂,主要是对于医疗项目的业务,反正挺繁琐的。做这个项目的目的主要...
分类:其他好文   时间:2014-07-06 17:24:53    阅读次数:193
MongoDB学习笔记一:MongoDB的下载和安装
MongoDB学习笔记一:MongoDB的下载和安装 趁着这几天比较空闲,准备学习一下MongoDB数据库,今天就简单的学习了一些MongoDB的下载和安装,并创建了存储MongoDB的数据仓库。将自己今天学习到的写成博客分享给大家。 一、MongoDB的下载和安装 MongoDB的下载地址为:http://www.mongodb.org/ 1、进入官网的首页后,在首页的右上方单击Down...
分类:数据库   时间:2014-07-06 08:56:22    阅读次数:276
如何成为云计算大数据Spark高手
Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足于内存计算,性能超过Hadoop百倍,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理、图技术、机器学习、NoSQL查询...
分类:其他好文   时间:2014-07-03 10:19:26    阅读次数:208
linux软件包的安装之----yum前端工具
YUM介绍:RPM前端工具,在将rpm包依赖关系做成数据库的前提下,自动查找依赖关系,并从某个仓库(repository)下载到所需要的安装包并在本地完成安装;在客户端,用yum可以安装在本地配置文件中可以找到的仓库,通过仓库的元数据(仓库(repository)中的rpm包的rpm信息被抽取..
分类:系统相关   时间:2014-07-01 06:02:42    阅读次数:412
数据仓库中数据粒度
粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。确定粒度是数据仓库开发者需要面对的一个重要的设计问题。如果数据仓库的粒度确定合理,设计和实现中的其余方面就可以非常顺畅地进行;反之,如果粒度确定的不合理就会是其他所有方面都很难进行。粒度对于数据仓库体系结构设计人员来说,非常重要,因为粒度...
分类:其他好文   时间:2014-06-30 07:56:42    阅读次数:166
Hadoop Hive sql 语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需 要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言...
分类:数据库   时间:2014-06-22 22:41:52    阅读次数:342
详细图解 快速入门kettle
写在前面一: 数据仓库ETL工具有很多,基于大数据环境下的分析,Hive用的多些。本文介绍国外的 一款开源ETL工具——Kettle。 写在前面二: 所用软件说明: 一、什么是Kettle Kettle是一款国外开源的ETL工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transf...
分类:其他好文   时间:2014-06-22 12:01:20    阅读次数:619
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!