标签:win 架构 分析 table 数据管理 发展方向 lex 厂商 unix
整个数据仓库搭建起来的结构大体是这样子的,如下图某公司的数据仓库的总体架构图。
在了解了整个数据仓库自上而下的框架之后,数据的同步,数据的存储计算,数据的计算,数据的分析,数据的展现,这些阶段上建设数据仓库采用什么样的解决方案呢?
主流ETL工具 | 是否开源 | 优势 | 劣势 |
Informatica | 否 | 1.安装方便:图形化安装 | 1.价格较高,大约需要70~130万 |
Datastage | 否 | 1.安装方便:图形化安装 | 1.价格较高,大约需要40~80万 |
Kettle | 是 | 1.安装方便:图形化安装2.价格免费 | 1.稳定性较差,不间断性发现系统异常重启,所以需要定期重启软件; |
主流数据仓库 | 是否开源 | 优势 | 劣势 |
Teradata | 否 | 1.大数据量处理性能较强 | 1.专用设备,环境搭建复杂,扩展时停机时间较长 |
Exadata | 否 | 1.事务类任务处理性能较好 | 1.大数量处理性能上存在不足 |
Netezza | 否 | 1.针对数据分析设计,性价比高 | 1.混合负载控制存在不足 |
SybaseIQ | 否 | 1.“列存储”技术 | 1.列存储的一些问题(如载速度、复杂查询等方面较差) ? |
GreenPlum | 是 | 1.支持行列混合存储,消除了单独行存储和列存储的缺陷 | 1.使用开放平台实现,稳定性相对较差 |
Hive | 是 | 1.基于Hadoop平台,使用低廉的PC机,成本低 | 1.使用的计算框架是Mapreduce,查询速度比较慢 |
标签:win 架构 分析 table 数据管理 发展方向 lex 厂商 unix
原文地址:http://www.cnblogs.com/benchen/p/6028743.html