Spark 1.5.0是1.x线上的第6个发行版。这个版本共处理了来自230+contributors和80+机构的1400+个patches。Spark 1.5的许多改变都是围绕在提升Spark的性能、可用性以及操作稳定性。Spark 1.5.0焦点在Tungsten项目,...
分类:
Web程序 时间:
2015-09-09 19:52:05
阅读次数:
241
我们兴奋地宣布,从今天开始,Apache Spark1.5.0的预览数据砖是可用的。我们的用户现在可以选择提供集群与Spark 1.5或先前的火花版本准备好几个点击。
正式,Spark 1.5预计将在数周内公布,和社区所做的QA测试的版本。鉴于火花的快节奏发展,我们觉得这是很重要的,使我们的用户尽快开发和利用新特性。与传统的本地软件部署,它可以需要几个月,甚至几年,从供应商收到软件更新。数据...
分类:
其他好文 时间:
2015-08-25 16:51:54
阅读次数:
242
背景线上有很多的数据库在运行,后台需要一个分析用户行为的数据仓库。目前比较流行的是mysql和hadoop平台。现在的问题是,如何将线上的mysql数据实时的同步到hadoop中,以供分析。这篇文章就是利用tungsten-replicator来实现。环境由于tungsten-replicator依...
分类:
数据库 时间:
2014-12-18 21:56:29
阅读次数:
714
[注意],当前的测试环境仅仅是一台服务器.部署测试的tungten版本是2.1.2-xxxx;Requirements:mysql配置To change the Tungsten user to use the new password format complete the following s...
分类:
数据库 时间:
2014-06-29 06:37:28
阅读次数:
394