搜索关键字：大数据 spark 数据分析数据画像，搜索到23297个结果！码迷,mamicode.com！

flex 圆形布局

xmlns:s="library://ns.adobe.com/flex/spark" xmlns:mx="library://ns.adobe.com/flex/mx" creationComplete="init(event)"> import mx.core.IVisualElement; import mx.core.IVisualElementContai...

分类：其他好文时间：2014-07-22 23:05:55 阅读次数：338

社会化海量数据采集爬虫框架搭建

如果你对项目管理、系统架构有兴趣，请加微信订阅号“softjg”，加入这个PM、架构师的大家庭随着BIG DATA大数据概念逐渐升温，如何搭建一个能够采集海量数据的架构体系摆在大家眼前。如何能够做到所见即所得的无阻拦式采集、如何快速把不规则页面结构化并存储、如何满足越来越多的数据采集还要在有限时间...

分类：其他好文时间：2014-05-12 17:06:14 阅读次数：396

Apache Spark源码走读之5 -- DStream处理的容错性分析

在流数据的处理过程中，为了保证处理结果的可信度(不能多算，也不能漏算)，需要做到对所有的输入数据有且仅有一次处理。在Spark Streaming的处理机制中，不能多算，比较容易理解。那么它又是如何作到即使数据处理结点被重启，在重启之后这些数据也会被再次处理呢？

分类：其他好文时间：2014-05-06 00:58:21 阅读次数：465

python for android : BeautifulSoup 有 bug

BeautifulSoup 善于网页数据分析，但是 python for android : BeautifulSoup 有 bug ， text = h4.a.text 只能取得 None，所以我写了function: getText() 来fix this bug. 例如: 抓取CSDN极客头条内容 soup.py import urllib2, re from Beau...

分类：移动开发时间：2014-05-03 17:33:08 阅读次数：427

Ubuntu14下Hadoop开发<1> 基础环境安装

在Ubuntu14.04下使用Hadoop2.4进行大数据开发之基础环境准备篇...

分类：其他好文时间：2014-05-02 19:56:21 阅读次数：367

关系型数据库与非关系型数据库

关系型数据库与非关系型数据库自1970年，埃德加·科德提出关系模型之后，关系数据库便开始出现，经过了40多年的演化，如今的关系型数据库具备了强大的存储、维护、查询数据的能力。但在关系数据库日益强大的时候，人们发现，在这个信息爆炸的“大数据”时代，关系型数据库遇到了性能方面的瓶颈，面对一个表中上亿条的...

分类：数据库时间：2014-05-02 09:02:06 阅读次数：365

spark源码笔记

1。国际化如添加朋友Friends是英文，可以找着相关的类，并在国际化配置文件中添加key 在项目中全局搜索“Friends”，将得到的结果集全部展开，找到这两个文件：在国际化配置文件spark_i18n_zh_CN.properties 中增加 custum.friends=朋友修...

分类：其他好文时间：2014-05-01 19:52:51 阅读次数：470

R简单数据分析

眼下大数据口号满天飞，今天拿我微信圈朋友一段时间内分享内容作为数据，用R包的算法实现简单分析。由于微信没有接口获取数据，暂时只能手动记录数据，主要是做个小尝试，数据获取方式是其次。1）我们看看微信圈活跃的朋友。PS：知道为何我们的流量烧的这么快了吧？这些小伙伴八成是运营商潜伏过来的余则成，在背后分成...

分类：其他好文时间：2014-05-01 19:11:52 阅读次数：372

flare-spork: 自己维护的Pig on Spark项目

很早以前有个Pig Spork分支，尝试把Pig迁移到Spark上，但是代码很久没有更新了。目前Pig on Spark应该是在Twitter内部进行着。 flare-spork是基于Spork对Pig和Spark的衔接，把Spark部分的代码迁移到了Pig 0.12.0上，并且升级了依赖和版本，升级为Scala 2.10.3，Spark 0.9.1，且兼容Hadoop 2.2.0。目前项目在Github上，地址。打算参考Spork已经做的一些东西，继续Pig on Spark的开发。 Github...

分类：其他好文时间：2014-04-30 22:15:39 阅读次数：360

【机器学习算法-python实现】逻辑回归的实现(LogicalRegression)

(转载请注明出处：http://blog.csdn.net/buptgshengod) 1.背景知识在刚刚结束的天猫大数据s1比赛中，逻辑回归是大家都普遍使用且效果不错的一种算法。（1）回归先来说说什么是回归，比如说我们有两类数据，各有50十个点组成，当我门把这些点画出来，会有一条线区分这两组数据，我们拟合出这个曲线（因为很有可能是非...

分类：编程语言时间：2014-04-30 22:15:39 阅读次数：454

共23297条上一页 1 ... 2325 2326 2327 2328 2329 2330 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)