SAS数据清洗:由于SAS数据集之间的关系一般不会用到,只是在proc sql中有所涉及,至今尚未运用过用于数据分析,所以在这里只讲单个数据集的处理。在proc sql中我们可以看到:在定义数据集时涉及到字段名,字段属性,字段标签这三个最常用。我们在数据清洗时涉及到的数据集字段的处理,主要也就是围绕...
分类:
其他好文 时间:
2014-08-22 12:28:36
阅读次数:
752
2013年德勤公司发布了一份《2013年艺术品在线交易报告》,显示艺术品投资交易方式由线下慢慢朝着线上交易的方式转变,过去几年至少有80%的藏家尝试过在线购买艺术品,这一趋势还在不断上升。对于艺术品电商来说是个好势头。但艺术品电商如何找到潜在市尝定位目标客户,提高用户..
分类:
其他好文 时间:
2014-08-22 02:51:15
阅读次数:
291
Hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样。在这种情况下,就需要Hive这样的用戶编程接口。Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑,就是些表的定义等,也就是表的元数据。使用SQL实现Hive是因为SQL大家都熟悉,转换成本低,类似作用的Pig就...
分类:
其他好文 时间:
2014-08-21 19:27:44
阅读次数:
148
近期在做数据挖掘的课程设计,须要将数据分析的结果非常直观的展现给用户,这就要用到数据统计图,要实现这个功能就须要几个第三方包了:1. jfreechart-1.0.13.jar2. jcommon-1.0.16.jar3. gnujaxp.jar先来看一下,终于效果图:主要是jfreechart-1...
分类:
编程语言 时间:
2014-08-21 18:47:04
阅读次数:
235
咨询师Barry Devlin介绍了一些人们因为统计数据分析不当而误解风险的案例,同时阐述了为什么业务决策不能完全由数据驱动。他提醒企业要清醒认识数据科学家的阴谋,同时接受普通业务人员的天真想法。 大数据分析的拥护者竭尽全力地鼓吹“数据驱动”,明智的人应该谨慎对待,并明确两个问题。一,业务人员...
分类:
其他好文 时间:
2014-08-21 16:51:24
阅读次数:
330
hadoop是基于java的数据计算平台,引入第三方库,例如C语言实现的开发包将会大大增强数据分析的效率和能力。 通常在是用一些工具的时候都要用到一些配置文件、资源文件等。接下来,借一个例子来说明hadoop上面如何使用JNI、以及调用资源文件。首先介绍一下ICTClass,ICTClass是中国科...
分类:
其他好文 时间:
2014-08-21 11:07:13
阅读次数:
265
简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。 awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gaw....
分类:
其他好文 时间:
2014-08-21 10:58:53
阅读次数:
174
【IT168应用】8月15日消息,日前,华为参加2014趋势CIO峰会上,与近300位全球云计算领导厂商、国内领先行业,知名企业的CIO、CSO就云数据中心安全架构、大数据安全、移动设备安全管理等热点话题进行讨论。华为还分享了华为安全解决方案如何利用大数据分析技术和安全协防理念,..
分类:
其他好文 时间:
2014-08-20 10:36:56
阅读次数:
253
Python 对LinkedIn用户联系人的地址进行地理编码...
分类:
编程语言 时间:
2014-08-20 08:10:36
阅读次数:
240