截止到今天,工作将近一年了,但对未来还是一如既往的盲目,不知道当下应该干啥,不知道将来应该干啥,一年前的这会,还想着如何成为一名好的程序员,一年后的现在,继续做程序员都是没胆量去实现的梦,做了近一年的所谓的数据分析员,其实干的都是体力活,写各种查询语句,查各种数据,这就是我每天的工作,离程序员的道....
分类:
其他好文 时间:
2014-06-18 17:00:17
阅读次数:
200
简介:本Demo是参照这个网站上的Demo自己用Java实现的。将Java打包为Jar,再将Jar转为exe,源代码及程序Demo下载请点我。K-Means算法简介 我尽量用通俗易懂但不规范的语言来描述K-Means算法。 K-eans算法是数据挖掘十大算法之一,是一种聚类算法,也是最简单的无监.....
分类:
其他好文 时间:
2014-06-18 10:16:14
阅读次数:
373
lion.ec开源框架主要功能有移动、传统电商、数据分析、工作流、库存、订单、支付、运行、移动交易、客户等功能;代码方式开源:代号:lionIDE:JDK7.0,Eclipse,Maven3.x主要采用框架技术:Spring+Hibernate4.0+JPA2.0+Freemaker+jquery+...
分类:
其他好文 时间:
2014-06-17 14:31:38
阅读次数:
230
下面内容摘自互联网并作了整理。名词:BI(Business Intelligence):商业智能,DW(Data Warehouse):数据仓库,详见正文Q1部分。OLTP(On-Line Transaction Processing):联机事务处理也称为面向交易的处理系统,其基本特征是顾客的原始数...
分类:
其他好文 时间:
2014-06-17 00:38:42
阅读次数:
337
数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织机构有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到...
分类:
其他好文 时间:
2014-06-17 00:27:30
阅读次数:
266
终于终于西蒙用小提琴拉了一首《小星星》,内牛满面啊!正文:在过程分析和数据分析的基础上,需要从多个方面,广泛寻找导致问题发生的潜在原因,这是一个群策群力的过程。寻找问题原因的主要方法是头脑风暴会议,问题寻找的过程,也往往不会只通过一次或几次的头脑风暴就可以找到问题原因,我们要充分发挥团体的智慧,从各...
分类:
其他好文 时间:
2014-06-15 23:25:57
阅读次数:
1779
这篇论文主要是预测用户在基于位置的社交网络中的下一次签到地点,是ICDM'12年录用的一篇文章。
1.1 论文概要
在这篇文章中,作者首先将位置预测问题阐述为位置排名问题,即把用户所在城市内的所有签到场所作为候选集,然后根据一定的规则将候选集中的场所进行排名。排名的规则所追求的目标就是尽可能的将用户下一次签到地点排在最前面。。。。。
1.2 读后感
优点。。。
缺点。。。
1.3 总结
总之,作为一篇数据挖掘论文被ICDM录用还是够格的。以一种纯数据挖掘的角度(特征提取->模型训练->模型测试)来进行位置预...
分类:
其他好文 时间:
2014-06-15 18:45:29
阅读次数:
203
这里所说的在Java中执行Hive命令或HiveQL并不是指Hive Client通过JDBC的方式连接HiveServer(or HiveServer2)执行查询,而是简单的在部署了HiveServer的服务器上执行Hive命令。当然这是一个简单的事情,平常我们通过Hive做简单的数据分析实验的时候,都是直接进入Hive执行HiveQL,那我们为什么还要在程序中执行呢?
这里涉及到了一个问题,...
分类:
编程语言 时间:
2014-06-15 16:23:19
阅读次数:
301
日前,美国知名的技术创业孵化器公司 Y Combinator 根据 90 家企业数据统计,分析了哪些编程语言、框架以及平台最受企业欢迎。 据数据分析得出, Ruby on Rails 以微弱优势略超 Python 荣膺开发语言排行榜,Object-C (iOS)、Java、Android 分别...
分类:
编程语言 时间:
2014-06-14 16:45:32
阅读次数:
383
Apache Spark?is a fast and general engine for large-scale data processing: 一种快速通用可扩展的数据分析引擎。如果想要搞清楚Spark是什么,那么我们需要知道它解决了什么问题,还有是怎么解决这些问题的。
本文将带领你进入Spark的世界,首先阐述了为什么Spark能够在众多的大数据分析平台中脱颖而出:通用,易用,高性能和与Hadoop的有效整合。Spark All in One的解决方案使用一个通用栈解决了流式,交互式,实时查询,迭代...
分类:
其他好文 时间:
2014-06-14 11:57:03
阅读次数:
288