中国的这些年喜欢搞概念,什么云计算大数据啊,国家支持,专家鼓吹,各大会议论坛精彩纷呈,热闹过后发现还是默默地在用国外的技术和平台,就如同PC操作系统没有我们的份,手机操作系统也没有我们的份,虽然我们是世界上电脑和手机拥有量最多并且人们最喜欢玩手机的国家,感觉我们的学术专家和行业大佬们就只会扯蛋,扯多了会痛,痛定思痛,痛何如哉!吃饱喝足后还是继续扯蛋。相当可悲,若大个中国,真正心平静气地去做研究和开...
分类:
移动开发 时间:
2014-06-20 11:37:26
阅读次数:
322
在确定数据可视化为自己研究主题之初,我经常上网搜寻相关资料。但是初期的收集经常是杂乱无章,缺乏系统规划的。以至于我产生了三个困扰我的问题,分别是:
1. 信息可视化与数据可视化,到底有什么区别?或者说infographics 与visualization之间有何区别?
2.data visualization就是数据挖掘之后的用于显示结果的统计图吗?
3.曾经在知乎上看见某资深程序员直...
分类:
其他好文 时间:
2014-06-20 09:54:58
阅读次数:
206
既然陈超美都开始用生成概率模型了,之前的共词分析和共引分析市场不大了。动态主题监测与跟踪:HDP、共词与共引分析方法的比较Introduction
主题监测与跟踪在文献计量学、数据挖掘以及其他多个领域中都发挥重要作用。主题监测旨在从文档集合中识别重要主题,二主题跟踪旨在对一个已经识别到的主题演化.....
分类:
其他好文 时间:
2014-06-06 16:23:26
阅读次数:
814
六月到了。开始找工作的节奏,IT方面知识储备严重欠缺,定计划,更新博客,记录自己的准备历程。1、数据结构 15天2、常用算法(排序、动态规划、贪心等)
30天3、数据挖掘算法 15天4、移动端、web端开发入门 15天5、操作系统 10天共计85天,那时将近9月,还能赶上找工作的大潮。何...
分类:
其他好文 时间:
2014-06-02 11:46:07
阅读次数:
314
经过前几天的学习,基本上能够小试牛刀编写一些小程序玩一玩了,在此之前做几项准备工作明白我要用hadoop干什么大体学习一下mapreduceubuntu重新启动后,再启动hadoop会报连接异常的问题答:数据提炼、探索数据、挖掘数据map=切碎,reduce=合并重新启动后会清空tmp目录,默认na...
一、Mahout简单介绍查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦:
Mahout是一个非常强大的数据挖掘工具,是一个分布式机器学习算法的集.....
分类:
其他好文 时间:
2014-06-02 08:14:03
阅读次数:
273
数据挖掘系列(4)使用weka做关联规则挖掘weka Apriori算法实例操作详解用
WEKA 进行数据挖掘,第 1 部分: 简介和回归
分类:
其他好文 时间:
2014-06-01 12:22:01
阅读次数:
156
贝叶斯分类是统计学的一个分类方法,基于贝叶斯定理。首先贝叶斯分类的一个核心假设是一个属性值对给定类的影响独立于其他属性的值(类条件独立)。
先来看下条件概率:
设A、B是两个事件,且P(B)>0,则称 为在事件B发生的条件下,事件A的条件概率。
再来看一下贝叶斯定理:。
其中:
X 是类标识未知的数据样本(或数据元组)
如:35岁收入$4000的顾客
...
分类:
其他好文 时间:
2014-06-01 09:52:51
阅读次数:
235
Apriori算法是数据挖掘中一种挖掘关联规则的频繁项集算法。其核心是基于两阶段频集思想的递推算法。
先来了解下关联规则挖掘:
发现事务数据库,关系数据, 或其它信息库中项或数据对象集合间的频繁模式。关联,相关,或因果关系结构。
频繁模式:在数据库中频繁出现的模式(项集, 序列, 等)。
动机是发现数据中的规律性。
如:
购物篮分析:哪些产品更经...
分类:
其他好文 时间:
2014-06-01 09:52:13
阅读次数:
245