原文:《BI那点儿事》浅析十三种常用的数据挖掘的技术一、前沿 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predicti...
分类:
其他好文 时间:
2014-12-02 10:18:10
阅读次数:
188
准确性验证示例1:——基于三国志11数据库数据准备:挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图:依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归算法(92.39% 0.99)3. 决策树算法(91.19...
分类:
编程语言 时间:
2014-12-01 20:43:18
阅读次数:
196
转自:http://www.cnblogs.com/tornadomeet/archive/2013/10/29/3395593.html前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘....
分类:
编程语言 时间:
2014-11-30 22:50:48
阅读次数:
278
AdaBoost Binary ClassifyAdaBoost MultidimensionalWEKA源码分析
分类:
编程语言 时间:
2014-11-29 18:46:37
阅读次数:
133
主要介绍如何通过验证来评估模型的性能及如何通过验证选取模型的问题。介绍的方法有:模型选择、交叉验证。...
分类:
其他好文 时间:
2014-11-29 00:17:19
阅读次数:
202
视乎已经听到或看到无数遍数据挖掘了,那么,你知道那是什么吗?关于什么是数据挖掘,很多学者和专家给出了不同的定义,以下我们列出几种常见的说法:...
分类:
其他好文 时间:
2014-11-28 01:07:05
阅读次数:
240
Dataguru是2011年11月创建的关于数据仓库、数据挖掘、商业智能等技术和业务讨论的数据分析专业社区网站。上面有很多关于数据分析的课程还是很不错的,虽然要交一部分钱,但是大家在一起学习、讨论也就有了更多的学习乐趣,而且还能够认识不少志同道合的朋友。
而且,Dataguru创造了一个逆向收费的机制,主要通过学习之后会根据学习的情况返还学费。如果使用下面的链接进入,并且使用C451这个邀请...
分类:
其他好文 时间:
2014-11-26 22:40:40
阅读次数:
273
之前对于推荐,一直都仅限于理论书籍,浅一点像《集体智慧编程》《推荐系统实践》,复杂的像《数据挖掘》《机器学习》,当然也没看太深入。当时对推荐系统的看法是,这是一个以算法为核心的系统,一切价值体现都在算法模型上了。不过这段时间有幸参与到真实系统,稍有改观。下最近的一些想法吧,当然作为一个系统开发人员,...
分类:
其他好文 时间:
2014-11-26 20:55:26
阅读次数:
255
国际权威的学术组织 ICDM(theIEEEInternational ConferenceonDataMining)曾评选出了数据挖掘领域的十大经典算法:C4.5,k-Means,SVM,Apriori,EM,PageRank,AdaBoost,kNN,Naive Bayes和CART。其实不仅仅...
分类:
编程语言 时间:
2014-11-26 10:57:41
阅读次数:
295
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一...
分类:
其他好文 时间:
2014-11-24 18:57:47
阅读次数:
222