前言本篇文章主要是继续前几篇Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,算法介绍后,经过这几种算法综合挖掘和分析之后,对一份摆在公司面前的人员信息列表进行推测,挖掘出这些人员信息中可能购买自行车的群体,把他们交个营销部,剩下的事...
分类:
数据库 时间:
2014-10-10 19:13:44
阅读次数:
219
数据挖掘,关联度分析Apriori算法的C++实现...
分类:
编程语言 时间:
2014-10-10 17:16:54
阅读次数:
446
今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天开始 ...今天发现一个很不错的博客(http://www.RDataMi...
分类:
编程语言 时间:
2014-10-10 15:10:43
阅读次数:
221
本节课主要介绍人工神经网络.通过介绍评定模型,随机梯度下降法,生物启发和感知器系统,讲师用视图和数学解析式详细地讲解了神经网络的运行过程以及原理....
分类:
其他好文 时间:
2014-10-09 19:39:57
阅读次数:
256
本篇文章主要是继续上两篇Microsoft决策树分析算法和Microsoft聚类分析算法后,采用另外更为简单一种分析算法对目标顾客群体的挖掘,同样的利用微软案例数据进行简要总结。有兴趣的同学可以先参照上面两种算法过程。应用场景介绍通过前面两种算法的应用场景介绍,此次总结的Microsoft Naiv...
分类:
数据库 时间:
2014-10-09 17:41:57
阅读次数:
241
摘要本文介绍了关联规则的基本概念和分类方法,列举了一些关联规则挖掘算法并简要分析了典型算法,展望了关联规则挖掘的未来研究方向。关键词数据挖掘,关联规则,频集,Apriori算法,FP-树1引言关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。它在数据挖掘中是一个重要的课题,最近几年已被业界所广...
分类:
其他好文 时间:
2014-10-09 14:23:44
阅读次数:
304
1、大数据处理与系统简介特征典型应用代表性的处理系统适用场景批量数据处理系统首要任务:1.利用批量数据挖掘合适的模式2.得出具体的含义3.制定明智的决策4.做出有效的应对措施5.实现业务目标1.数据体量巨大2.数据精确度高3.数据价值密度低1.互联网领域: a.社交网络 b.电子商务 c.搜索引擎2...
分类:
其他好文 时间:
2014-10-09 02:40:37
阅读次数:
338
数据挖掘概念: 数据挖掘是在大型数据库中、自动的发现有用信息的过程。 然、 这个有用只是一个感性的东西。比如我们从表中索引一行数据、这个算不上数据挖掘。因为它依赖的是数据的明显特征。数据挖掘基本步骤: 第一步: 预处理、把没有加工的数据转换为合适...
分类:
其他好文 时间:
2014-10-09 02:01:37
阅读次数:
180
继续《SAS编程与数据挖掘商业案例》学习笔记,本文侧重数据处理实践,包括:HASH对象、自定义format、以及功能强大的正则表达式
一:HASH对象
Hash对象又称散列表,是根据关键码值而直接进行访问的数据结构,是根据关键码值而直接进行访问的数据结构,
sas提供了两个类来处理哈希表,用于存储数据的hash和用于遍历的hiter,hash类提供了查找、添加、修改、删除等方法,...
分类:
其他好文 时间:
2014-10-08 18:09:45
阅读次数:
295
Data Mining可分为三大类六分项来说明:
Classification和Clustering属于分类区隔类;
Regression和Time-series属于推算预测类;
Association和Sequence则属于序列规则类。
Classification是根据一些变量的数值做计算,再依照结果作分类。(计算的结果最后会被分类为几个少数的离散数值,例如将...
分类:
其他好文 时间:
2014-10-08 17:51:55
阅读次数:
234