下面内容摘自互联网并作了整理。名词:BI(Business
Intelligence):商业智能,DW(Data Warehouse):数据仓库,详见正文Q1部分。OLTP(On-Line Transaction
Processing):联机事务处理也称为面向交易的处理系统,其基本特征是顾客的原始数...
分类:
其他好文 时间:
2014-06-07 05:32:53
阅读次数:
263
在数据挖掘中,K-Means是一种用来计算数据聚集的算法。具体来说,K-Means要解决的问题如下图所示
凭肉眼可以看出,大致可以分为4个点群。但是怎么通过计算机找出这几个点群呢?这就是K-Means要解决的问题。
普通的K-Means算法的步骤如下
(1)随机在图中取K个种子点
(2)对图中的每个点求到这K个点的距离,假设点距离种子点最近,那么属于点群...
分类:
其他好文 时间:
2014-06-05 07:39:11
阅读次数:
733
放假闲的无聊,手机微信加了微软小冰——这个号称“史上最强聊天机器人”。据说“小冰”是“基于
Bing
云技术研发的新一代人工智能产品”,我开始感觉就是用点搜索技术加上关键词字典匹配算法,跟以往接触过一些自动应答机器人差不多。不过,今天我又跟她聊了一会儿,感觉还挺有意思,特别是最后,我还对这个小姑.....
分类:
其他好文 时间:
2014-06-02 22:12:56
阅读次数:
418
剪枝的概念极大极小过程是先生成与/或树,然后再计算各节点的估值,这种生成节点和计算估值相分离的方式,需生成规定深度内的所有节点,搜索效率较低。
如果能边生成节点边对节点估值,并剪去一些没用的分枝,这种技术被称为α-β剪枝。剪枝方法(1) MAX节点(或节点)的α值为当前子节点的最大到推值;(2)
M...
分类:
其他好文 时间:
2014-06-01 12:32:00
阅读次数:
552
数据挖掘系列(4)使用weka做关联规则挖掘weka Apriori算法实例操作详解用
WEKA 进行数据挖掘,第 1 部分: 简介和回归
分类:
其他好文 时间:
2014-06-01 12:22:01
阅读次数:
156
贝叶斯分类是统计学的一个分类方法,基于贝叶斯定理。首先贝叶斯分类的一个核心假设是一个属性值对给定类的影响独立于其他属性的值(类条件独立)。
先来看下条件概率:
设A、B是两个事件,且P(B)>0,则称 为在事件B发生的条件下,事件A的条件概率。
再来看一下贝叶斯定理:。
其中:
X 是类标识未知的数据样本(或数据元组)
如:35岁收入$4000的顾客
...
分类:
其他好文 时间:
2014-06-01 09:52:51
阅读次数:
235
Apriori算法是数据挖掘中一种挖掘关联规则的频繁项集算法。其核心是基于两阶段频集思想的递推算法。
先来了解下关联规则挖掘:
发现事务数据库,关系数据, 或其它信息库中项或数据对象集合间的频繁模式。关联,相关,或因果关系结构。
频繁模式:在数据库中频繁出现的模式(项集, 序列, 等)。
动机是发现数据中的规律性。
如:
购物篮分析:哪些产品更经...
分类:
其他好文 时间:
2014-06-01 09:52:13
阅读次数:
245
点击Open
file导入arff格式的数据,这里我导入weka内置的weather.numeric.arff数据集查看preprocess右边的三个按钮,分别是分类、聚类、关联分析,选择你需要使用的功能这里我选择分类,点击choose按钮选择要使用的分类方法这里选择j48,一种决策树算法,再点击s...
分类:
其他好文 时间:
2014-05-29 22:57:28
阅读次数:
462
Explorer:menu selection and form filling缺点:when you
open a dataset, it immediately loads it all in. This means that the Explorer can
only be applied t...
分类:
其他好文 时间:
2014-05-29 21:03:09
阅读次数:
385