DM实验,写的比较二,好多情况还没有考虑,后续有时间会修改。
开始的时候数据结构没设计好导致写到后面费了很大的劲、不过还好python的列表有起死回生的功效、、、
数据集:database.txt
I1,I2,I5
I2,I4
I2,I3
I1,I2,I4
I1,I3
I2,I3
I1,I3
I1,I2,I3,I5
I1,I2,I3
apriori.py
#coding=utf-8
...
分类:
编程语言 时间:
2014-12-03 23:23:15
阅读次数:
294
#include
#define dimense 10
//10维数据
#define N 5005
#define MAX 0xffffff
#define clr(a) memset(a,0,sizeof(a))
using namespace std;
struct Point{
double dir[dimense];
int belong;
};
int num=5000...
分类:
编程语言 时间:
2014-12-03 21:25:59
阅读次数:
268
Latent Semantic Analysis 模型,隐性语义分析,也就是我们常说的LSA模型。后面还有他的兄弟PLSA和LDA模型,这个我们后面再说。这几个都是NLP中比较经典的模型!学习这个模型,主要总结到了三个方面:LSA模型可以应用在哪儿?LSA的理论部分,以及LSA的优缺点分析。...
分类:
其他好文 时间:
2014-12-03 15:52:01
阅读次数:
459
目前最流行的做机器学习的语言当属python了,两大库numpy和scipy十分强大。但本人学习perl的初衷是做爬虫,但做数据挖掘又不得不碰到科学计算,而perl中没有一个像numpy和scipy这么强大的module,更多的是零散的分布在许多module中,所以只能自己写点函数,以备自用。学.....
分类:
其他好文 时间:
2014-12-03 01:39:44
阅读次数:
419
基于Spark On Yarn的淘宝数据挖掘平台:http://www.doc88.com/p-7804379529208.htmlSpark之MLLib机器学习库:http://blog.csdn.net/johnny_lee/article/details/25656343Spark之ALS(推...
分类:
其他好文 时间:
2014-12-02 23:49:03
阅读次数:
230
经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)今天给大家介绍一下经典的开源机器学习软件:编 程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和 C/C++,这...
分类:
其他好文 时间:
2014-12-02 22:14:59
阅读次数:
219
原文:《BI那点儿事》数据挖掘各类算法——准确性验证准确性验证示例1:——基于三国志11数据库
数据准备:
挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图:
依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归...
分类:
编程语言 时间:
2014-12-02 10:32:29
阅读次数:
222
原文:《BI那点儿事》数据流转换——百分比抽样、行抽样百分比抽样和行抽样可以从数据源中随机选择一组数据。这两种task都可以产生两组输出,一组是随机选择的,另一组是没有被选择的。可以将这些选择出的数据发送到开发或者测试服务器上。这个Task的最合适的应用是建立数据挖掘模型然后,使用这些抽样数据来验证...
分类:
其他好文 时间:
2014-12-02 10:30:01
阅读次数:
202
原文:《BI那点儿事》数据挖掘初探什么是数据挖掘? 数据挖掘(Data Mining),又称信息发掘(Knowledge Discovery),是用自动或半自动化的方法在数据中找到潜在的,有价值的信息和规则。
数据挖掘技术来源于数据库,统计和人工智能。 数据挖掘能够做什么
对企业中产生的大量的数据进...
分类:
其他好文 时间:
2014-12-02 10:27:32
阅读次数:
228
原文:《BI那点儿事》数据挖掘的主要方法一、回归分析目的:设法找出变量间的依存(数量)关系, 用函数关系式表达出来。所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一...
分类:
其他好文 时间:
2014-12-02 10:19:52
阅读次数:
225