码迷,mamicode.com
首页 >  
搜索关键字:数据挖掘    ( 2538个结果
频繁模式挖掘-Apriori算法
DM实验,写的比较二,好多情况还没有考虑,后续有时间会修改。 开始的时候数据结构没设计好导致写到后面费了很大的劲、不过还好python的列表有起死回生的功效、、、 数据集:database.txt I1,I2,I5 I2,I4 I2,I3 I1,I2,I4 I1,I3 I2,I3 I1,I3 I1,I2,I3,I5 I1,I2,I3 apriori.py #coding=utf-8 ...
分类:编程语言   时间:2014-12-03 23:23:15    阅读次数:294
K-means算法C++实现
#include #define dimense 10 //10维数据 #define N 5005 #define MAX 0xffffff #define clr(a) memset(a,0,sizeof(a)) using namespace std; struct Point{ double dir[dimense]; int belong; }; int num=5000...
分类:编程语言   时间:2014-12-03 21:25:59    阅读次数:268
Latent Semantic Analysis (LSA) 模型 学习笔记
Latent Semantic Analysis 模型,隐性语义分析,也就是我们常说的LSA模型。后面还有他的兄弟PLSA和LDA模型,这个我们后面再说。这几个都是NLP中比较经典的模型!学习这个模型,主要总结到了三个方面:LSA模型可以应用在哪儿?LSA的理论部分,以及LSA的优缺点分析。...
分类:其他好文   时间:2014-12-03 15:52:01    阅读次数:459
Perl科学计算(1.1)
目前最流行的做机器学习的语言当属python了,两大库numpy和scipy十分强大。但本人学习perl的初衷是做爬虫,但做数据挖掘又不得不碰到科学计算,而perl中没有一个像numpy和scipy这么强大的module,更多的是零散的分布在许多module中,所以只能自己写点函数,以备自用。学.....
分类:其他好文   时间:2014-12-03 01:39:44    阅读次数:419
Spark之MLLib学习
基于Spark On Yarn的淘宝数据挖掘平台:http://www.doc88.com/p-7804379529208.htmlSpark之MLLib机器学习库:http://blog.csdn.net/johnny_lee/article/details/25656343Spark之ALS(推...
分类:其他好文   时间:2014-12-02 23:49:03    阅读次数:230
经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)
经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)今天给大家介绍一下经典的开源机器学习软件:编 程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和 C/C++,这...
分类:其他好文   时间:2014-12-02 22:14:59    阅读次数:219
《BI那点儿事》数据挖掘各类算法——准确性验证
原文:《BI那点儿事》数据挖掘各类算法——准确性验证准确性验证示例1:——基于三国志11数据库 数据准备: 挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图: 依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归...
分类:编程语言   时间:2014-12-02 10:32:29    阅读次数:222
《BI那点儿事》数据流转换——百分比抽样、行抽样
原文:《BI那点儿事》数据流转换——百分比抽样、行抽样百分比抽样和行抽样可以从数据源中随机选择一组数据。这两种task都可以产生两组输出,一组是随机选择的,另一组是没有被选择的。可以将这些选择出的数据发送到开发或者测试服务器上。这个Task的最合适的应用是建立数据挖掘模型然后,使用这些抽样数据来验证...
分类:其他好文   时间:2014-12-02 10:30:01    阅读次数:202
《BI那点儿事》数据挖掘初探
原文:《BI那点儿事》数据挖掘初探什么是数据挖掘? 数据挖掘(Data Mining),又称信息发掘(Knowledge Discovery),是用自动或半自动化的方法在数据中找到潜在的,有价值的信息和规则。 数据挖掘技术来源于数据库,统计和人工智能。 数据挖掘能够做什么 对企业中产生的大量的数据进...
分类:其他好文   时间:2014-12-02 10:27:32    阅读次数:228
《BI那点儿事》数据挖掘的主要方法
原文:《BI那点儿事》数据挖掘的主要方法一、回归分析目的:设法找出变量间的依存(数量)关系, 用函数关系式表达出来。所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一...
分类:其他好文   时间:2014-12-02 10:19:52    阅读次数:225
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!