码迷,mamicode.com
首页 >  
搜索关键字:数据挖掘    ( 2538个结果
PrefixSpan序列模式挖掘算法
更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 与GSP一样,PrefixSpan算法也是序列模式分析算法的一种,不过与前者不同的是PrefixSpan算法不产生任何的侯选集,在这点上可以说已经比GSP好很多了。PrefixSpan算法可以挖掘出满足阈值的所有序列模式,可以说是非常经典的算法。序列的格式就是上文中提到过的类...
分类:编程语言   时间:2015-02-12 22:56:22    阅读次数:663
时间序列异常事件检测
一、异常数据挖掘简介:      异常数据挖掘,又称为离群点分析或者孤立点挖掘。在人们对数据进行分析处理的过程中,经常会遇到少量这样的数据,它们与数据一般模式不一致,或者说与大多数样相比有些不一样。我们称这样的数据为异常数据,对异常数据的处理在某些领域很有价值,例如在网络安全领域,可以利用异常数据挖掘来分析网络中的异常行为;在金融领域异常数据挖掘可以识别信用卡的欺诈交易、股市的操控行为、会计...
分类:其他好文   时间:2015-02-11 22:04:23    阅读次数:608
【Python】Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
好文 markhttp://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9...
分类:编程语言   时间:2015-02-10 18:26:27    阅读次数:161
GSP序列模式分析算法
参考资料:http://blog.csdn.net/zone_programming/article/details/42032309 更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 GSP算法是序列模式挖掘算法的一种,他是一种类Apriori的一种,整个过程与Apriori算法比较类似,不过在细节上会略有不同,在下...
分类:编程语言   时间:2015-02-10 11:28:13    阅读次数:213
《数据挖掘概念与技术》学习笔记
1.Chapter1 引论:(1) OLTP 和 OLAP 概念:OLTP(on-line transaction processing) 联机事物处理,就是我们常常说的关系数据库的主要应用,主要是主要的、日常的事务处理,比如银行交易。比如:mysqlOLAP(on-line analytical ...
分类:其他好文   时间:2015-02-09 20:00:47    阅读次数:182
AdaBoost装袋提升算法
参开资料:http://blog.csdn.net/haidao2009/article/details/7514787 更多挖掘算法:https://github.com/linyiqun/DataMiningAlgorithm 介绍 在介绍AdaBoost算法之前,需要了解一个类似的算法,装袋算法(bagging),bagging是一种提高分类准确率的算法,通过给定组合投票的方式,获得最...
分类:编程语言   时间:2015-02-08 11:39:40    阅读次数:362
来一张OpenCVR 的架构图
http://veyesys.com/ https://github.com/xsmart/opencvr...
分类:其他好文   时间:2015-02-08 00:28:26    阅读次数:403
python资源
爬虫:scrapy,beautifulsoup自然语言处理:nltk,Pattern(Google,Twitter,andWikipediaAPIs,awebcrawler,aHTMLDOMparser),结巴分词科学计算:NumPy,SciPy,matplotlib机器学习、数据挖掘:scikit-learn,pandas,MDP(neuralnetworks),PyBrain(neuralnetworks),Theano(GPU,deeplearn..
分类:编程语言   时间:2015-02-07 19:02:28    阅读次数:185
BIRCH算法---使用聚类特征树的多阶段算法
更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 BIRCH算法本身上属于一种聚类算法,不过他克服了一些K-Means算法的缺点,比如说这个k的确定,因为这个算法事先本身就没有设定有多少个聚类。他是通过CF-Tree,(ClusterFeature-Tree)聚类特征树实现的。BIRCH的一个重要考虑是最小化I/O,通过扫描...
分类:编程语言   时间:2015-02-06 09:40:23    阅读次数:123
给刚玩Hadoop的朋友一些建议
随着两会中间央视新闻天天说大数据,很多人纷纷开始关注大数据和Hadoop以及数据挖掘和数据可视化了,我现在创业,遇到很多传统数据行业往Hadoop上面去转型的公司和个人,提了很多问题,大多数问题还都是差不多的。所以我想整理一些,也可能是很多人都关注的问题。关于Hadoop版本的选择? 目前为止,作为...
分类:其他好文   时间:2015-02-04 14:23:35    阅读次数:206
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!