2014年初经过深思熟虑,确定方向数据挖掘,作为今后工作生涯的追随领域。 3月份开始看机器学习的课程,到了4月底,参加阿里巴巴的大数据竞赛,便把课程学习给落下了—— 一大遗憾。 比赛的成绩可想而知,由于知识储备不够,况且还是单干,只能说还行,从七千个队伍到前五百名内,再从三百名到一百多名,然后遇到....
分类:
其他好文 时间:
2014-07-10 00:35:54
阅读次数:
183
1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而wek...
分类:
其他好文 时间:
2014-07-07 23:55:38
阅读次数:
417
回归回归是最为简单易用的一种技术,但可能也是最不强大(这二者总是相伴而来,很有趣吧)。此模型可以简单到只有一个输入变量和一个输出变量(在 Excel 中称为 Scatter 图形,或 OpenOffice.org 内的 XYDiagram)。当然,也可以远比此复杂,可以包括很多输入变量。实际上,所有...
分类:
其他好文 时间:
2014-07-07 23:46:02
阅读次数:
241
贝叶斯分类器 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:
其他好文 时间:
2014-07-07 18:07:11
阅读次数:
151
一般使用weka进行数据挖掘的时候会碰到两个问题,一是内存不够,二是libsvm使用不了,这时就需要重新配置RunWeka.ini文件,解决上述问题。查看RunWeka.ini原文如下: 1 # Contains the commands for running Weka either with a...
分类:
其他好文 时间:
2014-07-07 17:05:42
阅读次数:
234
oa: * 控制商业流程按照指定的路线进行 * 在工作流程中,会产生很多数据,我们会对数据做进一步的分析,从而得出一些结论智能分析: 从大量的数据中经过滤过、分析,得出很有用的数据,供决策和参考--》产品经理数据挖掘: 更深层次的数据分析协同: 好几个部门在一起,共同完成一件事情的过程 整个过程是一...
分类:
其他好文 时间:
2014-07-02 14:36:02
阅读次数:
158
Python 提取Twitter tweets中的元素...
分类:
编程语言 时间:
2014-07-01 09:20:10
阅读次数:
295
一、数据挖掘数据挖掘是运用计算机及信息技术,从大量的、不全然的数据集中获取隐含在当中的实用知识的高级过程。Web 数据挖掘是从数据挖掘发展而来,是数据挖掘技术在Web 技术中的应用。Web 数据挖掘是一项综合技术,通过从Internet 上的资源中抽取信息来提高Web 技术的利用效率,也就是从Web...
分类:
Web程序 时间:
2014-06-29 19:45:59
阅读次数:
452
Python 获取新浪微博的热门话题 (API)...
分类:
编程语言 时间:
2014-06-28 07:51:56
阅读次数:
195
最大流算法在现实生活中有着广泛的应用,从数据挖掘到图像处理,都有应用。现实生活中很多事物看起来是不相干的,而实际上只要通过数学建模,其实很多问题本质上都是一样的。
这里举的一些例子很多都是没办法第一眼就看出来,首先要理解最大流算法的模型,其次就是将现实生活中的问题转换成最大流问题从而进行求解。
二分图匹配问题
大学即将毕业了,很多童鞋要去找...
分类:
其他好文 时间:
2014-06-28 07:03:25
阅读次数:
321