2014年初经过深思熟虑,确定方向数据挖掘,作为今后工作生涯的追随领域。 3月份开始看机器学习的课程,到了4月底,参加阿里巴巴的大数据竞赛,便把课程学习给落下了—— 一大遗憾。 比赛的成绩可想而知,由于知识储备不够,况且还是单干,只能说还行,从七千个队伍到前五百名内,再从三百名到一百多名,然后遇到....
分类:
其他好文 时间:
2014-07-10 00:35:54
阅读次数:
183
1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而wek...
分类:
其他好文 时间:
2014-07-07 23:55:38
阅读次数:
417
回归回归是最为简单易用的一种技术,但可能也是最不强大(这二者总是相伴而来,很有趣吧)。此模型可以简单到只有一个输入变量和一个输出变量(在 Excel 中称为 Scatter 图形,或 OpenOffice.org 内的 XYDiagram)。当然,也可以远比此复杂,可以包括很多输入变量。实际上,所有...
分类:
其他好文 时间:
2014-07-07 23:46:02
阅读次数:
241
最近不管是在哪,世界杯永远是大家闲聊的话题。而随着互联网的发展,购买足彩越发便利和火爆了,体彩不像福彩,我们可以根据各个球队的情况做一些猜测。但作为一名看世界杯只记的住场边广告的伪球迷,也想凑热闹买一把,怎么才能保证在前面几次比赛的基础上,比较科学靠谱的预测比赛结果呢?做为一名略懂机器学习的伪球迷....
分类:
其他好文 时间:
2014-07-07 22:42:22
阅读次数:
455
## 多特征-------实际上我们真正买过房子的都知道,在选择房子的时候,需要考虑的不仅仅是面积,地段、结构、房龄、邻里关系之类的都应该是考虑对象,所以前面几讲谈论的,单纯用面积来谈房价,不免失之偏颇。### 多考虑些特性我们加入一些特性来考虑房价问题:出发,以属性作为基础,划分不同的类。例如对于如下数据集(数据集)其中,第一列和第二列为属性(特征),最后一列为类别标签,1表示是,0表示否。决策树算法的思想是基于属性对数据分类,对于以上的数据我们可以得到以下的决策树模型(决策树模型)先是....
分类:
其他好文 时间:
2014-06-27 14:29:54
阅读次数:
386
用支持向量机进行文理科生的分类,根据的特征主要是 数学成绩与语文成绩,这两个特征都服从高斯分布程序代码例如以下:分类结果:
分类:
其他好文 时间:
2014-06-27 13:37:52
阅读次数:
265
发型对一个人的形象至关重要,但你知道吗,在本次世界杯上,一个好发型更可能带来一场意外的胜利。复古之风劲吹足坛,蓬蓬爆炸头成为本届世界杯最佳发型。 球场上的优势除了身高优势、力量优势、速度优势乃至长相优势以外,终于多出了“发型优势”这一重要组成部分。 爆炸头爆出好运 蓬蓬爆炸头回归2014世...
分类:
其他好文 时间:
2014-06-27 00:56:59
阅读次数:
249