机器学习的目标:通过若干实例让机器学会完成任务。统计学是机器学习专家经常研究的一个领域。机器学习的方法不是瀑布式的过程,需要反复分析,探索,尝试。Python被作者认为是一种非常有效的建模语言。一个观点:算法不是最花时间的,花时间的是:1.读取和清洗数据。2.探索和理解输入数据。3.分析如何最好的将...
分类:
其他好文 时间:
2014-09-03 00:11:05
阅读次数:
270
相信很多童鞋都开发过Execl的导入导出功能,最近产品中无论是后台数据分析的需要,还是前端满足用户管理的方便,都有Execl导入导出的维护需求产生。以前做这个功能,如果是web,利用HttpContext.Current.Response.ContentType ="application/ms-e...
分类:
其他好文 时间:
2014-09-02 15:38:34
阅读次数:
275
数据分析,一般都需要显示数据,就需要使用html做复杂的表格。复杂表格一般是对td的rowspan 、colspan属性值。在html中 标签定义 HTML 表格中的标准单元格。 (1)rowspan 属性规定单元格可横跨的行数; (2)colspan 属性规定单元格可横跨的列数。 1 2 ...
分类:
Web程序 时间:
2014-09-02 12:09:04
阅读次数:
357
当影响Y值的因素不唯一时,我们可以使用多元线性回归模型:...
分类:
其他好文 时间:
2014-09-02 01:35:34
阅读次数:
189
下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来。1、聚类常用的包: fpc,cluster,pvclust,mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclus...
分类:
其他好文 时间:
2014-09-02 00:10:23
阅读次数:
314
一. 前言 房价永远是最让人头疼且激动的话题,尤其是在帝都,多少人一辈子都为了一套房子打拼。正好我也想用一个大家比较关心的话题作为案例,把目前我开发的这套软件进行一次完整的演练。从数据采集,到清洗,分析,和最终可视化和报告的呈现,实现一次完整的流程。一方面可以给大家切实的分享一些有用的信息,再者可....
分类:
其他好文 时间:
2014-09-01 22:36:13
阅读次数:
834
上一节我们通过爬虫工具爬取了近七万条二手房数据,那么这一节就对这些数据进行预处理,也就是所谓的ETL(Extract-Transform-Load) 一.ETL工具的必要性 数据分析的前提是数据清洗。不论如何高大上的算法,遇到错误数据,一个异常抛出来,绝对尸横遍野。而你不能指望核心算法为你处理错.....
分类:
其他好文 时间:
2014-09-01 22:32:33
阅读次数:
347
课程简介:
本视频为机器学习系列课程第5章。主要定量研究训练与测试之间的关系,并引入学习模型中的一个重要概念--断点。课程深入浅出,从正射线、正区间和凸集三个具体例子入手,寻找突破点,从而得出训练集与测试集的关系。...
分类:
其他好文 时间:
2014-09-01 19:38:03
阅读次数:
158
新版本修改内容主要包括有:
1加入了历史飞行数据分析功能,可以查看历史飞行数据飞行的航迹信息、速度曲线、高度变化曲线及详细数据项内容;
软件效果如下:...
分类:
其他好文 时间:
2014-09-01 17:45:03
阅读次数:
216