8-28决定参加一下这个千万条的数据处理任务,因为场景和自己做过的一个回归分析预测差不多,第一天开始在小规模的数据上做准备工作。 ## 第二次大修改版本### date 20160829原始数据处理,得到用户粉丝关系,微博转发在每个时间段的量,微博转发的总体深度下一阶段目标,建立模型,实现基于时间序 ...
分类:
编程语言 时间:
2016-09-02 07:40:01
阅读次数:
285
一元线性回归模型: 一元线性回归分析的主要任务是: 解得: 三、检验、预测与控制: 1)F检验法: 2)t检验法 3)r检验法 3预测: 四、可线性化的一元非线性回归(曲线回归):曲线线性回归需要配置曲线 统计工具箱中的回归分析命令: 1、多元线性回归 2、多项式回归 3、非线性回归 4、逐步回归 ...
分类:
其他好文 时间:
2016-08-21 18:34:56
阅读次数:
199
这本《例解回归分析第5版》属于统计学精品译丛系列,这个系列的书都非常不错,以下是该书的阅读笔记 一、回归分析的步骤 1.问题陈述是指明确要分析研究的问题 2.选择相关变量选择用于解释因变量的自变量 3.收集数据收集的数据按照取值情况可以分为定量数据或定性数据,如果所有的自变量均为定性数据,此时的回归 ...
分类:
其他好文 时间:
2016-08-19 12:49:00
阅读次数:
3542
http://blog.csdn.net/hwwn2009/article/details/38414911 一元线性回归分析及java实现 一元线性回归分析及java实现 2014-08-07 11:02 1072人阅读 评论(0) 收藏 举报 2014-08-07 11:02 1072人阅读 评 ...
分类:
编程语言 时间:
2016-08-17 06:46:56
阅读次数:
1381
——方积乾教授课程笔记,还需不断实操+体会。 ...
分类:
其他好文 时间:
2016-07-24 22:25:21
阅读次数:
156
#1,概念 在机器学习领域,支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。 SVM的主要思想可以概括为两点:⑴它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转 ...
分类:
其他好文 时间:
2016-07-20 09:02:02
阅读次数:
469
判别分析作为一种多元分析技术应用相当广泛,和其他多元分析技术不同,判别分析并没有将降维作为主要任务,而是通过建立判别函数来概括各维度之间的差异,并且根据这个判别函数,将新加入的未知类别的样本进行归类,从这个角度讲,判别分析是从另一个角度对数据进行归类。判别分析由于要建立判别函数,因此和回归分析类似, ...
分类:
其他好文 时间:
2016-07-19 23:42:47
阅读次数:
3672
教材目录 第一章 概率统计的基本知识 第二章 R软件的使用 第三章 数据描述性分析 第四章 参数估计 第五章 假设检验 第六章 回归分析 第七章 方差分析 第八章 应用多元分析(I) 第九章 应用多元分析(II) 第十章 计算机模拟 第一章 概率统计的基本知识 第二章 R软件的使用 2.1 求均值和... ...
分类:
其他好文 时间:
2016-07-18 02:55:01
阅读次数:
267
Spark作为一种开源集群计算环境,具有分布式的快速数据处理能力。而Spark中的Mllib定义了各种各样用于机器学习的数据结构以及算法。Python具有Spark的API。需要注意的是,Spark中,所有数据的处理都是基于RDD的。 首先举一个聚类方面的详细应用例子Kmeans: 下面代码是一些基 ...
分类:
其他好文 时间:
2016-07-08 21:31:18
阅读次数:
611
在之前介绍的线性回归模型中,有一个隐含的假设是自变量均为连续变量,但实际上自变量有时候是分类变量,类似于方差分析中的因素,这种分类自变量在回归分析中,也默认作为连续变量使用,这就会产生一个问题,如果是无序分类变量,那么各类别间没有高低之分,每变化一个单位,对于因变量的影响是相同的,无法分析当中的趋势 ...
分类:
其他好文 时间:
2016-07-02 18:58:19
阅读次数:
205