线性回归 下面是线性回归的公式推导,没有加上 L2 正则化因子。 假设 y^=Xw\hat y = Xwy^?=Xw,因为 L(w)=∣∣y^?y∣∣22=∣∣Xw?y∣∣22=(Xw?y)T(Xw?y)=wTXTXw?yTXw?wTXTy+yTy, \begin{aligned} L(w) &am ...
分类:
其他好文 时间:
2020-05-02 14:49:35
阅读次数:
94
一、案例来源与某书籍,数据集样式,采用动态线性回归的方式拟合时间序列模型: 查找gfr与自变量pe、ww2、pill的关系,R代码如下: rm(list = ls()) setwd("D:\\download\\系数\\金融时间序列分析") library(foreign);library(dynl ...
分类:
其他好文 时间:
2020-05-02 14:36:03
阅读次数:
71
"TOC" 简介 个人博客: 最小二乘法 就是用过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便的求得未知的数据。 一元线性回归下的最小二乘法 下面来讲解一下最小二乘法(以二维数据为例) 首先,我们得到一组数据($x_1,y_1$), ($x_2,y_2$)...($x_n,y_n ...
分类:
其他好文 时间:
2020-05-02 11:31:33
阅读次数:
94
本文主要记录: 1. 离散特征如何预处理之后嵌入 2.使用pytorch怎么使用nn.embedding 以推荐系统中:考虑输入样本只有两个特征,用逻辑回归来预测点击率ctr 看图混个眼熟,后面再说明: 一、离散数据预处理 假设一个样本有两个离散特征【职业,省份】,第一个特征种类有10种,第二个特征 ...
分类:
其他好文 时间:
2020-05-02 09:46:29
阅读次数:
260
目标导向型开发: -- 目标:开发出一个能够对绝大部分接口适用的自动化测试框架,测试人员可以很高效的编写及维护接口自动化用例,从而应用到全流程测试中去,而不仅仅是回归测试。 一般我们测试接口,大部分都是根据接口实际返回值以及预期返回值对比,初步判断接口请求是否正确,初步判断正确后,我们再对数据库表的 ...
分类:
其他好文 时间:
2020-05-01 22:32:20
阅读次数:
91
一、说明 给定训练集train.csv,要求根据前9个小时的空气监测情况预测第10个小时的PM2.5含量。 训练集介绍: (1)、CSV文件,包含台湾丰原地区240天的气象观测资料(取每个月前20天的数据做训练集,12月X20天=240天,每月后10天数据用于测试,对学生不可见); (2)、每天的监 ...
分类:
其他好文 时间:
2020-05-01 18:27:28
阅读次数:
66
题目描述 试证明,对于参数 $\omega$,对率回归的目标函数(3.18)是非凸的,但其对数似然函数(3.27)是凸的。 证明方法 凸函数的二阶条件,如果$f(x)$是凸函数的充要条件 $$ \nabla ^2 f(x) \succeq 0 $$ 对定义域内所有$x$成立,且$f(x)$ 定义域为 ...
分类:
其他好文 时间:
2020-05-01 17:06:17
阅读次数:
162
为什么要进行连续特征离散化 参考 "知乎用户" 在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点: 0. 离散特征的增加和减少都很容易,易于模型的快速迭代;这个点理解 1. 稀疏向量内积乘法运算速度快,计算结果方便存 ...
分类:
其他好文 时间:
2020-05-01 16:50:47
阅读次数:
44
到现在为止,我们已经学习了几种不同的学习算法,包括线性回归和逻辑回归,它们能够有效地解决许多问题,但是当将它们应用到某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。 一:过度拟合问题 (一)线性回归中的过拟合问题 继续使用线性回归来预测房价的例子,我 ...
分类:
其他好文 时间:
2020-05-01 12:51:33
阅读次数:
86
1.简介 gbdt全称梯度提升决策树,在传统机器学习算法里面是对真实分布拟合的最好的几种算法之一,在前几年深度学习还没有大行其道之前,gbdt在各种竞赛是大放异彩。原因大概有几个,一是效果确实挺不错。二是即可以用于分类也可以用于回归。三是可以筛选特征。这三点实在是太吸引人了,导致在面试的时候大家也非 ...
分类:
编程语言 时间:
2020-05-01 00:57:50
阅读次数:
67