基本形式 线性模型,具有更好的可解释性,每个参数有表示的意义。 线性回归试图学得一个线性模型以尽可能准确地预测实值输出标记。 要训练w使得代价函数最小,如何选一个w使得代价函数最小? 最小均方算法(LMS)。基于均方误差最小化来进行模型求解的方法称为“最小二乘法” 然而,显示生活中很多XTX不是满秩 ...
分类:
其他好文 时间:
2020-04-22 00:22:10
阅读次数:
78
一.Stacking思想简介1.Stacking的思想是一种有层次的融合模型,比如我们将用不同特征训练出来的三个GBDT模型进行融合时,我们会将三个GBDT作为基层模型,在其上在训练一个次学习器(通常为线性模型LR),用于组织利用基学习器的答案,也就是将基层模型的答案作为输入,让次学习器学习组织给基 ...
分类:
其他好文 时间:
2020-04-08 22:30:38
阅读次数:
97
按自动化测试的发展顺序,主要以下几种模型: 线性模型:按顺序编写操作步骤产生线性脚本,开发维护成本高(例如登录的重复操作,每个脚本都需要开发和维护) 模块化驱动测试:将重复的操作独立成公共模块,需要时调用即可,降低开发和维护成本 数据驱动测试:数据的参数化,可以通过定义变量、数组、字典、外部文件(e ...
分类:
其他好文 时间:
2020-03-26 19:42:02
阅读次数:
91
代码: # -- coding: gbk -- from sklearn.datasets import load_breast_cancer from pylab import * from sklearn.model_selection import train_test_split from ...
分类:
编程语言 时间:
2020-03-25 01:55:34
阅读次数:
131
线性回归(又名普通最小二乘法) import mglearn from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split # X.shape->(60,1 ...
分类:
其他好文 时间:
2020-03-15 00:01:19
阅读次数:
89
本文采用普通的线性模型和马尔科夫链模型对不同营销渠道作归因分析,找出最佳的渠道路径或方式 ...
分类:
其他好文 时间:
2020-03-12 19:19:07
阅读次数:
68
线性判别分析 LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括,就是“投影后类内方差最小,类间方差最大”。什么意思呢? 我们要将数据在低维度上进行投影,投影后希望每一种类别数据的投影 ...
分类:
其他好文 时间:
2020-03-09 23:52:10
阅读次数:
100
上帝的磨盘转动很慢,但是却磨得很细。——毛姆本文已经收录至我的GitHub,欢迎大家踊跃star和issues。https://github.com/midou-tech/articles数据结构的基本概念数据结构相互之间存在一种或多种特定关系的数据元素的集合,我总结一下就是描述数据关系的一种载体。数据结构包括逻辑结构和存储结构两个层次的描述。逻辑结构描述数据逻辑关系的一种方式,与数据的存储无关。
分类:
编程语言 时间:
2020-03-01 23:18:28
阅读次数:
82
在各类比赛中经常出现预测回归问题,一般使用scikit learn的模型,本文就对这些类库的使用做一个总结,总结时注重自己做比赛中的使用经验。 1. Ordinary Least Squares(最小二乘法) 最简单的线性模型,损失函数是平方差损失,常用梯度下降法求解参数。 使用要点:这个模型不像其 ...
分类:
其他好文 时间:
2020-02-29 15:05:01
阅读次数:
105
算法的简要概述 在机器学习问题中,高维度数据进行回归和分类是一个很困难的问题。例如在许多Microarray生物数据上,数据的维度通常是千和万级别,但是由于收集数据需要昂贵的实验,因此可用的训练数据却相当少,通常只有50 300左右,这样的现象通常称为“small samples, large pr ...
分类:
其他好文 时间:
2020-02-29 14:54:03
阅读次数:
115