一、概念 CART全称叫Classification and Regression Tree。首先要强调的是CART假设决策树是二叉树,内部结点特征的取值只有“是”和“否”,左分支是取值为“是”的分支,有分支则相反。这样的决策树等价于递归地二分每个特征。 二、CART生成 决策树的生成就是递归地构建 ...
分类:
其他好文 时间:
2020-03-05 19:18:12
阅读次数:
343
本文主要对 Spark ML库下模型评估指标的讲解,以下代码均以 进行讲解,Spark版本为 。模型评估指标位于包 下。 模型评估指标是指测试集的评估指标,而不是训练集的评估指标 1、回归评估指标 RegressionEvaluator Evaluator for regression, which ...
分类:
其他好文 时间:
2020-03-03 22:38:09
阅读次数:
144
逻辑回归(Logistic Regression)6.1 分类问题参考文档: 6 - 1 - Classification (8 min).mkv在这个以及接下来的几个视频中,开始介绍分类问题。在分类问题中,你要预测的变量 y 是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regres ...
分类:
其他好文 时间:
2020-02-20 21:56:18
阅读次数:
62
项目目的:利用车贷金融数据建立评分卡,并尝试多次迭代观察不同行为对模型,以及建模中间过程产生哪些影响。 首先是标准化导入需要使用的工具 import pandas as pd import numpy as np import matplotlib.pyplot as plt plt.style.u ...
分类:
其他好文 时间:
2020-02-19 23:56:41
阅读次数:
148
进行数学推导 逻辑回顾与线性回顾的差异 为什么logistic Regression 不能用square error Discriminative vs Generative 逻辑回归的方法称为Discriminative(判别) 方法;上一篇中用高斯来描述后验概率,称为 Generative(生成 ...
分类:
其他好文 时间:
2020-02-17 20:00:21
阅读次数:
76
liner classifiers 1.logistic 逻辑回归其实是一个分类算法而不是回归算法。通常是利用已知的自变量来预测一个离散型因变量的值(像二进制值0/1,是/否,真/假)。简单来说,它就是通过拟合一个逻辑函数(logit fuction)来预测一个事件发生的概率。所以它预测的是一个概率 ...
分类:
其他好文 时间:
2020-02-17 13:55:40
阅读次数:
73
1.线性回归不适用于分类问题。 原因:1.单个样本对于线性回归可能会造成很大的影响。 2.函数的输出值可能非常大,非常离谱。 2.逻辑回归(logistic regression):一种分类算法。是广义线性回归,$h(x)=g(\theta^{T}x)$,其中 $g(x)=\frac{1}{1+e^ ...
分类:
其他好文 时间:
2020-02-16 20:58:28
阅读次数:
86
这篇记录的内容来自于Andrew Ng教授在coursera网站上的授课。 1.多元线性回归(multivariate linear regression): h函数:$h_{\theta}{(x)}=\theta_{0}+\sum_{i=1}^{n}{\theta_{i}x_{i}}$ 为方便起见 ...
分类:
其他好文 时间:
2020-02-15 09:50:40
阅读次数:
81
超参数 定义 在拟合模型之前需要定义好的参数 适用 Linear regression: Choosing parameters Ridge/lasso regression: Choosing alpha k Nearest Neighbors: Choosing n_neighbors Para ...
分类:
其他好文 时间:
2020-02-14 13:12:52
阅读次数:
92
一、线性回归 1、模型 2、损失函数 3、优化函数-梯度下降 #!/usr/bin/env python # coding: utf-8 import torch import time # init variable a, b as 1000 dimension vector n = 1000 a ...
分类:
其他好文 时间:
2020-02-12 10:53:33
阅读次数:
110