申请评分卡模型 数据的预处理与特征构建 简介:在构建评分卡模型的工作中,数据的预处理和特征构建工作是至关重要的一步。数据的预处理工作可以有效处理缺失值与异常值,从而增强模型的稳健性。而特征构建工作则可以将信息从字段中加以提炼,形成有业务含义的优异特征。 评分卡模型的简介 风控场景中的评分卡: 以分数... ...
分类:
其他好文 时间:
2020-05-25 00:26:36
阅读次数:
160
想调用快递鸟API接口实现快递查询,但是又不懂后端开发,不懂JAVA,不懂PHP,不懂C#,也不懂python,只懂一点点JS,已经足够,通过JS来实现600多家的物流轨迹查询。 ...
分类:
编程语言 时间:
2020-05-19 20:34:20
阅读次数:
72
Ridge regression 通过对系数的大小施加惩罚来解决 普通最小二乘法 的一些问题。岭回归系数最小化的是带惩罚项的残差平方和,数学形式如下: min∑i=1p‖Xωi y‖2+α‖ω‖2 其中,α = 0是一个控制缩减量(amount of shrinkage)的复杂度参数:α的值越大,缩 ...
分类:
其他好文 时间:
2020-05-07 20:16:44
阅读次数:
62
1.多项式回归(Polynomial Regression). "一元多项式回归": 自变量只有一个 ;"多元多项式回归": 自变量有多个。 一元n次多项式:$\hat{y}=w_{0}+w_{1} x_{1}+ w_{2} x^{2}+\cdots+w_{n} x^{n}$ 多元多次多项式(二元二 ...
分类:
其他好文 时间:
2020-05-05 23:28:54
阅读次数:
76
机器学习算法的优点和缺点总结 1.正则化算法(Regularization Algorithms) 它是另一种方法(通常是回归方法)的拓展,这种方法会基于模型复杂性对其进行惩罚,它喜欢相对简单能够更好的泛化的模型。 例子: 岭回归(Ridge Regression) 最小绝对收缩与选择算子(LASS ...
分类:
编程语言 时间:
2020-05-04 15:53:05
阅读次数:
97
信用评分卡模型分数校准 风控业务背景 在评分卡建模中,我们通常会把LR输出的概率分(probability)转换为整数分(score),称之为评分卡分数校准(calibration)。事实上,这个阶段称为尺度变换(scaling)或许更为合适。只是有些书中并不严格区分校准和尺度变换,统称为风险校准。 ...
分类:
其他好文 时间:
2020-05-03 18:59:22
阅读次数:
95
名为回归,其实为一种分类算法 数据集: $$D = \lbrace x_i, y_i \rbrace i = 1, 2 , ..., n$$ 其中 $$x_i = (x_{i1}; x_{i2}; ...; x_{im})$$ 即每个样本有m个属性 $$ y_i = \begin{cases} 1 ...
分类:
编程语言 时间:
2020-05-03 01:04:17
阅读次数:
80
Sigmoid Sigmoid 函数也叫 Logistic 函数,定义为 $$ Sigmoid:=\frac{1}{1+e^{ x}} $$ 它的一个优良特性就是能够把 ?? ∈ ?? 的输入压缩到 ??∈[0,1]区间,这个区间的数值在机器学习常用来表示以下含义: 1. 概率分布 [0,1] 区间 ...
分类:
其他好文 时间:
2020-05-02 19:12:06
阅读次数:
58
1. machine learning分类 supervised learning:output class is given (regression + classification) unsupervised learning 2. regression预测的结果是一个连续的值,即对x y进行拟 ...
分类:
其他好文 时间:
2020-04-30 14:00:56
阅读次数:
71
1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 答(1): 1. 增加样本量,这是万能的方法,适用任何模型。 2. 如果数据稀疏,使用L1正则,其他情况,用L2要好,可自己尝试。 3. 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 4. 如果还过拟合 ...
分类:
其他好文 时间:
2020-04-29 21:48:31
阅读次数:
76