17年开始,网上的机器学习教程逐渐增多,国内我所了解的就有网易云课堂、七月、小象学院和北风。他们的课程侧重点各有不同,有些侧重理论,有些侧重实践,结合起来学习事半功倍。但是论经典,还是首推吴恩达的机器学习课程。 吴大大14年在 "coursera" 的课程通俗易懂、短小精悍,在讲解知识点的同时,还会 ...
分类:
其他好文 时间:
2018-01-16 23:56:43
阅读次数:
208
caret包(Classification and Regression Training)是一系列函数的集合,它试图对创建预测模型的过程进行流程化。本系列将就数据预处理、特征选择、抽样、模型调参等进行介绍学习。 本文将就caret包中的数据预处理部分进行介绍学习。主要包括以下函数:model.ma ...
分类:
编程语言 时间:
2018-01-15 20:20:27
阅读次数:
5193
Motivation 问题描述对于一些问题标签值只有两个(1,0),而线性回归模型的输出值是一定范围的连续值。这时的做法是人为规定一个阈值0,当预测值大于0时判为1,预测值小于0时判为0.?上图对应的线性回归假设函数hypothesis为(特征的维数是2)\[h_\theta(x)=-3+x_1+x... ...
分类:
其他好文 时间:
2018-01-15 14:46:35
阅读次数:
188
Motivation 问题描述 收集到某一地区的房子面积和房价的数据(x, y)42组,对于一套已知面积的房子预测其房价? ? ? 由房价数据可视化图可以看出,可以使用一条直线拟合房价。通过这种假设得到的预测值和真实值比较接近。 Model 模型 将现实的问题通过数学模型描述出来。 m 个 样本(e ...
分类:
其他好文 时间:
2018-01-15 13:30:37
阅读次数:
236
Motivation 问题描述对于一些问题标签值只有两个(1,0),而线性回归模型的输出值是一定范围的连续值。这时的做法是人为规定一个阈值0,当预测值大于0时判为1,预测值小于0时判为0.?上图对应的线性回归假设函数hypothesis为(特征的维数是2)\[h_\theta(x)=-3+x_1+x... ...
分类:
其他好文 时间:
2018-01-15 12:39:27
阅读次数:
103
作者:JSong 时间:2018.01.14 评分卡可以用来预测客户的好坏。当一个评分卡已经构建完成,并且有一组个人分数和其对应的好坏状态的数据时,我们想知道所构建的评分卡是否可靠?可靠程度如何?而这取决于如何去定义这个“好”字。一般有三种角度可以来评估: 评分卡分类划分的准确程度,如错误率、准确率 ...
分类:
其他好文 时间:
2018-01-14 21:21:17
阅读次数:
2076
作者:JSong 时间:2017.12 我想通过几篇文章,给评分卡的全流程一个中等粒度的介绍。另外我的本职工作不是消费金融的数据分析,所以本系列的文章会偏技术一些。 数据分析工具主要有Python3及pandas、sklearn等科学计算包,另外也会有自己的工具包reportgen。 信用记录数据采 ...
分类:
其他好文 时间:
2018-01-14 20:17:22
阅读次数:
762
"机器学习系统设计(Building Machine Learning Systems with Python) Willi Richert Luis Pedro Coelho" 总述 本书是 2014 的,看完以后才发现有第二版的更新,2016。建议阅读最新版,有能力的建议阅读英文版,中文翻译有些 ...
分类:
编程语言 时间:
2018-01-14 16:47:51
阅读次数:
212
$$\theta_1 := \theta_1 \alpha\frac 1 {2m}\sum_{i=1}^m(h_\theta(x^{(i)}) y^{(i)})\cdot{x^{(i)}}$$ } 问题描述 对于一些问题标签值只有两个(1,0),而线性回归模型的输出值是一定范围的连续值。这时的做法是 ...
分类:
其他好文 时间:
2018-01-13 20:42:06
阅读次数:
206
每每以为攀得众山小,可、每每又切实来到起点,大牛们。缓缓脚步来俺笔记葩分享一下吧,please~———————————————————————————本笔记来源于CDA-DSC-L2R的课程。主要探讨精准营销的解决方式、营销组合的评估。———————————————————————————————— ...
分类:
其他好文 时间:
2018-01-13 18:56:30
阅读次数:
188