一、W2V的两种模型:CBOW和Skip-gram W2V有两种模型,分别为CBOW和skip-gram,CBOW是根据上下文$context(w)$来预测中间词$w$,而skip-gram是根据中间词$w$来预测上下文$context(w)$;他们都有3层结构——输入层,投影层,输出层。(注:无隐 ...
分类:
其他好文 时间:
2018-10-04 00:06:27
阅读次数:
334
一、旧版本的神经网络表示词向量 将每个词表示成$m$维的向量,用$v(w)$表示,整个网络分为4层,分别为输入层,投影层,隐藏层,输出层。 输入层:取一个大小为n的窗口表示输入,用1~(n-1)个词来预测第n个词的生成概率。 投影层:将每个词映射为m维向量,将这些词向量拼接为一个(n-1)m的长向量 ...
分类:
其他好文 时间:
2018-10-03 20:32:57
阅读次数:
212
1. 前言 说到朴素贝叶斯算法,首先牵扯到的一个概念是 判别式和生成式 。 判别式:就是直接学习出特征输出$Y$和特征$X$之间的关系,如决策函数$Y=f(X)$,或者从概率论的角度,求出条件分布$P(Y|X)$。代表算法有 决策树、KNN、逻辑回归、支持向量机、随机条件场CRF等 生成式:就是直接 ...
分类:
编程语言 时间:
2018-10-01 17:08:54
阅读次数:
199
之前对坐标系的变换背后的数学原理感到不解,花时间研究下,发现只是简单的矩阵变换。 数学推导 $$ \left[ \begin{matrix} v1 & v2 & v3 \end{matrix} \right] \tag{V} $$ $$ \left[ \begin{matrix} u1 & u2 & ...
分类:
其他好文 时间:
2018-09-28 21:21:05
阅读次数:
172
上一章,讲了基本概念和关于模型选择与评估的概念。这一张学习线性回归,并根据线性回归加上模型选择与评估的知识来实例化。 1、线性回归(LinearRegression)(又名最小二乘法,ordinary least squares OLS)最小二乘法的具体数学原理这里就不再赘述了,另外需要讲的一点是线 ...
分类:
其他好文 时间:
2018-09-28 18:59:12
阅读次数:
303
1. 模型 逻辑回归的Model为:$ h_\theta(x)=\frac 1 {1+e^{ (\theta^Tx+b)}} $ 2.代价函数 针对一个样本的代价函数为: if y = 1 : $ cost(x)= log(h_\theta(x))$ if y = 0 : $ cost(x)= lo ...
分类:
编程语言 时间:
2018-09-28 00:09:19
阅读次数:
183
本文主要介绍了逻辑斯谛回归模型的基本原理,以及其参数估计的推导过程,并将二项逻辑斯谛模型推广到了多项逻辑斯谛模型上。 ...
分类:
其他好文 时间:
2018-09-25 20:44:14
阅读次数:
190
1.实验背景 本次实验是Kaggle上的一个入门比赛——Titanic: Machine Learning from Disaster。比赛选择了泰坦尼克号海难作为背景,并提供了样本数据及测试数据,要求我们根据样本数据内容建立一个预测模型,对于测试数据中每个人是否获救做个预测。样本数据包括891条乘 ...
分类:
其他好文 时间:
2018-09-24 14:43:10
阅读次数:
275
通常我们在做CTR预估的时候,预估值会与真是的CTR有偏差,这种偏差可能来自于负采样,可能是因为模型的问题。 CTR预估值与真实值有偏差,并不会影响AUC指标和排序,但是实际使用中往往需要CTR的预估值不仅仅是做到有序,即正样本排在负样本前面,而且需要保证有一定的区分度。这涉及到一个概念保序和保距。 ...
分类:
其他好文 时间:
2018-09-19 17:14:46
阅读次数:
1761
一、选择题+ +1.一般来说,当居民的收入减少时,居民储蓄存款也会相应减少,二者之间的关系是(B)A.负相关B.正相关C.零相关D.曲线相关+ +2.对客户的生命周期进行分类主要使用以下哪个方法?(A)A.聚类分析B.判别分析C.逻辑回归D.线性回归+ +3.下列哪项不属于数据预处理阶段做的任务?( ...
分类:
其他好文 时间:
2018-09-18 16:02:34
阅读次数:
285