机器学习部分 1 逻辑回归部分 常问,推导要会 推导:https://zhuanlan.zhihu.com/p/34325602 2 SVM部分 常问,推导要会,精 ...
分类:
其他好文 时间:
2018-04-07 20:58:43
阅读次数:
202
验证码识别是一个适合入门机器学习的项目,之前用knn 做过一个很简单的,这次用svm来实现。svm直接用了开源的库libsvm。验证码选的比较简单,代码也写得略乱,大家看看就好。 1. 爬取验证码图片 2. 二值化 接下来要做的工作就是二值化验证码,所谓二值化,就是将每一个像素点用0或1来表示,图像 ...
分类:
编程语言 时间:
2018-04-07 14:56:55
阅读次数:
591
闲来无聊,整理下,以飨各位 K-means,如何用hadoop实现k-meansnaive bayes和logistic regression的区别LDA的原理和推导做广告点击率预测,用哪些数据什么算法推荐系统的算法中最近邻和矩阵分解各自适用场景 需要进行公式推导的 SVM LR 贝叶斯 LSTM ...
分类:
其他好文 时间:
2018-04-06 18:40:44
阅读次数:
505
什么是K近邻? K近邻一种非参数学习的算法,可以用在分类问题上,也可以用在回归问题上。 什么是非参数学习? 一般而言,机器学习算法都有相应的参数要学习,比如线性回归模型中的权重参数和偏置参数,SVM的C和gamma参数,而这些参数的学习又依赖一定的学习策略。相比较而言,k近邻算法可以说是最简单,也是 ...
分类:
编程语言 时间:
2018-04-06 17:34:49
阅读次数:
136
概要 先前我们实现了 "基础版本" 的 SVM,现在我们来实现进阶版本。和上次比,这次优化的地方在于: 启发式选择参数 alpha(训练速度更快) 。通过一个外循环来选择第一个 alpha 值,并且其选择过程中会在两种方式间进行交替:一种方式是在所有数据集上进行单遍扫描,另一种方式则是在非边界(不等 ...
分类:
其他好文 时间:
2018-04-04 00:01:46
阅读次数:
170
GMM-HMM语音识别模型原理篇隐马尔科夫模型-HMM-ATutorialOnHiddenMarkovModels0.概念:语音信号处理/模式识别/统计分析,1.算法:常用的深度学习算法,包括cnn/dnn/rnn/lstm;GMM/SVM/CRF/MaxEnt/HMM;对CTC有经验;2.框架:熟悉至少一种深度学习框架,包括kaldi,tensorflow,caffe,mxnet等;常用工具如C
分类:
其他好文 时间:
2018-04-03 17:24:57
阅读次数:
344
以下关于决策树的内容来自网络,都是非常通俗易懂的。 一.GBDT简介 GBDT(Gradient Boosting Decision Tree) 是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终结果。它在被提出之初就和SVM一起被认为是泛化能力(generalization ...
分类:
其他好文 时间:
2018-04-03 15:27:48
阅读次数:
283
一、疑问 二、知识点 1. 损失函数可视化 ? 损失函数一般都是定义在高维度的空间中,这样要将其可视化就很困难。然而办法还是有的,在1个维度或者2个维度的方向上对高维空间进行切片,例如,随机生成一个权重矩阵 ,该矩阵就与高维空间中的一个点对应。然后沿着某个维度方向前进的同时记录损失函数值的变化。换句 ...
分类:
其他好文 时间:
2018-04-03 12:51:40
阅读次数:
248
一、疑问 1. assignments1 linear_svm.py文件的函数 svm_loss_naive中,使用循环的方式实现梯度计算 linear_svm.py文件的函数 svm_loss_vectorized中,梯度的向量化实现 SVM的损失函数在某个数据点上的计算: 对函数进行微分,比如对 ...
分类:
其他好文 时间:
2018-04-03 12:51:31
阅读次数:
117