一、ID3决策树概述 ID3决策树是另一种非常重要的用来处理分类问题的结构,它形似一个嵌套N层的IF…ELSE结构,但是它的判断标准不再是一个关系表达式,而是对应的模块的信息增益。它通过信息增益的大小,从根节点开始,选择一个分支,如同进入一个IF结构的statement,通过属性值的取值不同进入新的 ...
分类:
编程语言 时间:
2018-08-12 11:59:34
阅读次数:
169
还是不习惯这种公式的编写,还是直接上word。。。。 对上面的(7)式取log后并最大化即可得到最小二乘法,即 argmaxθ J(θ) 思考二:线性回归到逻辑回归的转变: 1) 引入逻辑回归,假设用线性回归来做分类问题,设为二分类,即y取0或1。 则会出现如下的情况: 这种情况下是能很好的分类的, ...
分类:
其他好文 时间:
2018-08-12 01:32:55
阅读次数:
191
之前有看到微信小程序《跳一跳》别人用python实现自动运行,后来看到别人用hash码实现《加减大师》的自动答题领取娃娃,最近一直在研究深度学习,为啥不用机器学习实现呢?不就是一个分类问题吗 如何实现自动答题微信小游戏《加减大师》? 思考: 图像识别吗? 如何建立特征工程? 选用什么算法? 一、图像 ...
分类:
微信 时间:
2018-08-08 00:32:49
阅读次数:
319
在使用机器学习算法过程中,针对不同的问题需要不用的模型评估标准,这里统一汇总。主要以两大类分类与回归分别阐述。 一、分类问题 1、混淆矩阵 混淆矩阵是监督学习中的一种可视化工具,主要用于比较分类结果和实例的真实信息。矩阵中的每一行代表实例的预测类别,每一列代表实例的真实类别。 2、准确率(Accur ...
分类:
其他好文 时间:
2018-08-06 19:26:10
阅读次数:
252
在分类问题中,有存在正反例数目差异较大的情况,这种情况叫做类别不平衡。 针对这种问题,解决方式主要有3种:假设正例数量大,反例数目极小。 1、减少正例的数量,使得数据平衡,再进一步分类,这种情况属于“欠采样”; 2、增加反例的数目平衡数据,再分类,这种称为“过采样”; 3、阈值移动:直接使用原始数据 ...
分类:
其他好文 时间:
2018-08-03 16:25:29
阅读次数:
331
# 通过查 scikit-learn 库的 API ,查看 scikit-learn 中各个模块下的各个方法的功能、用法; # 1)模块的方法下有多种参数,每一种参数有多种设置,第一个设置为该参数的默认状态; # 2)模块下的方法的具体封装:在各个模块安装目录下的 .py 文件中; # 如:D:\软 ...
分类:
其他好文 时间:
2018-08-02 01:52:36
阅读次数:
1753
一、基础理解 问题:逻辑回归算法是用回归的方式解决分类的问题,而且只可以解决二分类问题; 方案:可以通过改造,使得逻辑回归算法可以解决多分类问题; 改造方法: 改造方法不是指针对逻辑回归算法,而是在机器学习领域有通用性,所有二分类的机器学习算法都可使用此方法进行改造,解决多分类问题; 二、原理 1) ...
分类:
其他好文 时间:
2018-07-30 13:28:50
阅读次数:
6125
一、基础 逻辑回归中的决策边界,本质上相当于在特征平面中找一条直线,用这条直线分割所有的样本对应的分类; 逻辑回归只可以解决二分类问题(包含线性和非线性问题),因此其决策边界只可以将特征平面分为两部分; 问题:使用直线分类太过简单,因为有很多情况样本的分类的决策边界并不是一条直线,如下图;因为这些样 ...
分类:
其他好文 时间:
2018-07-29 17:50:57
阅读次数:
357
2个挑战: 1)在杂乱背景下人脸视角大的变化需要人脸检测器精准的解决复杂人脸和非人脸的分类问题。 2)较大的搜索空间和人脸尺寸进一步增加了时间效率的需要。 传统方法效率高但在人脸大的视角变化下精度不够,基于CNN的方法精度高但速度很慢。 受到Faster R-CNN的RPN以及SSD中多尺度机制的启 ...
分类:
其他好文 时间:
2018-07-28 13:56:03
阅读次数:
175
我们经常使用决策树处理分类问题,近年来的调查表明决策树也是经常使用的数据挖掘算法K-NN可以完成多分类任务,但是它最大的缺点是无法给出数据的内在含义,决策树的主要优势在于数据形式非常容易理解决策树的优缺点:优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据缺点:可能 ...
分类:
编程语言 时间:
2018-07-22 20:45:39
阅读次数:
159