贝叶斯统计的优势在于,“在数据少的情况下也可以进行推测,数据越多,推测结果越准确”,以及“对所获的信息可做出瞬时反应,自动升级推测”的学习功能。 假设一个场景:面前有一位顾客,此时你需要做的是,推测该顾客究竟是“来买东西的人”,还是“随便逛逛的人”。只有做出正确的判断,才能采取正确的接待方法。 推算 ...
分类:
其他好文 时间:
2020-04-30 13:50:02
阅读次数:
66
随机森林算法学习最近在做kaggle的时候,发现随机森林这个算法在分类问题上效果十分的好,大多数情况下效果远要比svm,log回归,knn等算法效果好。因此想琢磨琢磨这个算法的原理。 要学随机森林,首先先简单介绍一下集成学习方法和决策树算法。下文仅对该两种方法做简单介绍(具体学习推荐看统计学习方法的 ...
分类:
编程语言 时间:
2020-04-30 11:36:53
阅读次数:
113
1 简介 线性可分问题的支持向量机学习方法,对线性不可分训练数据是不适用的,因为这时上述方法中的不等式约束并不能都成立。 怎么才能将它扩展到线性不可分问题呢?这就需要修改硬间隔最大化,使其成为软间隔最大化。 2 模型 2.1 相关条件 2.2 模型 3 学习策略 4 算法 对偶形式 5 概念扩展 5 ...
分类:
其他好文 时间:
2020-04-29 14:58:07
阅读次数:
56
1 简介 支持向量机(support vector machines> SVM)是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;支持 向量机还包括核技巧,这使它成为实质卜的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规 ...
分类:
其他好文 时间:
2020-04-29 12:49:37
阅读次数:
142
1 简介 逻辑斯谛回归(logistic regression)是统计学习中的经典分类方法。 最大嫡是概率模型学习的一个准则,将其推广到分类问题得到最大嫡模型(maximum entropy model )。 逻辑斯谛回归模型与最大嫡模型都属于对数线性模型。 2 模型 2.1 逻辑斯谛分布 2.2 ...
分类:
其他好文 时间:
2020-04-28 17:31:04
阅读次数:
56
1 简介 1.1 介绍 1.2 生成步骤 CART树算法由以下两步组成:(1)决策树生成:基于训练数据集生成决策树,生成的决策树要尽量大;(2)决策树剪枝:用验证数据集对己生成的树进行剪枝并选择最优子树,这时用损失函数址小作为剪枝的标准。 2 算法 2.1 回归树 对回归树用平方误差最小化准则,生成 ...
分类:
编程语言 时间:
2020-04-28 14:36:46
阅读次数:
113
1 简介 决策树模型是树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策 ...
分类:
其他好文 时间:
2020-04-28 13:04:22
阅读次数:
158
1 简介 k近邻法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类。k近邻法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,k近邻法不具有显式的学习过程。k近邻法实际上利用训练数据集对一特征向 ...
分类:
编程语言 时间:
2020-04-27 11:22:04
阅读次数:
137
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)、回归算法总结: 回归是统计学中最有力的工具之一。机器习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测,针对的是数值型的样本,使用回归,可以在 ...
分类:
编程语言 时间:
2020-04-22 16:25:55
阅读次数:
65
#_author:来童星#date:2020/4/17import reimport osdef menu(): print( """ | 学生信息管理系统 | |1.录入学生信息 |2.查找学生信息 |3.删除学生信息 |4.修改学生信息 |5.排序 |6.统计学生总人数 |7.显示所有学生信息 ...
分类:
其他好文 时间:
2020-04-18 22:41:51
阅读次数:
340