码迷,mamicode.com
首页 >  
搜索关键字:分类算法    ( 656个结果
AI学习---分类算法
分类算法:对目标值进行分类的算法 1、sklearn转换器和预估器 2、KNN算法 3、模型选择与调优 4、朴素贝叶斯算法 5、决策树 6、随机森林 sklearn转换器(transfer)与估计器(estimeter) 1、转换器 - 特征工程的父类 转换器 - 特征工程的父类 1、API的实现过... ...
分类:编程语言   时间:2019-03-10 12:23:56    阅读次数:627
机器学习-样本不均衡问题处理
在机器学习中,我们获取的数据往往存在一个问题,就是样本不均匀。比如你有一个样本集合,正例有9900个,负例100个,训练的结果往往是很差的,因为这个模型总趋近于是正例的。 就算全是正那么,也有99%的准确率,看起来挺不错的,但是我们要预测的负样本很可能一个都预测不出来。 这种情况,在机器学习中有三个 ...
分类:其他好文   时间:2019-02-27 19:02:51    阅读次数:201
利用朴素贝叶斯分类算法对搜狐新闻进行分类(python)
数据来源 https://www.sogou.com/labs/resource/cs.php介绍:来自搜狐新闻2012年6月—7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据,提供URL和正文信息格式说明:<doc><url>页面URL</url><docno>页面ID</docno>< ...
分类:编程语言   时间:2019-02-02 14:14:07    阅读次数:310
K近邻算法
定义K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K近邻距离的计算在KNN中,通过计算对象间距离来作为各个对象之间的非相似性指标,距离一般使用欧氏距离或曼哈顿距离:
分类:编程语言   时间:2019-02-02 10:41:45    阅读次数:190
机器学习之线性回归、岭回归、Lasso回归
1、回归算法分类算法的目标值是标称型数据,而回归的目标变量是连续型数据,主要包括线性回归,岭回归,lasso回归,前向逐步回归。2、线性回归线性回归主要用于处理线性数据,结果易于理解,计算复杂度不高,但是处理不了非线性数据。线性回归用最适直线(回归线)去建立因变量Y和一个或多个自变量X之间的关系。可以用公式来表示:Y=wX+b。其中w为权重,也称为回归系数,b为偏置顶。3、理解线性回归线性回归从高
分类:其他好文   时间:2019-01-29 18:32:15    阅读次数:236
模型评估-2
一、分类算法的评估 1、二分类 ROC与AUC 1.1 roc曲线:接收者操作特征(receiveroperating characteristic) roc曲线上每个点反映着对同一信号刺激的感受性。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的 ...
分类:其他好文   时间:2019-01-25 19:21:29    阅读次数:229
分类:决策树——树的生长
分类算法非常适合预测或描述标签为二元或标称类型的数据集,对于标签为序数类型的数据集,分类技术则不太有效,因为分类技术不考虑隐藏在序数中的“序”关系,对于标签其他形式的联系如子类与超类(包含的关系),分类技术也不太适合。 本文是分类模型系列的初篇,先介绍最基本的分类/回归模型——决策树模型。决策树分类 ...
分类:其他好文   时间:2019-01-19 21:16:39    阅读次数:178
04-朴素贝叶斯
朴素贝叶斯 概述 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: 朴素贝叶斯分类。 贝叶斯理论 & 条件概率 贝叶斯理论 我们现在有一个数据集,它由两类数据组成,数 ...
分类:其他好文   时间:2019-01-19 14:25:02    阅读次数:196
3.1_分类算法之k-近邻
分类算法之k-近邻 分类算法之k-近邻 k-近邻算法采用测量不同特征值之间的距离来进行分类 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型 一个例子弄懂k-近邻 电影可以按照题材分类,每个题材又是如何定义的呢?那么假如两种类型的电影,动作 ...
分类:编程语言   时间:2019-01-18 13:58:54    阅读次数:251
监督学习算法_k-近邻(kNN)分类算法_源代码
因为自己想学着去写机器学习的源码,所以我最近在学习《机器学习实战》这本书。 《机器学习实战》是利用Python2完成的机器学习算法的源代码,并利用机器学习方法来对实际问题进行分析与处理。 (《机器学习实战》豆瓣读书网址:https://book.douban.com/subject/24703171 ...
分类:编程语言   时间:2019-01-18 01:00:42    阅读次数:163
656条   上一页 1 ... 14 15 16 17 18 ... 66 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!