在样本数据集(xn,tn)中,tn不是简单的离散值,而是连续值。如在线性回归中,预测房价的问题。与线性回归类似,目标函数是正则平方误差函数:
在SVM回归算法中,目的是训练出超平面y=wTx+b,采用yn=wTxn+b作为预测值。为了获得稀疏解,即计算超平面参数w,b不依靠所用样本数据,而是部分数据(如在SVM分类算法中,支持向量的定义),采用??insensitive 误差函数–Vapnik,1...
分类:
其他好文 时间:
2016-04-12 11:13:09
阅读次数:
218
本文详细介绍了KNN分类算法的原理。
以及如何使用KD树实现KNN算法,包括KD树的构建与K近邻查找
最后给出了KD树的C#实现源码...
分类:
编程语言 时间:
2016-04-05 17:48:27
阅读次数:
243
K近邻(KNN):分类算法 * KNN是non-parametric分类器(不做分布形式的假设,直接从数据估计概率密度),是memory-based learning. * KNN不适用于高维数据(curse of dimension) * Machine Learning的Python库很多,比如 ...
分类:
编程语言 时间:
2016-04-05 14:06:43
阅读次数:
229
机器学习可分为监督学习和无监督学习。有监督学习就是有具体的分类信息,比如用来判定输入的是输入[a,b,c]中的一类;无监督学习就是不清楚最后的分类情况,也不会给目标值。 K-近邻算法属于一种监督学习分类算法,该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属 ...
分类:
编程语言 时间:
2016-04-05 00:30:06
阅读次数:
284
一、分类的数学定义:
从数学角度来说,分类问题可做如下定义:
已知集合:和,确定映射规则,使得任意有且仅有一个使得成立。(不考虑模糊数学里的模糊集情况)。
其中C叫做类别集合,其中每一个元素是一个类别,而I叫做项集合,其中每一个元素是一个待分类项,f叫做分类器。分类算法的任务就是构造分类器f。
二、贝叶斯统计基础:
...
分类:
其他好文 时间:
2016-04-01 18:50:09
阅读次数:
117
朴素贝叶斯分类器的应用 作者: 阮一峰 日期: 2013年12月16日 作者: 阮一峰 日期: 2013年12月16日 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。 一、病人分类的 ...
分类:
其他好文 时间:
2016-03-31 16:44:42
阅读次数:
150
左图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方 ...
分类:
编程语言 时间:
2016-03-30 00:08:05
阅读次数:
295
本文来自网络,属于对各评价指标的总结,如果看完之后,还不是很理解,可以针对每个评价指标再单独搜索一些学习资料。加油~! 对于分类算法,常用的评价指标有: (1)Precision (2)Recall (3)F-score (4)Accuracy (5)ROC (6)AUC ps:不建议翻译成中文,尤
分类:
编程语言 时间:
2016-03-04 10:19:20
阅读次数:
379
http://gemantic.iteye.com/blog/1701101 simHash 简介以及java实现 博客分类: 算法 simHash java 去重 传统的hash 算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上相当于伪随机数产生算法。产生的两个签名,如果相等,说明原始内
分类:
编程语言 时间:
2016-03-01 20:57:04
阅读次数:
442
作者:张洋 算法杂货铺——分类算法之决策树(Decision tree) 2010-09-19 16:30 by T2噬菌体, 44346 阅读, 29 评论, 收藏, 编辑 3.1、摘要 在前面两篇文章中,分别介绍和讨论了朴素贝叶斯分类与贝叶斯网络两种分类算法。这两种算法都以贝叶斯定理为基础,可以
分类:
编程语言 时间:
2016-02-24 20:51:43
阅读次数:
188