机器学习六--K-means聚类算法想想常见的分类算法有决策树、Logistic回归、SVM、贝叶斯等。分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算...
分类:
编程语言 时间:
2015-10-30 07:03:23
阅读次数:
281
主题模型(topic modeling)是一种常见的机器学习应用,主要用于对文本进行分类。传统的文本分类器,例如贝叶斯、KNN和SVM分类器,只能将测试对象分到某一个类别中,假设我给出三个分类:“算法”、“网络”和“编译”让其判断,这些分类器往往将对象归到某一类中。但是如果一个外行完全给不出备选类别...
分类:
其他好文 时间:
2015-10-28 20:51:38
阅读次数:
247
1.原理 通过计算每个训练数据到待分类元组的距离,取和待分类元组距离最近的K个训练数据,K个数据中哪个类别的训练数据占多数,则待分类元组就属于哪个类别。 训练样本用n维数值属性描述。每个样本代表n维空间的一个点。所有的训练样本都放在n维模式空间中。给定一个样本,k-最临近分类法搜索模式空间,找出.....
分类:
编程语言 时间:
2015-10-14 23:33:15
阅读次数:
203
http://www.cnblogs.com/fengfenggirl/p/classification_evaluate.html一、引言 分类算法有很多,不同分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择....
分类:
其他好文 时间:
2015-10-12 00:36:09
阅读次数:
245
Boosting方法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数。他是一种框架算法,主要是通过对样本集的操作获得样本子集,然后用弱分类算法在样本子集上训练生成一系列的基分类器。
分类:
其他好文 时间:
2015-10-09 12:19:25
阅读次数:
156
1、概述朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分类原理就是利用贝叶斯公式根据某对象的先验 概率计算出其后验概率(即该对象属于某一类的概率),然后选择具有最大后验概率的类作为该对象所属的类。总的来说:当样本特征个数较多或者特征之间相关性较...
分类:
编程语言 时间:
2015-10-06 23:29:28
阅读次数:
456
《zw版·Halcon-delphi系列原创教程》水果自动分类脚本(机器学习、人工智能) 前面介绍了超市,流水线,酸奶的自动分类算法,下面再介绍一个水果的自动分类算法。 Halcon强大的图像处理能力,令人往往会忽视其更加彪悍的机器学习、人工智能。 分类,聚类分析,是机器学习、人工智能...
分类:
Windows程序 时间:
2015-10-06 10:18:16
阅读次数:
1222
1、文本匹配,敏感词过滤(正则表达式,及其他各种算法)2、分类算法3、黑名单(布隆过滤算法等)
分类:
其他好文 时间:
2015-09-30 18:19:52
阅读次数:
156
当前数据挖掘技术使用最为广泛的莫过于文本挖掘领域,包括领域本体构建、短文本实体抽取以及代码的语义级构件方法研究。常用的数据挖掘功能包括分类、聚类、预测和关联四大模型。本文针对四大模型之一的分类进行讨论。分类算法包括回归、决策树、支持向量机、贝叶斯等,显然,不少涉及机器学习的知识(随后会写些机器学习专...
分类:
其他好文 时间:
2015-09-29 20:14:57
阅读次数:
152
LDA也称Fisher线性判别法,它是一种非迭代的分类算法。算法的主要思想将特征空间中的样本投影到该空间的一条直线上以实现从高维到一维的数据压缩。显然这样的投影有很多方向,而LDA算法就是寻找一个最佳投影方向来使样本的类内距离最小而类间距离最大。投影方向:1、投影后不同..
分类:
编程语言 时间:
2015-09-29 01:25:06
阅读次数:
289