码迷,mamicode.com
首页 > 其他好文 > 详细

TF-IDF(词频-逆向文件频率)用于文字分类

时间:2018-03-21 23:19:33      阅读:306      评论:0      收藏:0      [点我收藏+]

标签:fan   frequency   需要   文字   targe   linear   tail   tf-idf   直线   

SVM分类器:支持向量机Support Vector Machine。

一个普通的SVM就是一条直线,用来完美划分linearly separable的两类。解决线性

要解决非线性需要到高维处理:

核函数


 

TF-IDF(term frequency–inverse document frequency)

词频 (term frequency, TF) 

逆向文件频率 (inverse document frequency, IDF) 

TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。

 

 

Matlab-SVM分类器 - CSDN博客 http://blog.csdn.net/lwwangfang/article/details/52351715

 

TF-IDF(词频-逆向文件频率)用于文字分类

标签:fan   frequency   需要   文字   targe   linear   tail   tf-idf   直线   

原文地址:https://www.cnblogs.com/wxl845235800/p/8620239.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!