这篇论文主要研究素性测试的多项式时间算法,由于没有在网上找到合适的翻译版本,本人自行翻译了一个版本供学习使用。如有错误请指出。 英文原版的论文已打包上传 https://files.cnblogs.com/files/allegro vivace/PrimesinP_original.zip PRI ...
分类:
编程语言 时间:
2020-05-15 09:20:51
阅读次数:
80
背景 文本分类属于文本挖掘。文本挖掘从已知文本提取未知的知识,即从非结构的文本中提取知识。文本挖掘主要领域:搜索和信息检索;文本聚类;文本分类;Web挖掘;信息抽取;自然语言处理;概念提取。[1] 搜索和信息检索:存储和文本文档的检索,包括搜索引擎和关键字搜索。 文本聚类:使用聚类方法,对词汇,片段 ...
分类:
其他好文 时间:
2020-05-14 23:50:55
阅读次数:
113
k-means应该是原来级别的聚类方法了,这整理下一个使用后验概率准确评测其精度的方法—高斯混合模型。 我们谈到了用 k-means 进行聚类的方法,这次我们来说一下另一个很流行的算法:Gaussian Mixture Model (GMM)。事实上,GMM 和 k-means 很像,不过 GMM ...
分类:
其他好文 时间:
2020-05-14 19:24:26
阅读次数:
64
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的;而对于聚类来说,在对数据集操作时,我们是不知道该数据集包含多少类,我们要做的,是将数据集中相似的数据归纳在一起。他们都是对数 ...
分类:
编程语言 时间:
2020-05-13 20:34:52
阅读次数:
65
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 ...
分类:
编程语言 时间:
2020-05-13 20:32:49
阅读次数:
79
em,是一种含有隐含变量的概率模型参数的极大似然估计法。主要应用在机器学习以及计算机视觉的数据聚类领域。 lr,逻辑回归,本质也是线性回归,通过拟合拟合样本的某个曲线,然后使用逻辑函数进行区间缩放,但是一般用来分类,主要用在点击率预估、推荐系统等; svm,支撑向量机,通过找到样本空间中的一个超平面 ...
分类:
编程语言 时间:
2020-05-13 19:44:45
阅读次数:
114
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 ...
分类:
编程语言 时间:
2020-05-13 18:36:51
阅读次数:
63
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类是为了确定点的类别,具体有哪些类别是已知的,是监督学习。 聚类是把点成若干类,事先是没有类别的,是一种无监督学习。 监督学习:从正确的例子中学习 无监督学习:缺乏足够的先验知识 2.朴素贝 ...
分类:
编程语言 时间:
2020-05-13 11:47:11
阅读次数:
73
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类与聚类的区别:是否有已知分类的条件。分类没有,聚类有。 监督学习:已知某些类别的情况下,即具有事先标记的数据,通过特征分析来学习的一类算法。 无监督学习:不具有事先标签的数据,缺乏先验知识 ...
分类:
编程语言 时间:
2020-05-13 00:25:07
阅读次数:
76
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:都是对数据进行划分的方法 区别:分类就是“贴标签”,在事先已有的类中按这些类的性质来进行划分,要做的就是将每一条记录分别属于哪一类标记出来,常用算法KNN,是一种有监督学习; 聚类是在事先没有类,没有训练条件的情况下,根 ...
分类:
编程语言 时间:
2020-05-12 20:35:39
阅读次数:
90