要进行机器学习,先要有数据记录这组记录的集合称为一个"数据集“ 每条记录是关于一个事件或对象的描述 称为"示例" (instance) 或"样本" (samp1e). (色泽=浅自;根蒂t硬挺;敲声=清脆) 反映事件或对象在某方面的表现或性质的事项(例如"色泽""根蒂" "敲声") 称为 属性 或" ...
分类:
其他好文 时间:
2020-05-07 10:42:10
阅读次数:
96
(1)numpy以及matplotlib的学习总结及应用 NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。Numpy内部解除了CPython的GIL(全局解释器锁),运行效率极好,是大量机器学习框架的基础库! NumPy的全名为 ...
分类:
其他好文 时间:
2020-05-06 19:34:37
阅读次数:
83
机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的 工作,而其评价指标往往有如下几点:准确率(Accuracy),精确率(Precision),召回率(Recall)和F1-Measure。 TP: Ture Positive 把正的判断为正的 ...
分类:
其他好文 时间:
2020-05-05 23:09:28
阅读次数:
2016
随机森林(RandomForest) 简介: 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。 而 “Random Forests” 是他们的商标。 这个术语是1995 ...
分类:
其他好文 时间:
2020-05-05 20:23:35
阅读次数:
489
决策树的理解 决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和CART等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。 决策树是一种十分常用的分类方法,需要监管学习(有教师的Supervised Lea ...
分类:
其他好文 时间:
2020-05-05 20:09:36
阅读次数:
1309
From: https://www.cnblogs.com/pinard/p/6912636.html EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。本文 ...
分类:
编程语言 时间:
2020-05-05 17:56:50
阅读次数:
76
特征缩放 to do Batch Normalization原理 https://zhuanlan.zhihu.com/p/34879333 https://zhuanlan.zhihu.com/p/69659844 背景 对深层神经网络的训练调参困难且复杂,深度神经网络之所以如此难训练,其中一个重 ...
分类:
其他好文 时间:
2020-05-04 17:21:13
阅读次数:
52
概览 基于模糊集二值分割 对比ostu等其他方法 模糊集图像聚类 FCM 对比KMeans聚类 结合模糊集图像分割的 总结 摘要 模糊集理论,也称为模糊集合论,或简单地称为模糊集,1965年美国学者扎德在数学上创立了一种描述模糊现象的方法—模糊集合论。这种方法把待考察的对象及反映它的模糊概念作为一定 ...
分类:
其他好文 时间:
2020-05-04 17:03:09
阅读次数:
151
机器学习算法的优点和缺点总结 1.正则化算法(Regularization Algorithms) 它是另一种方法(通常是回归方法)的拓展,这种方法会基于模型复杂性对其进行惩罚,它喜欢相对简单能够更好的泛化的模型。 例子: 岭回归(Ridge Regression) 最小绝对收缩与选择算子(LASS ...
分类:
编程语言 时间:
2020-05-04 15:53:05
阅读次数:
97
本文转自公众号《数据科学家联盟》 一、主成分分析法的思想及其原理 1、PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法(非监督的机器学习方法)。 其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异,发现更便于人类理解的特 ...
分类:
其他好文 时间:
2020-05-03 18:41:03
阅读次数:
154