对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 1. 获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这: http://ar ...
分类:
其他好文 时间:
2019-01-24 13:11:49
阅读次数:
139
1.使用sklearn库和matplotlib.pyplot库 2.准备绘图函数的传入参数1.预测的概率值数组2.预测的labels值数组 3.调用sklearn.metrics.roc_curve(); 4.例子 5.效果: ...
分类:
其他好文 时间:
2019-01-23 14:00:10
阅读次数:
371
构建模型的个基本过程: PCA 与 SVD关系 PCA : 降维度。过程:首先计算样本本协方差矩阵,然后·暴力特征分解·(非常消耗资源)。 SVD : 降维度,它的标准推导过程类似特征分解(耗资源),据说,sk-learn中它有其他实现过程。 scikit-learn的PCA算法的背后真正的实现就是 ...
分类:
其他好文 时间:
2019-01-21 16:08:54
阅读次数:
183
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.rbf_kernel.html 源码: ...
分类:
其他好文 时间:
2019-01-18 16:33:49
阅读次数:
417
Scikit-learn与特征工程 Scikit-learn与特征工程 Scikit-learn与特征工程 “数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这句话很好的阐述了数据在机器学习中的重要性。大部分直接拿过来的数据都是特征不明显的、没有经过处理的或者说是存在很多无用的数据,那么需 ...
分类:
其他好文 时间:
2019-01-17 22:37:21
阅读次数:
134
最近我在想,有没有可能检测出一幅图像的主色。最后我使用k-means聚类算法取得了很好的效果。我使用python OpenCV和scikit-learn实现了它。 怎么运作的? k-means是机器学习中使用的聚类算法,其中一组数据点将被分类为“k”组。它适用于简单的距离计算。 图像分割 分割将图像 ...
分类:
其他好文 时间:
2019-01-05 20:37:04
阅读次数:
238
1.Demo 生成的可视化的决策树 2.DecisionTreeClassifier class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None, min_samples_sp ...
分类:
其他好文 时间:
2018-12-25 11:39:34
阅读次数:
130
官方文档 http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html 参数说明 http://m.blog.csdn.net/github_39261590/article/details/75009069 常用核函数 ...
分类:
其他好文 时间:
2018-12-24 12:07:14
阅读次数:
118
pandas含有使数据清洗和分析?作变得更快更简单的数据结构和操作?具。pandas经常和其它?具?同使?,如数值计算?具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matplotlib。pandas是基于NumPy数组构建的,特别是基于数组的函数和 ...
分类:
其他好文 时间:
2018-12-09 01:05:52
阅读次数:
205
本文是LDA主题模型的第三篇,读这一篇之前建议先读文本主题模型之LDA(一) LDA基础,同时由于使用了EM算法,如果你对EM算法不熟悉,建议先熟悉EM算法的主要思想。LDA的变分推断EM算法求解,应用于Spark MLlib和Scikit-learn的LDA算法实现,因此值得好好理解。 1. 变分 ...
分类:
编程语言 时间:
2018-12-04 13:15:02
阅读次数:
186