?? 内容概要 怎样使用pandas读入数据怎样使用seaborn进行数据的可视化scikit-learn的线性回归模型和用法线性回归模型的评估測度特征选择的方法 作为有监督学习,分类问题是预測类别结果,而回归问题是预測一个连续的结果。 1. 使用pandas来读取数据 Pandas是一个用于数据探
分类:
其他好文 时间:
2016-02-25 09:08:08
阅读次数:
578
5.1节 Cost Function神经网络的代价函数。 上图回顾神经网络中的一些概念: L 神经网络的总层数。 sl 第l层的单元数量(不包括偏差单元)。 2类分类问题:二元分类和多元分类。 上图展现的是神经网络的损失函数,注意这是正则化的形式。 正则化部分,i、j不为0。当然i、j可以为0,此时
分类:
Web程序 时间:
2016-02-25 00:07:14
阅读次数:
344
本文为朴素贝叶斯的实践和进阶篇,先丢了点干货,总结了贝叶斯方法的优缺点,应用场景,注意点和一般建模方法。紧接着对它最常见的应用场景,抓了几个例子,又来了一遍手把手系列,不管是对于文本主题分类、多分类问题(犯罪类型分类) 还是 情感分析/分类,朴素贝叶斯都是一个简单直接高效的方法。尤其是在和逻辑回归的对比中可以看出,在这些问题中,朴素贝叶斯能取得和逻辑回归相近的成绩,但是训练速度远快于逻辑回归,真正的直接和高效。...
分类:
其他好文 时间:
2016-02-03 16:37:41
阅读次数:
2963
最近在看吴恩达的机器学习课程,当中讲到Logistic regression classifiers 之 One-vs-all Classification,下面是一些个人的总结:1.对于多分类问题,其实就是划出多条的decision boundary,在训练的时候,其实每一次只是选择一个类进行训练...
分类:
系统相关 时间:
2016-01-26 20:13:54
阅读次数:
205
1. 导入各种模块基本形式为:import 模块名from 某个文件 import 某个模块2. 导入数据(以两类分类问题为例,即numClass = 2)训练集数据data可以看到,data是一个四维的ndarray训练集的标签3. 将导入的数据转化我keras可以接受的数据格式keras要求的l...
分类:
其他好文 时间:
2016-01-25 06:33:19
阅读次数:
1217
引入一个机器能够依据照片来辨别鲜花的品种吗?在机器学习角度,这事实上是一个分类问题。即机器依据不同品种鲜花的数据进行学习。使其能够对未标记的測试图片数据进行分类。 这一小节。我们还是从scikit-learn出发,理解主要的分类原则,多动手实践。Iris数据集Iris flower数...
分类:
编程语言 时间:
2016-01-24 14:10:04
阅读次数:
826
聚类是将相似对象归到同一个簇中的方法,这有点像全自动分类。簇内的对象越相似,聚类的效果越好。支持向量机、神经网络所讨论的分类问题都是有监督的学习方式,现在我们所介绍的聚类则是无监督的。其中,K均值(K-means)是最基本、最简单的聚类算法。...
分类:
编程语言 时间:
2016-01-23 18:30:32
阅读次数:
225
文本分类,首先它是分类问题,应该对应着分类过程的两个重要的步骤,一个是使用训练数据集训练分类器,另一个就是使用测试数据集来评价分类器的分类精度。然而,作为文本分类,它还具有文本这样的约束,所以对于文本来说,需要额外的处理过程,我们结合使用libsvm从宏观上总结一下,基于libsvm实现文本分类实现...
分类:
其他好文 时间:
2016-01-15 22:43:35
阅读次数:
219
上一篇教程中我们介绍了如何使用OpenCv封装的FaceRecognizer类实现简单的人脸性别识别,这里我们为大家提供另外一种基本的性别识别手段——支持向量机(SVM)。
支持向量机在解决二分类问题方面有着强大的威力(当然也可以解决多分类问题),性别识别是典型的二分类模式识别问题,因此很适合用SVM进行处理,同时OpenCv又对SVM进行了很好的封装,调用非常方便,因此我们在这个性别识...
分类:
编程语言 时间:
2016-01-08 10:30:05
阅读次数:
312
动机(Motivation)对于非线性分类问题,如果用多元线性回归进行分类,需要构造许多高次项,导致特征特多学习参数过多,从而复杂度太高。神经网络(Neural Network)一个简单的神经网络如下图所示,每一个圆圈表示一个神经元,每个神经元接收上一层神经元的输出作为其输入,同时其输出信号到下一层...
分类:
Web程序 时间:
2015-12-24 00:26:50
阅读次数:
303