在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 在进入正题...
分类:
其他好文 时间:
2014-12-31 09:56:32
阅读次数:
194
继续上一课最后的问题,当数据是非线性可分的时候需要把数据转化到 Z 空间(线性可分)才可以利用 SVM ,因此需要知道 Z 空间是什么。这节课解决了不用知道具体的 Z 空间就可以利用 SVM 进行分类。
最后,该课程介绍了如何因对过拟化的问题。思想跟十一课介绍的相同,就是设置一个限制条件。...
分类:
其他好文 时间:
2014-12-31 01:08:36
阅读次数:
191
三种类型:不喜欢的-1,魅力一般的-2,极具魅力的-3。样本特征:每年获得的飞行常客里程数,玩视频游戏所耗时间百分比,每周消费的冰淇淋公升数。 1 from numpy import * 2 import matplotlib 3 import matplotlib.pyplot as plt 4 ...
分类:
Web程序 时间:
2014-12-30 21:55:44
阅读次数:
267
以下都是图片(由于在有道笔记本上做的编辑,所以复制拷贝之后发现有问题,所以用图片来做展示)
................中间省略一下输出..........................
分类:
其他好文 时间:
2014-12-30 17:07:09
阅读次数:
176
展示如何用R处理稀疏矩阵和利用GLMNET包...
分类:
Web程序 时间:
2014-12-30 17:05:41
阅读次数:
1054
k-近邻算法(kNN):测量不同特征值之间的距离方法进行分类。 kNN的工作原理:存在一个样本数据集合(训练样本集),并且样本集中每个数据都存在标签,输入没有标签的新数据后,将新数据的每个特征与样本集数据对应的特征进行比较,然后算法提取样本集中特征最相似数据的分类标签。一般来说,只选择样本数据...
分类:
其他好文 时间:
2014-12-30 16:48:27
阅读次数:
209
Classification And Regression Tree(CART)是一种很重要的机器学习算法,既可以用于创建分类树(Classification Tree),也可以用于创建回归树(Regression Tree),本文介绍了CART用于离散标签分类决策和连续特征回归时的原理。决策树创建过程分析了信息混乱度度量Gini指数、连续和离散特征的特殊处理、连续和离散特征共存时函数的特殊处理和后剪枝;用于回归时则介绍了回归树和模型树的原理、适用场景和创建过程。个人认为,回归树和模型树可以被看做“群落分类...
分类:
编程语言 时间:
2014-12-30 13:40:48
阅读次数:
767
R语言:利用相关性分析对复杂数据进行数据探索...
分类:
编程语言 时间:
2014-12-30 13:38:13
阅读次数:
300
前言 本文将介绍机器学习分类算法中的Logistic回归分类算法并给出伪代码,Python代码实现。 (说明:从本文开始,将接触到最优化算法相关的学习。旨在将这些最优化的算法用于训练出一个非线性的函数,以用于分类。)算法原理 首先要提到的概念是回归。 对于回归这个概念,在以后的文章会有系...
分类:
编程语言 时间:
2014-12-30 13:29:14
阅读次数:
615