转自 http://www.open-open.com/lib/view/open1328059700311.html UML类图的几种关系: 泛化(Generalization), 实现(Realization),关联(Association),聚合(Aggregation),组合(Composi ...
分类:
其他好文 时间:
2016-12-30 02:11:42
阅读次数:
163
作者:Edwin Jarvis 特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 减少特征数量、降维,使模型泛化能力更强,减少过拟合 增强对特征和特征值 ...
分类:
其他好文 时间:
2016-12-23 16:27:29
阅读次数:
1248
首先说交叉验证。交叉验证(Cross validation)是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力(generalize), 能够避免过拟合问题。交叉验证一般要尽量满足:1)训练集的比例要足够多,一般大于一半2)训练集和测试集要均匀抽样 交叉验证主要分成以下几类:1)Do ...
分类:
其他好文 时间:
2016-12-23 14:25:18
阅读次数:
220
(1)支持向量的基本形式 对于一个分类问题,如果用PLA算法,可能会有多种分类策略,如下图所示,很明显,第三个图是一个最佳的分类策略,因为在第三个图中,如果边界上的数据允许的测量误差可以更大一些。对未见示例的泛化性更强。这种方法就是支持向量机。 我们想要得到的是找到一条直线能够把样本数据正确的分开, ...
分类:
其他好文 时间:
2016-12-20 09:38:28
阅读次数:
213
在SVM第一节中我们有简单涉及到泛化误差这个概念。在SVM中,使得Margin最大的解即为使泛化误差最小。那么泛化误差到底是什么,为什么Margin最大时泛化误差就最小?下面我们来探究一下。 什么是泛化误差?Wiki给出这样一个描述:generalization error (also known ...
分类:
系统相关 时间:
2016-12-19 08:22:30
阅读次数:
170
暗时间 Dark Time 刘未鹏 短时间通览《暗时间》这本书,虽然深究,但也受益匪浅,这是本锻炼思维与培养分析问题与解决问题能力的好书,最重要的是书中罗列大量参考资料,这下不用愁找什么书来学了。坚持读书,写笔记,写博客,像作者说的那样,善于利用时间,善于思考,善于专注,加油!上面是我写的该书的基本 ...
分类:
其他好文 时间:
2016-12-15 07:35:21
阅读次数:
244
目录 一、CSS3概要 1.1、特点 1.2、效果演示 1.3、帮助文档与学习 二、选择器 1.1、基础的选择器 1.2、组合选择器 1.3、属性选择器 1.4、伪类 1.5、伪元素 三、特殊性(优先级) 3.2、计算特殊性值 四、刻度 4.1、绝对长度单位 4.2、文本相对长度单位 4.3、Web ...
分类:
Web程序 时间:
2016-12-09 16:36:41
阅读次数:
357
在UML类图中,常见的有以下几种关系: 泛化(Generalization), 实现(Realization),关联(Association),聚合(Aggregation),组合(Composition),依赖(Dependency) 1. 泛化(Generalization) 【泛化关系】:是一 ...
分类:
其他好文 时间:
2016-12-09 08:39:38
阅读次数:
157
一、间隔与支持向量 给定训练样本集D={(x1,y1),(x2,y2),...,(xm,ym)},yi∈{-1,+1},分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。在众多划分超平面之间,我们需要找出一个泛化能力最强的。直观上看,我们应该找位于两类训练样本 ...
分类:
其他好文 时间:
2016-12-09 08:22:25
阅读次数:
317
在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都会对数据图像进行数据增强, 数据增强,常用的方式,就是旋转图像,剪切图像,改变图像色差,扭曲图像特征,改变图像尺寸大小,增强图像噪音(一般使用高斯噪音,盐椒噪音)等. 但是需要注意,不要加入其他图像轮廓的噪 ...
分类:
其他好文 时间:
2016-12-01 03:12:10
阅读次数:
1152