交叉验证之前的知识:我们如何评估一个模型 当我们想要测试我们的模型效果怎么样的时候,最好的方法是在实际的样本当中进行测试,这样可以测试出模型的泛化误差,但是实际的样本是没有标签的,所以这是一个悖论,我们无法知道样本的泛化误差。 假如我们在我们训练模型的数据上面直接进行测试的话,结果会很好,会出现过拟 ...
分类:
其他好文 时间:
2018-03-13 14:01:11
阅读次数:
5946
集成学习背后的思想是将不同的分类器进行组合得到一个元分类器,这个元分类器相对于单个分类器拥有更好的泛化性能。比如,假设我们从10位专家那里分别得到了对于某个事件的预测结果,集成学习能够对这10个预测结果进行组合,得到一个更准确的预测结果。 后面我们会学到,有不同的方法来创建集成模型,这一节我们先解... ...
分类:
编程语言 时间:
2018-03-12 13:30:31
阅读次数:
223
先开个标题,以后慢慢填充。 k近邻算法(knn)属于监督学习 一、 三个关键点:1、k的取值,当k值较小时,选取点较少,相当于会有在较小的范围内进行学习预测,学习误差会减小,但是估计误差会增大,因为训练样本中存在噪声,选取过小的区域,噪声干扰的权重会较大,因为影响泛化能力,k减小意味整体模型复杂,容 ...
分类:
其他好文 时间:
2018-03-09 11:13:38
阅读次数:
161
作者 Hongyi Zhang 张宏毅 @ 张宏毅知乎 北大->MIT 论文所属FAIR Abstract 深度神经网络有些不好的行为:强记忆和对对抗样本敏感 Christian Szegedy等人在ICLR2014发表的论文中,他们提出了对抗样本(Adversarial examples)的概念, ...
分类:
其他好文 时间:
2018-03-08 02:55:23
阅读次数:
756
什么是UML? UML全称是: Unified Modeling Language 又称统一建模语言或标准建模语言。 是一个支持模型化和软件系统开发的图形化语言,为软件开发的所有阶段提供模型化和可视化支持,包括由需求分析到规格,到构造和配置。 它是一种语言,语言就是用来描述一件事物的。 为什么我们要 ...
分类:
编程语言 时间:
2018-03-07 20:14:37
阅读次数:
167
泛型之前 在面向对象编程语言中,多态算是一种泛化机制。例如,你可以将方法的参数类型设置为基类,那么该方法就可以接受从这个基类中导出的任何类作为参数,这样的方法将会更具有通用性。此外,如果将方法参数声明为接口,将会更加灵活。 在Java增加泛型类型之前,通用程序的设计就是利用继承实现的,例如,Arra ...
分类:
编程语言 时间:
2018-03-05 12:53:18
阅读次数:
210
一种可行的算法: 由于属性泛化后,一个泛化的假设可以对应多个具体假设。 把所有假设按三属性泛化,二属性泛化,一属性泛化,具体属性排序(这样可以保证排在后面的假设不会包含前面的任何一个假设,所以省略了一些包含判断),进行循环枚举,按顺序遍历所有假设组合248种可能(当然绝大部分都提前结束了,不会是那么 ...
分类:
其他好文 时间:
2018-03-04 15:59:51
阅读次数:
180
作者:JSong,时间:2017.10.21 本文大量引用了 jasonfreak ( http://www.cnblogs.com/jasonfreak ) 的系列文章,在此进行注明和感谢. 广义的偏差(bias)描述的是预测值和真实值之间的差异,方差(variance)描述距的是预测值作为随机变 ...
分类:
其他好文 时间:
2018-03-04 15:59:14
阅读次数:
218
在UML类图中,常见的有以下几种关系: 泛化(Generalization), 实现(Realization),关联(Association),聚合(Aggregation),组合(Composition),依赖(Dependency)。 UML中类图实例 接口:空心圆+直线(唐老鸭类实现了‘讲人话 ...
分类:
其他好文 时间:
2018-03-03 18:22:21
阅读次数:
148
1 软件工程师的成长 积累软件开发相关的知识,提升技术技能 积累问题领域的知识和经验 对通用的软件设计思想和软件工程思想的理解 提升职业技能 实际成果 2 软件工程师的思维思维误区 分析麻痹 不分主次,想解决所有依赖问题 过早优化 过早扩大化/泛化:画扇面——调侃目标和远景 3 技能的反面 通过不断 ...
分类:
其他好文 时间:
2018-03-03 15:36:56
阅读次数:
173