1. 零均值化 / 中心化:对输入图片进行预处理,计算训练数据中所有图片的每个位置的均值,然后每张图片的元素减自己位置对应的均值。零均值化后的图片以(0,0)为中心,所有图片的对应位置的元素均值为0 PCA和白化: 2. 为什么要对数据零均值化? 为了在反向传播中加快网络中每一层权重参数的收敛(这是 ...
分类:
其他好文 时间:
2020-01-31 10:45:16
阅读次数:
171
在上一篇中,我们发现knn和线性回归一样,表现的不是特别好,来看看时间序列的表现 时间序列预测法其实是一种回归预测方法,属于定量预测,其基本原理是;一方面承认事物发展的延续性,运用过去时间序列的数据进行统计分析,推测出事物的发展趋势;另一方面充分考虑到偶然因素影响而产生的随机性,为了消除随机波动的影 ...
分类:
其他好文 时间:
2020-01-24 15:59:40
阅读次数:
176
在上一篇中,我们学习了线性回归,这一次来看看k近邻的表现 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属 ...
分类:
其他好文 时间:
2020-01-24 15:48:29
阅读次数:
82
1. how to construct a KNN graph? 常见的方法一般有三类: i. space-partitioning trees; ii. locality sensitive hashing; iii. neighbour exploring techniques. Referen ...
分类:
其他好文 时间:
2020-01-22 19:59:12
阅读次数:
132
引言 这段时间来,看了西瓜书、蓝皮书,各种机器学习算法都有所了解,但在实践方面却缺乏相应的锻炼。于是我决定通过Kaggle这个平台来提升一下自己的应用能力,培养自己的数据分析能力。 我个人的计划是先从简单的数据集入手如手写数字识别、泰坦尼克号、房价预测,这些目前已经有丰富且成熟的方案可以参考,之后关 ...
分类:
其他好文 时间:
2020-01-21 16:00:38
阅读次数:
106
KNN分类算法:一个样本i与距离样本i最近的k个样本归属于同一类,如果k个样本属于不同的分类,则样本i属于k个中大多数样本所属的那一类 ①距离的定义:分为两种 第一种距离 L1:曼哈顿距离 第二种距离 L2:欧氏距离 ②K:k=1时,退化为最邻近算法;应存在一个k使得算法整体最优 ③算法过程: st ...
分类:
编程语言 时间:
2020-01-20 23:09:34
阅读次数:
153
任务流程: 1.读取图片文件 2.用knn识别图片文件并用k折交叉验证调参 3.用PCA对文件降维,用knn识别文件 4.抽取图片特征然后交给knn训练 一、文件的读取、可视化、以及采样 数据的初始化及其读取: from load_data import load_CIFAR10 import nu ...
分类:
其他好文 时间:
2020-01-19 00:03:13
阅读次数:
108
项目中用FeignClient上传文件时,发现大小无法大于1M,代码如下: 当文件>1M时,被调用的uploadFile方法的requestMap就变成空了,原因不明。 于是换了种写法: 问题没了 ...
分类:
编程语言 时间:
2020-01-17 21:01:45
阅读次数:
210
一、封装性 1、为什么要使用封装性? 创建对象以后,可以通过对象.属性名的方法进行赋值。只能限制数据的类型,和数值的范围。但是往往我们需要更多的其它条件的限制。在属性的声明处无法限制。所以我们采用如下的方式。 使用权限修饰符对属性进行修饰,在其它的类中就无法直接对属性进行调用和赋值。 提供公共的方法 ...
分类:
编程语言 时间:
2020-01-17 10:09:09
阅读次数:
77
解决分类问题 天然可以解决多分类问题 思想简单,效果强大 使用k近邻算法解决回归问题 KNeighborsRegressor 缺点2:高度数据相关 缺点3:预测的结果不具有可解释性 缺点4:维数灾难 随着维度的增加,‘看似相近’的的两个点之间的距离越来越大 解决方法:降维(PCA) ...
分类:
编程语言 时间:
2020-01-15 21:25:12
阅读次数:
73