一、说明 给定训练集train.csv,要求根据前9个小时的空气监测情况预测第10个小时的PM2.5含量。 训练集介绍: (1)、CSV文件,包含台湾丰原地区240天的气象观测资料(取每个月前20天的数据做训练集,12月X20天=240天,每月后10天数据用于测试,对学生不可见); (2)、每天的监 ...
分类:
其他好文 时间:
2020-05-01 18:27:28
阅读次数:
66
机器学习基础:SVM算法总结 CONTENTS "1. 函数间隔与几何间隔" "2. 支持向量" "3. 目标函数与优化" "4. 线性可分SVM算法过程" "5. sklearn SVM算法使用总结" 1. 函数间隔与几何间隔 在分离超平面固定为$w^Tx+b=0$的时候,$|w^Tx+b|$表示 ...
分类:
编程语言 时间:
2020-05-01 17:07:29
阅读次数:
80
一、描述出其本身的含义: 1、特征选择 特征选择对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: (1)减少特征数量、降维,使模型泛化能力更强,减少过拟合 (2)增强对 ...
分类:
其他好文 时间:
2020-05-01 13:01:36
阅读次数:
254
到现在为止,我们已经学习了几种不同的学习算法,包括线性回归和逻辑回归,它们能够有效地解决许多问题,但是当将它们应用到某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。 一:过度拟合问题 (一)线性回归中的过拟合问题 继续使用线性回归来预测房价的例子,我 ...
分类:
其他好文 时间:
2020-05-01 12:51:33
阅读次数:
86
今天聊得是自动化测试与测试用例的编写,首先来聊一聊框架(Framework)。框架是工程学上一个非常重要的概念。在计算机和软件工程领域,我们可以轻松列举出一些耳熟能详的框架。例如,Windows软件开发框架.NET,Web开发框架ReactJS、AngularJS、PythonDjango、RubyonRails,机器学习框架TensorFlow、Caffe,等。 那么,什么是一般意义上的框架呢
分类:
其他好文 时间:
2020-05-01 10:54:56
阅读次数:
49
1.简介 gbdt全称梯度提升决策树,在传统机器学习算法里面是对真实分布拟合的最好的几种算法之一,在前几年深度学习还没有大行其道之前,gbdt在各种竞赛是大放异彩。原因大概有几个,一是效果确实挺不错。二是即可以用于分类也可以用于回归。三是可以筛选特征。这三点实在是太吸引人了,导致在面试的时候大家也非 ...
分类:
编程语言 时间:
2020-05-01 00:57:50
阅读次数:
67
机器学习中的范数规则化之(一)L0、L1与L2范数 zouxy09@qq.com http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问题。这里因为篇 ...
分类:
其他好文 时间:
2020-05-01 00:55:07
阅读次数:
60
基本流程 决策树是通过分次判断样本属性来进行划分样本类别的机器学习模型。每个树的结点选择一个最优属性来进行样本的分流,最终将样本类别划分出来。 决策树的关键就是分流时最优属性$a$的选择。使用所谓信息增益$Gain(D,a)$来判别不同属性的划分性能,即划分前样本类别的信息熵,减去划分后样本类别的平 ...
分类:
其他好文 时间:
2020-04-30 21:26:13
阅读次数:
64
机器学习支持向量机一章都会提到$\max{\frac{1}{||\omega||}}$与$\min{\frac{1}{2}||\omega||^2}$是等价的 原因在于: 假如有一个函数$f(\omega),\omega 0$ 若是想要求$\max{f(\omega)}$,显然当$\omega$越小 ...
分类:
其他好文 时间:
2020-04-30 19:24:56
阅读次数:
80
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 还没看到要求前我改了下数据试了试,以 ...
分类:
其他好文 时间:
2020-04-29 18:58:24
阅读次数:
70