1 场景解析: a.数据探查(数据量的大小,数据缺失或乱码,ETL 操作,字段类型,是否含有目标队列) b.场景抽象(是通过已有的数据,挖掘出可以应用的业务场景。机器学习主要用来解决的场景包括二分类、多分类、聚类和回归) c.算法选择(是确定算法范围、多算法尝试和多视角分析寻找最适合自身业务的算法) ...
分类:
编程语言 时间:
2018-03-01 11:46:31
阅读次数:
184
好久不见,Hulu机器学习问题与解答系列又又又更新啦! 你可以点击菜单栏的“机器学习”,回顾本系列前几期的全部内容,并留言发表你的感悟与想法,说不定会在接下来的文章中看到你的感言噢~ 今天的主题是 【降维】 引言 宇宙,是时间和空间的总和。时间是一维的,而空间的维度,众说纷纭,至今没有定论。弦理论说 ...
分类:
编程语言 时间:
2018-02-27 21:13:54
阅读次数:
246
定义与结构 受限玻尔兹曼机(RBM)由Geoff Hinton发明,是一种用于降维、分类、回归、协同过滤、特征学习和主题建模的算法。(如需通过实例了解RBM等神经网络的应用方法,请参阅应用案例)。 我们首先介绍受限玻尔兹曼机这类神经网络,因为它相对简单且具有重要的历史意义。下文将以示意图和通俗的语言 ...
分类:
其他好文 时间:
2018-02-25 01:11:58
阅读次数:
192
1.PCA 使用场景:主成分分析是一种数据降维,可以将大量的相关变量转换成一组很少的不相关的变量,这些无关变量称为主成分 步骤: 案例:从USJudgeRatings数据集中有11个变量,如何去减化数据(单个主成分分析) 1.使用碎石图确定需要提取的主成分个数 结论:在特征值大于1的的点附近,都表明 ...
分类:
编程语言 时间:
2018-02-24 10:49:28
阅读次数:
308
当数据维数比较大时,就需要进行降维,特征选择是降维的一种主要方式,又包括3种方法:Filter、Wrapper和Enbedding。 1. Filter 过滤器方法,这种方法首先选定特征,再来进行学习。根据每一个属性的一些指标(如方差等),来确定这个属性的重要程度,然后对所有属性按照重要程度排序,从 ...
分类:
其他好文 时间:
2018-02-23 23:51:40
阅读次数:
224
Python在机器学习方面一个非常强力的模块---scikit-learn模块,它作为数据挖掘和数据分析方面的一个简单而有效的工具,主要包括6大功能:分类(Classification),回归(Regression),聚类(Clustering),降维(Dimensionality Reductio ...
分类:
编程语言 时间:
2018-02-20 14:44:16
阅读次数:
258
特征决定了最优效果的上限,算法与模型只是让效果更逼近这个上限,所以特征工程与选择什么样的特征很重要! 以下是一些特征筛选与降维技巧 # -*- coding:utf-8 -*- import scipy as sc import libsvm_file_process as data_process ...
分类:
其他好文 时间:
2018-02-12 20:13:37
阅读次数:
196
ng机器学习视频笔记(十二) ——PCA实现样本特征降维 (转载请附上本文链接——linhxx) 一、概述 所谓降维(dimensionality reduction),即降低样本的特征的数量,例如样本有10个特征值,要降维成5个特征值,即通过一些方法,把样本的10个特征值映射换算成5个特征值。 因 ...
分类:
其他好文 时间:
2018-02-04 12:50:49
阅读次数:
252
本文将介绍主成分分析(Principal Component Analysis,PCA)原理,并且它如何在分类问题中发挥降维的作用。译自 Feature extraction using PCA。 简介 本文将介绍主成分分析(Principal Component Analysis,PCA)原理,并 ...
分类:
其他好文 时间:
2018-01-31 22:15:19
阅读次数:
215
URAL 1513 思路: dp+高精度 状态:dp[i][j]表示长度为i末尾连续j个L的方案数 初始状态:dp[0][0]=1 状态转移:dp[i][j]=dp[i-1][j-1](0<=j<=k) dp[i][0]=∑dp[i-1][j](0<=j<=k) 目标状态:dp[n+1][0] 观察 ...
分类:
其他好文 时间:
2018-01-31 22:06:41
阅读次数:
125