http://www.tuicool.com/articles/umQfMzA 1.序言 今天来和大家探讨一下RocketMQ在消息存储方面所作出的努力,在介绍RocketMQ的存储模型之前,可以先探讨一下MQ的存储模型选择。 2.MQ的存储模型选择 个人看来,从MQ的类型来看,存储模型分两种: 需 ...
分类:
其他好文 时间:
2017-04-03 16:26:42
阅读次数:
239
回归分析即,量化因变量受自变量影响的大小,建立线性回归方程或者非线性回归方程,从而达对因变量的预测,或者对因变量的解释作用。 回归分析流程如下: ①探索性分析,画不同变量之间的散点图,进行相关性检验等,了解数据的大致情况,以及得知重点关注那几个变量; ②变量和模型选择,; ③回归分析假设条件验证; ...
分类:
其他好文 时间:
2017-02-26 23:25:01
阅读次数:
363
数据清洗 不可信样本丢弃 缺省值极多的字段考虑不用 数据采样 下/上采样 保证样本均衡 特征处理 数值型 类别型 时间型 文本型 统计型 组合特征 特征选择 过滤型 sklearn.feature_selection.SelectKBest 包裹型 sklearn.feature_selection ...
分类:
其他好文 时间:
2017-02-17 00:01:57
阅读次数:
456
继续上节内容介绍学习理论,介绍模型选择算法,大纲内容为: 交叉验证 特征选择 回顾上节的偏差方差权衡现象,若选择过于简单的模型,偏差过高,可能会导致欠拟合;若选择过于复杂的模型,方差过高,可能会导致过拟合,同样模型的一般适用性不好。 模型复杂度:多项式的次数或参数的个数。 (1)尝试选择多项式的次数 ...
分类:
其他好文 时间:
2017-01-12 22:29:19
阅读次数:
246
2.模型评估与选择
2.1经验误差和过拟合
不同学习算法及其不同参数产生的不同模型,涉及到模型选择的问题,关系到两个指标性,就是经验误差和过拟合。
1)经验误差
错误率(errorrate):分类错误...
分类:
其他好文 时间:
2017-01-10 12:08:35
阅读次数:
1458
ML中的一个重要任务是模型选择,或使用数据为给定任务找到最佳的模型或参数。 这也称为调优。 可以对诸如Logistic回归的单独Estimators进行调整,或者对包括多个算法,特征和其他步骤的整个Pipeline进行调整。 用户可以一次调整整个Pipeline,而不必单独调整Pipeline中的每 ...
分类:
其他好文 时间:
2016-12-22 11:10:49
阅读次数:
394
1、定义目标 调研业务目标 评析环境 确定挖掘目标 制定计划2、数据理解 收集原始数据 探索数据 检验数据质量3、数据准备 数据选取 抽取建模数据 数据预处理4、建立模型 选择建模技术 建立模型 评估和改进模型 模型评价5、部署实施 制定实施计划 模型实施 项目总结和评价 ...
分类:
其他好文 时间:
2016-12-12 19:47:43
阅读次数:
191
1.常见问题 1.1 什么是偏差与方差? 1.2 为什么会产生过拟合,有哪些方法可以预防或克服过拟合? 2.模型选择 3.特征选择 4.特征工程与数据预处理 ...
分类:
其他好文 时间:
2016-12-06 13:33:33
阅读次数:
675
摘要: 1.各种算法的推导 2.各种算法的比较(或优缺点) 3.经验风险最小化与结构风险最小化 4.特征选择方法 5.模型选择方法 6.特征工程 7.应用例子 内容: 1.各种算法的推导 2.各种算法的比较(或优缺点) http://blog.csdn.net/Bryan__/article/det ...
分类:
其他好文 时间:
2016-12-04 07:04:34
阅读次数:
128
一、新建概念数据模型 1)选择File-->New,弹出如图所示对话框,选择CDM模型(即概念数据模型)建立模型。 2)完成概念数据模型的创建。以下图示,对当前的工作空间进行简单介绍。(以后再更详细说明) 3) 选择新增的CDM模型,右击,在弹出的菜单中选择“Properties”属性项,弹出如图所 ...
分类:
其他好文 时间:
2016-12-02 14:03:32
阅读次数:
352