01 概述: 推荐一直是电商平台的重要流量入口。以往在电商平台上,推荐的场景更多的覆盖在交易的各个环节,比如详情页、购物车、订单及支付等。近年来推荐发展逐渐的多样化,场景上逐渐覆盖到各流量入口,推荐的实体也扩展到活动、类目、运营位等。 在电商网站里进行商品推荐,可以提高整个网站商品销售的有效转化率, ...
分类:
其他好文 时间:
2018-09-28 19:08:56
阅读次数:
165
1. blending 需要得到各个模型结果集的权重,然后再线性组合。 2.stacking stacking的核心:在训练集上进行预测,从而构建更高层的学习器。 stacking训练过程: 1) 拆解训练集。将训练数据随机且大致均匀的拆为m份。 2)在拆解后的训练集上训练模型,同时在测试集上预测。 ...
分类:
其他好文 时间:
2018-09-26 22:09:39
阅读次数:
909
Bootstrap Method:在统计学中,Bootstrap从原始数据中抽取子集,然后分别求取各个子集的统计特征,最终将统计特征合并。例如求取某国人民的平均身高,不可能测量每一个人的身高,但却可以在10个省市,分别招募1000个志愿者来测量并求均值,最终再求取各省市的平均值。 Bagging(B ...
分类:
其他好文 时间:
2018-08-29 21:20:22
阅读次数:
195
参考:百度PaddlePaddle公开课 概率 & 统计 Lary Wasserman《All of Statistics》 概率:给定数据生成过程,那么输出的性质是怎样 统计:给定输出结果,那么生成数据的过程是怎样 统计 vs 机器学习 Models Parameters Fitting, Est ...
分类:
其他好文 时间:
2018-08-18 18:35:42
阅读次数:
237
大神经验: 1、应用机器学习,千万不要一上来就试图做到完美,先撸一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合),分析我们使用的feature的作用大小,进行feature selection,以及我们模型下的bad ...
分类:
其他好文 时间:
2018-08-18 13:19:49
阅读次数:
612
王健, 孙志礼, 于震梁, 柴小冬 东北大学 机械工程与自动化学院, 辽宁 沈阳 110819 收稿日期: 2015-04-28 基金项目: 国家科技重大专项(2013ZX04011-011). 作者简介: 王健(1988-),男,辽宁锦州人,东北大学博士研究生;孙志礼(1957-),男,山东巨野人 ...
分类:
其他好文 时间:
2018-07-31 17:19:21
阅读次数:
201
#!/usr/bin/perlprint "TESTLIST File Name: @ARGV\n";my $testlist = $ARGV[0]; open(RD_FILE, "$testlist");@all_cases = <RD_FILE>; ##TODO add your command ...
分类:
其他好文 时间:
2018-06-20 21:24:25
阅读次数:
152
线性模型的fit其实一个进行学习的过程,根据数据和标签进行学习;predict则是基于fit之后形成的模型,来决定指定的数据对应于标签(y_train_5)的值。 下面的是手写字母判断是否为“5” sgd_clf = SGDClassifier(random_state=42) sgd_clf.fi ...
分类:
其他好文 时间:
2018-06-03 21:28:28
阅读次数:
1339
Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的 ...
分类:
编程语言 时间:
2018-05-30 22:50:22
阅读次数:
343
来源 数据库:http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjyjyfz201309002 术语深度学习(deep learning, DL)深度神经网络(deep neural networks, DNN)浅层学习 ...
分类:
其他好文 时间:
2018-05-19 18:25:39
阅读次数:
197