最近在做kaggle比赛,xgboost调参是个大问题。耗时,耗力啊。一个参数调半个小时啊。 看得懂吧,每个参数逐步的,调整取值范围。 建议: 每次调一个参数。 每次一个参数,输入3个数,例如:默认参数是 1, 候选范围你可以选择 【0.1,1,10】,一定要差一个数量级,这样可以圈定范围。然后通过 ...
分类:
其他好文 时间:
2020-04-03 00:43:34
阅读次数:
59
数据来源:https://www.kaggle.com/wendykan/lending-club-loan-data 数据描述:LendingClub是一家美国P2P借贷公司,总部位于加利福尼亚州旧金山。这是第一个对等网络贷款人登记其产品为证券与证券交易委员会(SEC),并在二级市场上提供贷款交易 ...
分类:
其他好文 时间:
2020-04-02 11:54:38
阅读次数:
100
本文主要探索如何使用深度学习框架 MXNet 或 TensorFlow 实现线性回归模型?并且以 Kaggle 上数据集 USA_Housing 做线性回归任务来预测房价。 回归任务,scikit-learn 亦可以实现,具体操作可以查看 线性回归模型的原理与 scikit-learn 实现。 载入 ...
分类:
Web程序 时间:
2020-03-27 01:11:27
阅读次数:
249
import pandas as pd from sklearn.decomposition import PCA # 数据地址:https://www.kaggle.com/c/instacart-market-basket-analysis/data # 读取表 prior = pd.read_ ...
分类:
其他好文 时间:
2020-03-26 01:27:10
阅读次数:
116
主要涉及到的内容有:数据处理(对空白数据进行填充:Imputer)、自定义转换器、pipeline的编写以及采用SVC及RandomForestClassifier进行分类预测 采用的数据集来自Kaggle的坦克尼克号的预测(Titanic challenge ) 读取数据 import os TI ...
分类:
其他好文 时间:
2020-03-12 20:29:03
阅读次数:
106
从这里找的一个宝贝源码,可以大大缓解内存问题。https://www.kaggle.com/arjanso/reducing dataframe memory size by 65/code ...
分类:
其他好文 时间:
2020-03-06 23:40:50
阅读次数:
117
pytorch实战 猫狗大战Kaggle 迁移学习ResNet50模型微调 猫狗大战数据集 这是kaggle上一个非常经典的二分类图像数据集,训练集包括25000张猫和狗的图片及其标签,测试集则是12500张未标签图片,数据下载地址。不过这个网址比较远古,无法提交自己训练的答案,可以到新的(~~虽然 ...
分类:
Web程序 时间:
2020-03-05 01:18:20
阅读次数:
291
初尝过拟合 猫狗大战数据集 这是kaggle上一个非常经典的二分类图像数据集,训练集包括25000张猫和狗的图片及其标签,测试集则是12500张未标签图片,数据下载地址。不过这个网址比较远古,无法提交自己训练的答案,可以到新的(~~虽然也不新了~~)比赛链接提交 将训练数据按类别分开整理成如下结构 ...
分类:
其他好文 时间:
2020-03-02 01:01:39
阅读次数:
77
Kaggle上的狗品种识别(ImageNet Dogs) 在本节中,我们将解决Kaggle竞赛中的犬种识别挑战,比赛的网址是https://www.kaggle.com/c/dog breed identification 在这项比赛中,我们尝试确定120种不同的狗。该比赛中使用的数据集实际上是著名 ...
分类:
其他好文 时间:
2020-02-24 00:07:01
阅读次数:
123
介绍 对于金融机构的贷款业务来说,一个顾客的信用信息是极其重要的。因为只有了解客户的信用情况,才能决定是否通过客户的贷款申请。本次将会介绍如何根据用户的一些基本信息来判断顾客的信用或贷款偿还能力。 知识点 数据导入与预览 数据可视化 plotly 特征工程 预测模型的选择 贷款信用评估介绍 本次的内 ...
分类:
其他好文 时间:
2020-02-23 18:10:20
阅读次数:
68