os.path模块主要用于获取文件的属性,这里对该模块中一些常用的函数做些记录。 os.abspath(path):获取文件的绝对路径。这里path指的是路径,例如我这里输入“data.csv” [In] os.path.abspath('data.csv') [Out] 'E:\\kaggle\\ ...
分类:
编程语言 时间:
2019-05-18 17:07:33
阅读次数:
131
内容简介 本书面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读者熟悉并且掌握当下最流行的机器学习、数据挖掘与自然语言处理工具,如Scikitlearn、NLTK、Pandas、gensim、XGBo ...
分类:
编程语言 时间:
2019-05-14 09:29:45
阅读次数:
160
1.引言 最近也学习了好几个月的机器学习,感觉知识也只停留在理论方面,但是大佬也说过实战很重要!!所以自己看了几篇Kaggle的文章。刚好前几天加入了一个打卡群,这是第一次发布的数据挖掘任务,在这里记录一下。 任务1 - 数据分析(2天),任务1打卡链接提交截止日期为20190512晚上10点数据集 ...
分类:
其他好文 时间:
2019-05-12 13:38:44
阅读次数:
136
--数据来源kaggle比赛 本文仅就学习的机器学习算法进行简单的实践。 一、问题及数据导入 显然,目的肯定是根据现有的数据,来对房价进行预测了,本数据变量较多,这里不再一一叙述,官网下载的数据又对变量进行描述。 首先导入基本的库 接下来导入数据 简单的查看下数据 然后,我们先给出y_train的值 ...
分类:
其他好文 时间:
2019-05-09 22:09:25
阅读次数:
162
一、问题说明 共享单车在国内发展时间虽然不算长,但是在国外已经发展不算短了。单车共享系统是一种租赁自行车的方法,使用者租车及还车是通过各个站点网络自动完成,便利大家的生活,本数据来源于Kaggle比赛,本文的目的在于记录数据分析的学习历程。 数据变量说明: datatime 日期+时间 season ...
分类:
其他好文 时间:
2019-05-09 21:57:38
阅读次数:
563
1.题目 这道题目的地址在 "https://www.kaggle.com/c/titanic" ,题目要求大致是给出一部分泰坦尼克号乘船人员的信息与最后生还情况,利用这些数据,使用机器学习的算法,来分析预测另一部分人员最后是否生还。题目练习的要点是语言和数据分析的基础内容(比如python、num ...
分类:
其他好文 时间:
2019-05-05 21:59:41
阅读次数:
166
http://www.cnblogs.com/fiercex/p/7927804.html fiercex 路漫漫其修远兮,吾将上下而求索 fiercex 路漫漫其修远兮,吾将上下而求索 Gluon炼丹(Kaggle 120种狗分类,迁移学习加双模型融合) 这是在kaggle上的一个练习比赛,使用的 ...
分类:
其他好文 时间:
2019-05-05 11:41:15
阅读次数:
121
有几个要注意的地方: 1、可以选择CPU或GPU,但是机器学习模型一般的CPU就够了,最近(2019.04)使用GPU的话一小时后总是会断开连接,这时候要跑久一点的cell就凉了。 2、导入文件:支持自行导入,如果是kaggle上的数据也可以直接从官方比赛数据中选择,导入到右侧的workspace中 ...
分类:
其他好文 时间:
2019-04-30 23:39:41
阅读次数:
1026
Python图像处理库 - Albumentations,可用于深度学习中网络训练时的图片数据增强. Albumentations 图像数据增强库特点: 基于高度优化的 OpenCV 库实现图像快速数据增强. 针对不同图像任务,如分割,检测等,超级简单的 API 接口. 易于个性化定制. 易于添加到 ...
分类:
编程语言 时间:
2019-04-29 17:36:18
阅读次数:
2020
8000多人的Kaggle比赛,寻找magic的比赛,Santander Customer Transaction Prediction前3名算法解读。 ...
分类:
其他好文 时间:
2019-04-13 22:06:32
阅读次数:
204