我写这篇文章的目的,是为参加数据科学社区Kaggle简单指引。 大多数初学者无从下手,因为他们使用自己不理解的库和算法,就像陷入黑盒。 本教程将通过提供一个框架来教您如何像数据科学家一样思考与编码,从而为您提供数据分析的领域优势。 目录: 一 、引言:数据科学家如何打败赔率 二 、 数据科学框架综述 ...
分类:
其他好文 时间:
2018-11-01 17:00:05
阅读次数:
376
一、Python 数据框就是典型的关系型数据库的数据存储形式,每一行是一条记录,每一列是一个属性,最终构成表格的形式,这是数据科学家必须熟悉的最典型的数据结构。 1.构建数据框 2.读取csv文件 3.统计描述 二、R语言 R语言中自带data.frame数据框格式,tidyverse包中所使用的t ...
分类:
编程语言 时间:
2018-11-01 12:03:37
阅读次数:
222
下载:https://pan.baidu.com/s/1xk-b3Y5-EYRvoheah-6kyQ 书籍PDF共计417页,配套源代码。国人所写的经典书籍。本书一切从实际应用出发,以R语言为核心工具,介绍了各类分析方法的实现及其在各领域的应用情况。 ...
分类:
编程语言 时间:
2018-10-31 20:20:11
阅读次数:
388
下载:https://pan.baidu.com/s/1j-WXpxMUyVRh--bAXqec7Q 《R数据科学》高清中文版PDF+高清英文版PDF+源代码 高清中文版PDF,374页,带目录和书签;高清英文版PDF,520页,带目录和书签;中英文两版可以对比学习。 配套源代码; 经典书籍,讲解详 ...
分类:
其他好文 时间:
2018-10-31 20:16:16
阅读次数:
166
Anaconda Distribution是执行Python数据科学和机器学习最简单的方法。 它包括250多种流行的数据科学软件包,以及适用于Windows,Linux和MacOS的 conda 软件包和虚拟环境管理器。 Conda使安装,运行和升级复杂的数据科学和机器学习环境(如Scikit le ...
分类:
其他好文 时间:
2018-10-31 15:46:10
阅读次数:
198
一、简介 pymysql是Python中专门用来操控MySQL数据库的模块,通过pymysql,可以编写简短的脚本来方便快捷地操控MySQL数据库,本文就将针对pymysql的基本功能进行介绍; 二、操控数据库 2.1 连接数据库 利用pymysql.connect(host,user,passwo ...
分类:
数据库 时间:
2018-10-26 19:41:51
阅读次数:
207
下载:https://pan.baidu.com/s/1j-WXpxMUyVRh--bAXqec7Q 《R数据科学》高清中文版PDF+高清英文版PDF+源代码 高清中文版PDF,374页,带目录和书签;高清英文版PDF,520页,带目录和书签;中英文两版可以对比学习。 配套源代码; 经典书籍,讲解详 ...
分类:
其他好文 时间:
2018-10-25 18:04:30
阅读次数:
1886
https://www.jianshu.com/p/260fd0f9ada6
分类:
其他好文 时间:
2018-10-24 17:45:28
阅读次数:
98
Python数据科学-技术详解与商业实践(八大案例)网盘地址:https://pan.baidu.com/s/13QrR_5Er6LgWCWzSb7qOrQ提取码:s7vw备用地址(腾讯微云):https://share.weiyun.com/5y4F4rX密码:afinqx养成式数据科学家培养模式,针对入门难、头绪乱、进步缓慢、缺乏业界经验、面试恐惧等问题提供解决方案。第一讲:数据科学家的武器库
分类:
编程语言 时间:
2018-10-18 17:00:36
阅读次数:
229
AutoML 即通过自动化的机器学习实现人工智能模型的快速构建,它可以简化机器学习流程,方便更多人利用人工智能技术。近日,软件行业巨头 Salesforce 开源了其 AutoML 库 TransmogrifAI。Salesforce Einstein 数据科学高级总监 Shubha Nabar 在 ...
分类:
其他好文 时间:
2018-10-15 12:02:46
阅读次数:
103