哈哈 由于刚刚把工作辞了,然后想好好安静的玩一个月。然而现实是残酷的,时间过个还是好快,自己想的放松其实并没有放松 尤其是看书什么的,并不比上班的时候清闲啊,今天看了一天书,其实实际真正利用的时间还是很少的吧 看了关于怎么做笔记的,恩,用方格纸分析做笔记那本书。 然后还看了数据科学家养成,没问题吧。 ...
分类:
其他好文 时间:
2017-06-29 00:53:22
阅读次数:
147
原文链接 摘要: ◆ ◆ ◆ 菜鸟入门 1. Iris 数据集 在模式识别文献中,Iris 数据集恐怕是最通用也是最简单的数据集了。要学习分类技术,Iris 数据集绝对是最方便的途径。如果你之前从未接触过数据科学这一概念,从这里开始一定没错,因为该数据集只有 4 列 150 行。 ◆ ◆ ◆ 菜鸟入 ...
分类:
其他好文 时间:
2017-06-27 20:02:10
阅读次数:
143
原文链接 摘要: 想找一份数据科学家的工作?这是个正确的决定! 哈佛商业评论最近刊登了一篇由Thomas Davenport 和 D.J. Patil 共同撰写的文章,称数据科学家是二十一世纪最性感的工作。 但是你要怎么进入这个行业呢? 许多资源也许会让你以为,成为一个数据科学家需要全方面掌握一些领 ...
分类:
其他好文 时间:
2017-06-27 19:55:41
阅读次数:
186
一、大数据平台 大数据在工作中的应用有三种: 与业务相关,比如用户画像、风险控制等; 与决策相关,数据科学的领域,了解统计学、算法,这是数据科学家的范畴; 与工程相关,如何实施、如何实现、解决什么业务问题,这是数据工程师的工作。 与业务相关,比如用户画像、风险控制等; 与决策相关,数据科学的领域,了 ...
分类:
其他好文 时间:
2017-06-21 13:51:07
阅读次数:
172
一、Numpy简介: Python中用列表(list)保存一组值,可以用来当作数组使用,不过由于列表的元素可以是任何对象,因此列表中所保存的是对象的指针。这样为了保存一个简单的[1,2,3],需要有3个指针和三个整数对象。对于数值运算来说这种结构显然比较浪费内存和CPU计算时间。此外Python还提 ...
分类:
编程语言 时间:
2017-06-15 00:32:38
阅读次数:
268
从网上看到一篇总结的很不错的sklearn使用文档,备份勿忘。 引言 对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn ...
分类:
其他好文 时间:
2017-06-07 10:08:33
阅读次数:
191
本文中用到的所有demo我都已经发布到了Github,需要的同学可以自行下载: https://github.com/kingliantop/azurelabs/tree/master/RServerDemo Microsoft R客户端的安装 Microsoft R客户端是一个免费的用于数据科学分 ...
分类:
其他好文 时间:
2017-06-05 12:34:07
阅读次数:
269
1.安装anaconda2 安装好之后,本地python环境就采用anaconda自带的python2.7的环境。 2.安装py4j 在本地ctrl+r打开控制台后,直接使用pip安装py4j,因为anaconda默认是安装了pip的,当然也可以使用conda安装。 安装命令:pip install ...
分类:
系统相关 时间:
2017-06-02 13:28:36
阅读次数:
630
最近在写本科的毕业论文,题目是有关于MapReduce的并行化处理,老师给出修改意见中提到了关于分布式计算框架的的国内外研究现状,一开始并没有搞懂分布式计算机框架,以为是MapReduce。MapReduce只是一种并行编程模式,也可以是一种并行框架,并不是分布式计算框架。百度得知,比如Hadoop ...
分类:
其他好文 时间:
2017-05-28 12:26:10
阅读次数:
225
登录 | 注册 登录 | 注册 登录 | 注册 登录 | 注册 xufaxi的专栏 目录视图 摘要视图 订阅 【活动】2017 CSDN博客专栏评选 【评论送书】SQL优化、深度学习、数据科学家 CSDN日报20170527 ——《人机大战,历史的见证》 CSDN 日报 | 4.19-5.19 上榜 ...
分类:
其他好文 时间:
2017-05-27 19:06:25
阅读次数:
1008