大数据分析的几个新角色:数据科学家、数据分析师、数据(算法)工程师 数学科学家:(发明算法) 运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据应用服务的人才。 对享有的模型进行优化、改进,所以涉及到对具体算法的精通和理解,并不 ...
分类:
编程语言 时间:
2016-11-28 00:37:35
阅读次数:
245
分辨真假数据科学家的20个问题及回答 2016-11-14 大数据文摘 【导语】本文分为两个部分,第一部分是quora上很火的一篇问答--【20个分辨真假数据科学家的问题】中赞赏数最高的回答,第二部分则是KDnuggets阅读量非常高的一篇文章【KDnuggets编辑们针对这20个问题给出的回答】。 ...
分类:
其他好文 时间:
2016-11-24 14:21:46
阅读次数:
209
Kaggle大数据竞赛平台入门 大数据竞赛平台,国内主要是天池大数据竞赛和DataCastle,国外主要就是Kaggle.Kaggle是一个数据挖掘的竞赛平台,网站为:https://www.kaggle.com/.很多的机构,企业将问题,描述,期望发布在Kaggle上,以竞赛的方式向广大的数据科学 ...
分类:
其他好文 时间:
2016-11-14 14:36:08
阅读次数:
276
数据科学家们,他们想使用更复杂的数据类型实现更复杂的数据分析,了解如何设计?如何应用基础模型来评估内在倾向性或偏差。 业务分析师,他们更像是随性的用户,想要用数据来实现主动数据发现,或者实现现有信息和部分预测分析的可视化。企业经理,他们想要了解模型和结论。IT开发人员,他们为以上所有类用户提供支持。 ...
分类:
其他好文 时间:
2016-11-10 13:46:45
阅读次数:
249
31页PPT:基于Spark的移动大数据挖掘 31页PPT:基于Spark的移动大数据挖掘 数盟11.16 Data Science Meetup(DSM北京)分享:基于Spark的移动大数据挖掘分享嘉宾:张夏天(TalkingData首席数据科学家) @张夏天_机器学习 内容提要: Talking ...
分类:
移动开发 时间:
2016-11-06 07:49:45
阅读次数:
330
本文会持续将<数据科学实战手册(R+Python)>一书中的附带参考资料网址手打出来, 方便访问. 由于书中的参考资料网址太多, 这个文档将可能花费一段时间才能完成. 第一章 P7 Rstdio (http://www.rstdio.com/) 参考Gettinng Started with R文章 ...
分类:
编程语言 时间:
2016-10-18 22:36:54
阅读次数:
325
从书中读到数据科学家应具备:计算机科学,数学,统计学,机器学习,某一领域的专业知识,沟通和演讲的技巧,数据可视化等七项技能。统计学家和机器学习专家在处理问题的方式角度有所不同。统计学家认为模型中的参数必须在显示世界中有意义,而软件工程师主要关注如何将算法植入到产品中,他们不会关注模型参数的意义,只是 ...
分类:
其他好文 时间:
2016-10-18 17:58:38
阅读次数:
125
作者:Datartisan链接:https://zhuanlan.zhihu.com/p/22833471来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。每个数据科学家每天都要处理成吨的数据,而他们60%~70%的时间都在进行数据清洗和数据格式调整,将原始数据转变为可以 ...
分类:
其他好文 时间:
2016-10-16 16:18:44
阅读次数:
179
原文 http://dataunion.org/14072.html 主题 特征选择 scikit-learn 作者: Edwin Jarvis 特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法 ...
分类:
其他好文 时间:
2016-10-14 00:26:00
阅读次数:
304