码迷,mamicode.com
首页 >  
搜索关键字:数据科学    ( 520个结果
数据科学家应该掌握的12种机器学习算法
算法已经成为我们日常生活的一个重要组成部分,它们几乎出现在商业的任何领域。调查公司 Gartner 称这种现象为「算法化商业」,算法化商业正在改变我们经营和管理公司(应有的)的方式。现在,你可以在「算法市场」上买到这些适用于各个商业领域的多种算法。算法市场为开发者提供了包括声音和视觉处理、机器学习以及计算机视觉等领域在内的超过800种算法,这些成熟的算法帮助开发者节省宝贵的时间与金钱。 然而...
分类:编程语言   时间:2016-05-13 04:21:15    阅读次数:153
NBA控卫聚类——K-Means详解
Dataset 在NBA的媒体报道,体育记者通常集中在少数几个球员。由于我们的数据科学的帽子,我们不禁感到一阵怀疑为什么这个球员与其他球员不一样。那么就使用数据科学进一步探索该这个问题。 本文的数据集nba_2013.csv是2013 - 2014赛季的NBA球员的表现。player – name of the player(名字) pos – the position of the playe...
分类:其他好文   时间:2016-04-29 17:44:15    阅读次数:1417
Spark-000讲:What is Spark ?
Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。目前正朝着数据科学的OS发展。 下面我们从以下三个方面,为大家彻底解密What is Spark? 1.Spark生态...
分类:其他好文   时间:2016-04-29 16:23:14    阅读次数:228
NBA控卫聚类——K-Means详解
Dataset 在NBA的媒体报道,体育记者通常集中在少数几个球员。由于我们的数据科学的帽子,我们不禁感到一阵怀疑为什么这个球员与其他球员不一样。那么就使用数据科学进一步探索该这个问题。 本文的数据集nba_2013.csv是2013 - 2014赛季的NBA球员的表现。player – name of the player(名字) pos – the position of the playe...
分类:其他好文   时间:2016-04-26 19:48:04    阅读次数:314
R、Python、Scala 和 Java,到底该使用哪一种大数据编程语言?
有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,我该迫使我的所有开发人员和数据科学家非要用哪种语言?)这个问题不会推迟太久,迟早要定夺。 ...
分类:编程语言   时间:2016-04-25 16:28:34    阅读次数:199
自学成才的数据科学家告诉你5个学习大数据的正确姿势!
对于数据科学来说,现在是发展的黄金时期。这是个新领域,但增长迅速,同时数据科学家的缺口也很大,据说他们的平均年薪可以达到10万美元。哪里有高薪,哪里就吸引人们,但是数据科学技能的差距意味着许多人需要努力学习。 第一步当然是询问“我怎么学习数据科学”,这个问题的答案往往是一长串的课程和书籍阅读,从线性 ...
分类:其他好文   时间:2016-04-23 23:04:39    阅读次数:358
如果你建造了一个精良的模型却没人用,你肯定不会得到赞誉(转)
注:本文编译自 How to do Data Science ,作者 Brandon Rohrer 为微软高级数据科学家。 《哈佛商业评论》曾宣称“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家对它又不甚了解。 如何做好数据科学呢? 微软高级数据科学家 Bran ...
分类:其他好文   时间:2016-04-23 22:57:05    阅读次数:254
数据科学中的R和Python: 30个免费数据资源网站
1 政府数据 Data.gov:这是美国政府收集的数据资源。声称有多达40万个数据集,包括了原始数据和地理空间格式数据。使用这些数据集需要注意的是:你要进行必要的清理工作,因为许多数据是字符型的或是有缺失值。 Socrata:它是探索政府相数据的另一个好地方。Socrata的一个了不起的地方是,他们 ...
分类:编程语言   时间:2016-04-22 07:03:05    阅读次数:680
优秀大数据GitHub项目一览
http://blog.csdn.net/yaoxtao/article/details/50540485 优秀大数据GitHub项目一览 VMware CEO Pat Gelsinger曾说: 数据科学是未来,大数据分析则是打开未来之门的钥匙 企业正在迅速用新技术武装自己以便从大数据项目中获益。各 ...
分类:其他好文   时间:2016-04-21 10:09:00    阅读次数:233
机器学习系列(9)_机器学习算法一览(附Python和R代码)
写这篇文章的目的,就是希望它可以让有志于从事数据科学和机器学习的诸位在学习算法的路上少走些路。我会在文章中举例一些机器学习的问题,你们也可以在思考解决这些问题的过程中得到启发。我也会写下对于各种机器学习算法的一些个人理解,并且提供R和Python的执行代码。读完这篇文章,读者们至少可以行动起来亲手试试写一个机器学习的程序。...
分类:编程语言   时间:2016-04-19 21:41:47    阅读次数:419
520条   上一页 1 ... 44 45 46 47 48 ... 52 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!