码迷,mamicode.com
首页 >  
搜索关键字:数据科学    ( 520个结果
逃离乌托邦:数据科学就是个谎言
图源:unsplash有人认为,数据科学就是创建可用来预测的模型。这句话可以这样理解:我们有了数据,探测发展模式,把这些再应用于预测未来,获得结果。这个逻辑说得通,其背后的理论,我们称之为统计。整个历史长河中,有关预测的代名词先后涌现,比如数据挖掘、分析、商业智能、运筹学、新兴的数据科学。不过在这里我们没必要深究统计与数据科学之间是否能划等号,也大可不必对数据信息获取的无数流行词吹毛求疵。今天笔者
分类:其他好文   时间:2020-12-22 11:40:10    阅读次数:0
Python曾是程序员的“瑞士军刀”,而如今正被慢慢取代
图源:unsplash上世纪90年代初,Python面世了。近30年来,关于它的“炒作”一直没有少过。当然,编程界花了至少20年的时间才认识到它,但自那以后,它的流行程度远远超过了C、C#、Java甚至Javascript。尽管Python目前在数据科学和机器学习领域,以及某些程度上在科学和数学计算领域占据着主导地位,但与Julia,Swift和Java等新语言相比,它确实有其劣势。是什么让Pyt
分类:编程语言   时间:2020-12-21 11:52:59    阅读次数:0
认识网页抓取:一切都交给AI,还是加点“人情味”?
图源:unsplash“互联网上有很多数据”,这么说太保守了。事实上,2020年,“数字宇宙”预计将拥有40万亿字节或40泽字节(zettabytes)的信息,一个泽字节拥有的数据足以填满大约五分之一曼哈顿大小的数据中心。可供分析的信息如此之多,将收集数据的任务留给AI就显得合情合理了。网络机器人能以令人难以置信的速度抓取网页,提取所需的相关信息。不过,尽管许多数据科学家和营销人员以一种完全合乎伦
分类:Web程序   时间:2020-12-21 11:49:25    阅读次数:0
Anaconda和conda命令的安装和使用
Anaconda是一个开源的工具,目前拥有超过六百万的用户。Anaconda致力于提供最便捷的方式来使用Python进行数据科学计算和机器学习。目前,Anaconda拥有超过250+的数据科学工具包,conda工具包可用于Windows,MacOS和Linux三种平台的虚拟环境管理系统。Anaconda支持当前比较流行的一些人工智能的库,比如Sklearn,TensorFlow,Scipy。
分类:其他好文   时间:2020-12-18 12:18:28    阅读次数:3
初学 Python 需要安装哪些软件?
KDnuggets2018年的一个博客发起了一项投票:数据科学中最好用的Python IDE是什么?本次调查共有1900多人参与,调查结果如下图所示。前5个选择是:Jupyter,57%PyCharm,35%Spyder,27%Visual Studio Code,21%Sublime Text,1 ...
分类:编程语言   时间:2020-11-21 11:47:21    阅读次数:7
太强大了!一款可以像操作Excel一样玩Pandas的可视化神器来了!
Pandas这个库对Python来说太重要啦!因为它的出现,让Python进行数据分析如虎添翼,作为Python里面最最牛逼的库之一,它在数据处理和数据分析方面,拥有极大的优势,受到数据科学开发者的广大欢迎。 最近在逛GitHub的时候,发现了一款神器,一款神器分析Pandas DataFrames ...
分类:其他好文   时间:2020-11-08 16:45:05    阅读次数:22
创业过5家大数据公司,Kaggle竞赛冠军:互联网深度学习误区—花大力气在那些影响力很小的事情上
创业过5家大数据公司,Kaggle竞赛冠军:互联网深度学习误区—花大力气在那些影响力很小的事情上本文作者:GregoryPiatetsky,KDnuggets.我对有着“摇滚明星”美誉的数据科学家杰里米·霍华德进行了独家采访,他谈到了自己最新出品的深度学习网络课程,Kaggle因何获得行业领先地位,以及数据科学家的价值所在。杰里米·霍华德(@jeremyphoward),是数据科学领域的“摇滚明星
分类:其他好文   时间:2020-11-07 15:39:15    阅读次数:23
算法基础
算法基础 数据分析 数学基础 在进行算法建模时,深入了解数据情况,做各类探索性分析,统计建模等工作非常重要,这方面对一些数学基础知识有一定的要求,例如概率论,统计学等。这方面除了经典的数学教材,也可以参考更程序员向的《统计思维》,《贝叶斯方法》,《程序员的数学2》等书籍。 自我考核:理解实际项目中的 ...
分类:编程语言   时间:2020-10-10 17:55:27    阅读次数:24
初识Hadoop
大数据是指无法在一定时间范围内用常规软件工具进行处理和分析的数据集合,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能的海量、高增长率和多样性的信息资产
分类:其他好文   时间:2020-10-08 18:36:53    阅读次数:17
常规的可视化图见多了?那就来看看具有创造力的非主流库
前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 众所周知,JS 在交互以及视觉效果方面具有很强的优势。Python 是一种表达语言,并在数据科学领域备受喜爱。这两种技术优势的结合产生了 cutecharts。它的项目结构与 ...
分类:其他好文   时间:2020-10-07 21:28:50    阅读次数:26
520条   上一页 1 2 3 4 5 ... 52 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!