码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据分析 数据挖掘    ( 7783个结果
MongoDB分片之数据分割方式
随着移动互联网的发展,大量的非结构化数据随之产生,不仅对数据库存储大数据提出了新的要求,同时对于查询数据和进行大数据分析也提出了苛刻的要求,这些显然是单服务器处理能力无法满足的,自然建立一个集群是不可避免的。集群的复杂性大家众所周知,而MongoDB的优势之一正式可以帮助我们解决这些问题。分片(sh...
分类:数据库   时间:2014-07-12 13:00:54    阅读次数:267
Weka 入门1
本人也是借鉴网上他人资料。主要介绍使用java调用Weka库。 首先介绍weka,Weka的全名是怀卡托智能分析环境,是基于开源环境的机器学习和数据挖掘软件。我们可以去weka官网下载最新的Weka软件,目前最新版本是3.7.9。默认安装会保存在C:\Program Files\Weka-3-...
分类:其他好文   时间:2014-07-11 23:13:24    阅读次数:269
Python 对新浪微博的元素 (Word, Screen Name)的词汇多样性分析
Python 对新浪微博的元素 (Word, Screen Name)的词汇多样性分析...
分类:编程语言   时间:2014-07-10 21:49:09    阅读次数:206
《数据挖掘:R语言实战》
《数据挖掘:R语言实战》基本信息作者: 黄文 王正林丛书名: 大数据时代的R语言出版社:电子工业出版社ISBN:9787121231223上架时间:2014-6-6出版日期:2014 年6月开本:16开页码:292版次:1-1所属分类:计算机 > 软件与程序设计 > 综合 > 高级程序语言设计更多关...
分类:其他好文   时间:2014-07-09 20:38:14    阅读次数:308
数据挖掘十大经典算法(9) 朴素贝叶斯分类器 Naive Bayes
贝叶斯分类器 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:其他好文   时间:2014-07-09 15:36:36    阅读次数:134
数据挖掘十大经典算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N...
分类:其他好文   时间:2014-07-09 00:04:28    阅读次数:235
Python 提取Twitter特定话题中转载tweet的用户
Python 提取Twitter特定话题中转载tweet的用户...
分类:编程语言   时间:2014-07-08 19:09:48    阅读次数:246
中国空气质量在线监测分析平台
中国空气质量在线监测分析平台是公益性质的软件平台,提供PM2.5及天气数据的实时查询和历史数据可视化分析,统计挖掘,目前收录了190个城市的PM2.5及天气信息数据,主要包括PM2.5实时查询、历史曲线查询、PM2.5时段统计分析、AQI历年数据分析、PM2.5中国城市排名、PM2.5中国城市分布图、PM2.5中国省份分布图、卫星云图查询、PM2.5城市比较、PM2.5统计排名、PM2.5与天气关联挖掘、PM2.5与经济关联挖掘等功能。...
分类:其他好文   时间:2014-07-08 18:30:23    阅读次数:944
Python 可视化Twitter中指定话题中Tweet的词汇频率
Python 可视化Twitter中指定话题中Tweet的词汇频率...
分类:编程语言   时间:2014-07-08 10:45:15    阅读次数:198
Python 提取新浪微博的博文中的元素(包含Text, Screen_name)
Python 提取新浪微博的博文中的元素(包含Text, Screen_name)...
分类:编程语言   时间:2014-07-08 10:44:37    阅读次数:281
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!