码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据处理 数据挖掘 数据可视化    ( 8390个结果
推荐系统中的相似度度量
相似度计算是数据挖掘,推荐引擎中的最基本问题,例如在推荐系统(Recommender Systems,简称RSs)中计算带推荐物品(Item)相似度,或是用户(User)之间的相似度以期获得兴趣口味(Taste)相似的用户时,均需要使用到相似度计算技术。经常使用的相似度计算方式较多,且各有特点, 以...
分类:其他好文   时间:2014-07-07 12:09:43    阅读次数:448
Spark部署及应用
在飞速发展的云计算大数据时代,Spark是继Hadoop之后,成为替代Hadoop的下一代云计算大数据核心技术,目前Spark已经构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL查询等方面都有自己的技术,并且是Apache顶级Project,可以预计的是2014年下半年.....
分类:其他好文   时间:2014-07-03 10:43:37    阅读次数:181
div遮罩弹框口
群组设置 点击这里打开窗口数据处理中,请稍等...CloseView Codea.html框架 View Codeb.html群组设置群组设置:小灵通号码查询b.html
分类:其他好文   时间:2014-07-03 10:16:18    阅读次数:251
瑞柏匡丞:数据科学可视化之要途
大数据的概念越来越多的被人们提及的今天,数据可视化也同样被提上了日程。
分类:其他好文   时间:2014-07-03 09:56:04    阅读次数:153
nmon
Nmon监测工具Nmon是一款面向系统管理员的调优和基准测量工具,可以用来显示关于下列方面的性能数据:处理器内存网络磁盘文件系统网络文件系统NFS)消耗资源最多的进程资源Power微分区我非常喜欢这款工具的一个地方是,它完全具有交互性,可以帮助Linux用户或系统管理员最大限度地利用这个必要的命令。...
分类:其他好文   时间:2014-07-02 22:59:21    阅读次数:308
jbpm与OA项目-oa概念
oa: * 控制商业流程按照指定的路线进行 * 在工作流程中,会产生很多数据,我们会对数据做进一步的分析,从而得出一些结论智能分析: 从大量的数据中经过滤过、分析,得出很有用的数据,供决策和参考--》产品经理数据挖掘: 更深层次的数据分析协同: 好几个部门在一起,共同完成一件事情的过程 整个过程是一...
分类:其他好文   时间:2014-07-02 14:36:02    阅读次数:158
Python 对Twitter tweet的元素 (Word, Screen Name, Hash Tag)的频率分析
Python 对Twitter tweet的元素 (Word, Screen Name, Hash Tag)的频率分析...
分类:编程语言   时间:2014-07-02 11:26:40    阅读次数:258
数据科学可视化之要途
大数据的概念越来越多的被人们提及的今天,数据可视化也同样被提上了日程。可视化已经成为了解数据的最佳方式(或唯一的方法),而且如果我们不可视化的话,我们就会落伍。人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来。随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,发...
分类:其他好文   时间:2014-07-02 10:28:47    阅读次数:146
Python 提取Twitter tweets中的元素(包含text, screen names, hashtags)
Python 提取Twitter tweets中的元素...
分类:编程语言   时间:2014-07-01 09:20:10    阅读次数:295
回顾一下著名的BigTable论文
GFS解决了某些业务场景对分布式文件系统需求,很自然的,也有某些业务仅仅靠文件系统用起来还是不那么方便,它们需要分布式数据库系统。BigTable就是Google为了解决内部对大规模结构化数据处理的需求而产生的。论文摘要涉及的“关键”字为: 1. 结构化数据 2. 数据量大 3. 典型应用:Web索引,Google Earth,Google Finance 4. 批处理和实时需求 5. ...
分类:其他好文   时间:2014-06-30 16:58:28    阅读次数:200
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!