码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据处理 数据挖掘 数据可视化    ( 8390个结果
C#批量数据处理SqlBulkCopy
1.什么是SqlbulkCopy,解决的问题 在程序处理中经常会遇见大数据量的批量操作,比如我们要把一个文本格式的数据批量插入数据库。如果按照传统的逻辑只会将从文件中独处的数据轮询的方式一条一条的插入到目标数据库里面,这样反复连接打开数据库执行插入命令势必效率极其低下。所以很多程序在处理这样的插入操作的时候都是在半夜用户低风期处理,以免影响正常用户的使用。 .Net Framework...
分类:数据库   时间:2014-06-19 13:04:45    阅读次数:397
K-Means算法Demo
简介:本Demo是参照这个网站上的Demo自己用Java实现的。将Java打包为Jar,再将Jar转为exe,源代码及程序Demo下载请点我。K-Means算法简介 我尽量用通俗易懂但不规范的语言来描述K-Means算法。 K-eans算法是数据挖掘十大算法之一,是一种聚类算法,也是最简单的无监.....
分类:其他好文   时间:2014-06-18 10:16:14    阅读次数:373
数据仓库与数据挖掘的一些基本概念
下面内容摘自互联网并作了整理。名词:BI(Business Intelligence):商业智能,DW(Data Warehouse):数据仓库,详见正文Q1部分。OLTP(On-Line Transaction Processing):联机事务处理也称为面向交易的处理系统,其基本特征是顾客的原始数...
分类:其他好文   时间:2014-06-17 00:38:42    阅读次数:337
两种方法DatagridView轻松导入到Excel
众所周知,DatagridView控件来处理表各类数据真的是“简单、方便、疗效快”,因此备受广大民众喜爱。今天我们再来继续探讨一下有关它和Excel的“姊妹情深”。           几乎没有人不对Excel不了解,但要说熟悉和认识透彻恐怕我们还远远没有做到(这是题外之言),重点还是Excel的强大数据处理能力带给我们的便利,所以把DatagridView数据表变为老少皆宜的Excel表格就显...
分类:Windows程序   时间:2014-06-16 14:47:10    阅读次数:273
大型网站--负载均衡架构
大型网站--负载均衡架构摘自:http://www.cnblogs.com/and/p/3366400.html负载均衡(Load Balancing) 负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用...
分类:Web程序   时间:2014-06-16 09:56:20    阅读次数:268
java hashcode的Delphi实现
程序使用java做后台服务,数据处理时使用了java的hashcode,Delphi程序也需要生成这个hashcode,为了一致,所以要在Delphi下实现和Java一样的算法。下面即Delphi版的hashCode:function hashCode(val: string): Integer;v...
分类:编程语言   时间:2014-06-16 09:30:51    阅读次数:303
在Hadoop中重写FileInputFormat类以处理二进制格式存储的整数
近期開始使用MapReduce,发现网上大部分样例都是对文本数据进行处理的,也就是说在读取输入数据时直接使用默认的TextInputFormat进行处理就可以。对于文本数据处理,这个类还是能满足一部分应用场景。可是假设要处理以二进制形式结构化记录存储的文件时,这些类就不再适合了。本文以一个简单的应用...
分类:其他好文   时间:2014-06-16 06:14:38    阅读次数:297
大数据:未来的新石油?
从海量数据中“提纯”出有用的信息,这对网络架构和数据处理能力而言也是巨大的挑战。 如果你是《老友记》的粉丝,你一定不会忘记钱德勒。剧中,他总是不断地向人们解释自己的工作,似乎别人永远也搞不懂他所谓的“统计分析和数据修复专员”是做什么的? 这不能怪钱德勒,10年前,在《老友记》热播时,要向一个陌生人....
分类:其他好文   时间:2014-06-16 06:00:17    阅读次数:382
位置预测系列(二)
这篇论文主要是预测用户在基于位置的社交网络中的下一次签到地点,是ICDM'12年录用的一篇文章。 1.1 论文概要 在这篇文章中,作者首先将位置预测问题阐述为位置排名问题,即把用户所在城市内的所有签到场所作为候选集,然后根据一定的规则将候选集中的场所进行排名。排名的规则所追求的目标就是尽可能的将用户下一次签到地点排在最前面。。。。。 1.2 读后感 优点。。。 缺点。。。 1.3 总结 总之,作为一篇数据挖掘论文被ICDM录用还是够格的。以一种纯数据挖掘的角度(特征提取->模型训练->模型测试)来进行位置预...
分类:其他好文   时间:2014-06-15 18:45:29    阅读次数:203
FWTools空间数据互转工具命令集合
空间数据处理...
分类:其他好文   时间:2014-06-15 18:07:26    阅读次数:197
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!