码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据处理 数据挖掘 数据可视化    ( 8390个结果
几款开源的中文分词系统
中文分词是做好中文内容检索、文本分析的基础,主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位,而词与词之间并不像英语一样有空格来分隔,因而中文分词的难点在于如何准确而又快速地进行分词以下介绍4款开源中文分词系统。1、ICTCLAS – 全球最受欢迎的汉语分词系统 中文词法分析是中文信息处理...
分类:其他好文   时间:2014-06-26 22:35:29    阅读次数:298
【机器学习算法-python实现】决策树-Decision tree(1) 信息熵划分数据集
(转载请注明出处:http://blog.csdn.net/buptgshengod)1.背景 决策书算法是一种逼近离散数值的分类算法,思路比較简单,并且准确率较高。国际权威的学术组织,数据挖掘国际会议ICDM (the IEEE International Conference on Da...
分类:编程语言   时间:2014-06-26 22:33:33    阅读次数:410
GROUP BY
1语句简介编辑GroupBy语句从英文的字面意义上理解就是“根据(by)一定的规则进行分组(Group)”。它的作用是通过一定的规则将一个数据集划分成若干个小的区域,然后针对若干个小区域进行数据处理。2. Group By 的使用:上面已经给出了对Group By语句的理解。基于这个理解和SQL S...
分类:其他好文   时间:2014-06-26 17:00:02    阅读次数:186
hadoop1-构建电影推荐系统
问题导读:1. 推荐系统概述;2. 推荐系统指标设计;3. Hadoop并行算法;4. 推荐系统架构;5. MapReduce程序实现。前言Netflix电影推荐的百万美金比赛,把“推荐”变成了时下最热门的数据挖掘算法之一。也正是由于Netflix的比赛,让企业界和学科界有了更深层次的技术碰撞。引发...
分类:其他好文   时间:2014-06-25 09:46:57    阅读次数:329
金蝶KIS标准版与金蝶K3的区别
一、数据库 金蝶KIS标准版使用MS Access数据库,该数据库适用于小规模的数据处理,是比较经济的数据库解决方案,但当单个表的数据记录超过5万条时,运行的速度和稳定性都将受到一定程序的影响。 K3系统使用大型数据库MS SQL Server,该数据库为大型数据库,是当今主流的数据库平台之一,能提供高性能数据存储能力,数据量的大小仅仅受物理磁盘容量大小的限制,并且数据库的性能也不会因为数据量的增大而受到影响。 反应到客户具体的应用当中,也就意味着金蝶KIS标准版软件必须进行年结的操作,否则会造成软件...
分类:其他好文   时间:2014-06-24 19:54:24    阅读次数:160
VME总线
简介 诞生于25年前的VME(VersaModule Eurocard)总线是一种通用的计算机总线,结合了Motorola公司Versa总线的电气标准和在欧洲建立的Eurocard标准的机械形状因子,是一种开放式架构。它定义了一个在紧密耦合(closely coupled)硬件构架中可进行互连数据处理、数据存储和连接外围控制器件的系统。经过多年的改造升级,VME系统已经发展的非常完善,围绕其开发...
分类:其他好文   时间:2014-06-24 18:19:16    阅读次数:550
用分区表分区交换做历史数据迁移
一。说明: OLTP中有些表数据量大,而且会对历史数据进行迁移至OLAP中做数据挖掘。对这种历史数据迁移的操作,较好的办法是该表采用分区表。比如按时间分区后,可以对分区进行迁移。 通过分区交换和表空间传输会很容易完成,而且性能上影响很小。 关于分区表更多内容:http://blog.csdn.net/tanqingru/article/category/1397435 关于表空间传...
分类:其他好文   时间:2014-06-24 17:21:12    阅读次数:260
将Html文档整理为规范XML文档
有多种方式可以在.NET 平台进行HTML文件解析、数据提取,其中最简单、稳妥的办法是先使用工具将Html文档整理成XML文档,再通过XML Dom模型或XPath灵活地进行数据处理。SGML便是一个Html文档整理工具类库:Microsoft的XML大师Chris Lovett专门开发了一个SGM...
分类:Web程序   时间:2014-06-24 12:20:38    阅读次数:163
基于HTML5的开源图标库-ECharts
ECharts: 来自百度商业前端数据可视化团队,基于html5 Canvas,纯Javascript图表库,底层依赖ZRender,商业产品常用图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表。创新的拖拽重计算、数据视图、值域漫游等特性大大增强了用户体验,赋予了用户对数据进行挖掘、整合的能力。图表类型支持折线图(区域图)、柱状图(条状图)、散点图(气泡图)、K线图、饼图(环形图)、...
分类:Web程序   时间:2014-06-21 18:51:23    阅读次数:440
数据挖掘系列(9)——BP神经网络算法与实践
主要讲述反向传输神经网络(BP)算法的基本流程和自己在训练BP神经网络的一些经验。
分类:其他好文   时间:2014-06-21 17:51:47    阅读次数:252
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!