算法介绍
KD树的全称为k-Dimension Tree的简称,是一种分割K维空间的数据结构,主要应用于关键信息的搜索。为什么说是K维的呢,因为这时候的空间不仅仅是2维度的,他可能是3维,4维度的或者是更多。我们举个例子,如果是二维的空间,对于其中的空间进行分割的就是一条条的分割线,比如说下面这个样子。
如果是3维的呢,那么分割的媒介就是一个平面了,下面是3维空间的分割
这就...
分类:
其他好文 时间:
2015-04-11 09:01:02
阅读次数:
4534
顶尖数据挖掘教学案例库(又称10个精选数据挖掘案例及实践演练,TipDM-C10,简称C10)是泰迪科技在数据挖掘领域探索10余年和高校资深讲师联合经验总结之作,内容涵盖电信、电力、制造、互联网、银行、水产、税务等诸多行业,特别适合有数据挖掘相关课程教学的高校、研究所和培训机构,也可作为个人学习数据...
分类:
其他好文 时间:
2015-04-10 11:08:50
阅读次数:
472
顶尖数据挖掘辅助教学套件(TipDM-T6,简称T6)主要包含以下内容: ? 数据挖掘辅助教学建模软件 ? 数据挖掘辅助教学多媒体软件 ? 数据挖掘辅助教学PPT ? 数据挖掘辅助教学实训教程 ? 数据挖掘辅助教学案例库 ? 云服务器(可选)
分类:
其他好文 时间:
2015-04-10 11:05:11
阅读次数:
254
课程目标:深入了解第三届泰迪杯大学生数据挖掘竞赛试题的出题背景、项目需求及解题思路。 课程特色:出题者在线答疑,以类似项目案例分析试题 适用人群:所有数据挖掘竞赛参赛人员及指导老师 优惠方式:免费 课程详情:深入了解第三届泰迪杯大学生数据挖掘竞赛试题(基于电商平台家电设备的消费者需求及产品数据挖掘分...
分类:
其他好文 时间:
2015-04-10 11:00:42
阅读次数:
1518
1. 大数据挖掘实战平台建设是培养云计算与大数据时代新型数据分析人才的需要。 2. 大数据挖掘实战平台建设能有力促进及推动学校及各学院科研水平,为大数据的分析及挖掘提供基础平台。 3. 该工程与实战中心的建立能使学校走在全省高校,乃至全国高校前列,能为其余高校建立同类大数据挖掘实战平台提供示范经验,...
分类:
其他好文 时间:
2015-04-10 10:58:38
阅读次数:
230
随着企业信息化的推进和应用水平的不断提高,企业中积累的数据规模越来越庞大。如何有效地利用历史数据,挖掘出价值的分析信息,从而帮助企业能够对未来变化作出及时正确的决策,最终在激烈的市场竞争中占据主动,已经成为当前企业越来越迫切想要解决的问题。顶尖数据挖掘开发平台(TipDM-D2,称简D2)数据挖掘开...
分类:
其他好文 时间:
2015-04-10 10:51:15
阅读次数:
164
当我们使用mllib做分类,用到逻辑回归或线性支持向量机做分类时,可能会出现下面的错误:
15/04/09 21:27:25 ERROR DataValidators: Classification labels should be 0 or 1. Found 3000000 invalid labels
Exception in thread "main" org.apache.spark.S...
分类:
Web程序 时间:
2015-04-09 23:52:01
阅读次数:
262
报错信息 :
java.lang.IllegalArgumentException: GiniAggregator given label 2.0 but requires label
在用mllib做分类,当用到一些分类算法时,常常需要加入基尼系数。
程序代码:RandomForest.trainClassifier(validData,2,Map[In...
分类:
编程语言 时间:
2015-04-09 21:54:31
阅读次数:
203
复杂的数据类型 数据挖掘的其他方法 关于数据挖掘基础的观点: 可视和听觉数据挖掘 数据可视化 数据挖掘结构可视化 数据挖掘过程可视化 交互式可视数据挖掘 数据挖掘的应用
分类:
其他好文 时间:
2015-04-09 13:24:29
阅读次数:
135
1. RCurl设置代理
假设代理地址是10.10.10.10;端口是:8080.
设置代理地址如下:
curl
getURL("http://baidu.com",curl=curl)
2. 抓取网页中的表格
library(XML)
library(RCurl)
u ="http://en.wikipedia.org/wiki/List_of_countri...
分类:
编程语言 时间:
2015-04-09 08:59:16
阅读次数:
353