介绍在这篇文章中,我们将讨论所谓的“维数的诅咒”,并解释为什么在设计分类器时它是很重要的。以下各节我会提供这个概念直观的解释,并用一个由于维数灾难导致的过拟合例子图解说明。考虑这样一个例子,我们有一组图像,其中每个表示猫或狗。我们想创建一个分类器,它能够自动识别狗和猫。要做到这一点,我们首先需要考虑每个对象类的描述,该描述可以用数字来表示。这样的数学算法,即分类器,可以用这些数字来识别对象。例如,我...
分类:
其他好文 时间:
2015-05-21 22:45:53
阅读次数:
3540
尼古拉斯·达内:有很多定义方式。首先,代码是使机器运行的程序。如果没有代码,我们的电子设备包括电脑、手机就没有生命。代码是让我们最接近机器灵魂的方式,使机器能根据我们的需求而运作。它是一些通过算法来自动完成任务的句法。这是第一个定义。 但是代码也可以被定义为一种语言。因为它基于数学算法,我们过...
分类:
其他好文 时间:
2015-05-17 10:34:53
阅读次数:
123
数学之美之TF-IDF算法
By 白熊花田(http://blog.csdn.net/whiterbear) 转载需注明出处,谢谢。
吴军博士在《数学之美》一书中提到如何使用TF-IDF算法进行确定网页和查询的相关性判断。我在这里给出自己学习的笔记。
相关名称:
TF-IDF(term frequency–inversedocum...
分类:
编程语言 时间:
2015-05-08 20:23:36
阅读次数:
373
数据挖掘到底是什么呢?
显然数据挖掘不是变魔术,数据挖掘是 使用复杂的数学算法,使我们能够运用计算机强大的计算能力对大量细节数据进行筛查、梳理,找出一些有意义的信息,发现数据中的模式、相关性和聚类。同时它也让我们摆脱了手工进行这种数字运算的劳累工作。
而我们为什么又要去了解它呢?
关系数据库系统擅长记录日常的数据,积累了大量的数据。
而多维数据系统通过聚合对数据进行汇总,但由于...
分类:
数据库 时间:
2015-04-25 22:47:32
阅读次数:
180
分析:
f(x,y,a,b)+f(x,y,c,d)=sqrt(x^2+y^2+a^2+b^2-2*a*x-2*b*y)+sqrt(x^2+y^2+c^2+d^2-2*c*x-2*d*y)
=sqrt((x-a)^2+(y-b)^2)+sqrt((x-c)^2+(y-d)^2)也就是C点分别到A点B点的距离之和,因此要使最小,则C点应在AB线段上,所以最小值等于AB之间的距离。
#in...
分类:
其他好文 时间:
2015-04-22 20:50:22
阅读次数:
135
分析:数学公式推到:
1.tan(a+b) = ( tan(a) + tan(b) ) / (1 – tan(a) * tan(b) )
2.tan( atan(x) ) = x
根据公式1和2有:
arctan(1/s) = arctan(1/u)+arctan(1/v)
所以得1/s = tan( arctan(1/u)+arctan(1/v) ) = (tan(arctan(1/u...
分类:
其他好文 时间:
2015-04-22 18:09:15
阅读次数:
143
Grey Area
Time Limit: 2000ms
Memory Limit: 65536KB
64-bit integer IO format: %lld Java class name:
Main
Special Judge
Submit
Status
PID: 1083
Dr. Grey is a data analyst, wh...
分类:
其他好文 时间:
2015-04-20 22:45:37
阅读次数:
148
什么是约瑟夫事件。就是一个数学算法问题。描述如下:已知n个人(以编号1,2,3...n分别表示)围坐在一张圆桌周围。从编号为k的人开始报数,数到m的那个人出列;他的下一个人又从1开始报数,数到m的那个人又出列;依此规律重复下去,直到圆桌周围的人全部出列。
分类:
其他好文 时间:
2015-04-17 15:57:59
阅读次数:
114
这是利用数学算法,进行高难度图像处理的一个例子。事实上,图像处理的数学算法,已经发展到令人叹为观止的地步。Scriptol列出了几种神奇的图像处理算法,让我们一起来看一下。一、像素图生成向量图的算法数字时代早期的图片,分辨率很低。尤其是一些电子游戏的图片,放大后就是一个个像素方块。Depixeliz...
分类:
编程语言 时间:
2015-04-17 13:18:40
阅读次数:
202