数据质量
数据挖掘使用的数据通常是为其他用途收集或者收集的时候还没有明确目的。因此数据常常不能在数据的源头控制质量。为了避免数据质量的问题,所以数据挖掘着眼于两个方面:数据质量问题的检测和纠正(数据清理);使用可以容忍低质量数据的算法。
测量和数据收集问题
完美的数据在实际中几乎是不存在的,对于存在的数据质量问题,我们先定义测量误差和数据收集错误,然后考虑测量误差的各种问题:噪声...
分类:
其他好文 时间:
2014-07-26 15:26:11
阅读次数:
235
1 /* 2 编程之美题,给定N个数的数组,只能使用乘法,不使用除法,找出N-1个数的乘积最大的一组,有两种方法,方法一:采用两个数组分别保存从左向右 3 和从又向左的两个乘积值,然后在扫描一次,求出最大乘积,空间换时间的方法。 4 方法二:通过分析这些数的性质,看有多少正数,多少负数,多...
分类:
其他好文 时间:
2014-07-25 02:25:04
阅读次数:
267
1 /* 2 不改变正负号序列,使得负数在正数前面,要求O(n),时间复杂度,O(1)空间复杂度 3 实际情况,很可能做不到,可以用类似快排partition的方法,但是不能保证有序了,保证有序的一个方法是用翻转,例如 4 2,3,4,-1,-2,3,-5,-6——————翻转为2,3,4,-1,....
分类:
其他好文 时间:
2014-07-25 02:24:24
阅读次数:
209
滑雪
Time Limit: 1000MS
Memory Limit: 65536K
Total Submissions: 75626
Accepted: 28028
难得一见的中文题 题意就不多做解释 求最长路径
简单点的动规 唯一的麻烦就是没告诉你起点和终点 没关系 直接一个个暴搜反正数据不大。。。
转移方程 ...
分类:
其他好文 时间:
2014-07-24 23:31:33
阅读次数:
244
题目:已知三点,求到三点距离相同的点。
分析:计算几何。分三类情况讨论:
1.三点共线,不成立;
2.多点重叠,有多组解;
3.是三角形,输出中点。
说明:注意绝对值小于0.05的按0计算;负数的四舍五入与正数不同,-0.05的%.1lf输出是 -0.0。
#include
#include
#include ...
分类:
其他好文 时间:
2014-07-24 12:26:25
阅读次数:
258
网上很多帖子写这个问题,看了下方法基本上是以下两种:爆破、按位统计,但是按位统计都写了很长的统计过程,其实就是一个动态规划的过程f(n) = f(n/10) * 10 + n/10 + 1 当n%10 != 0 时,否则为f(n) = f(n/10) * 10 + n/10下面解释下第一种情况(后面...
分类:
其他好文 时间:
2014-07-22 22:50:57
阅读次数:
140
计算机二进制二进制的最高位时符号位:0表示正数,1表示负数正数的原码,反码,补码都一样负数的反码=它的原码符号位不变,其它位取反负数的补码=它的反码+10的反码,补码都是0java中的数都是有符号的在计算机运算的时候,都是以补码的方式来运算的。java中有4中位运算,分别是按位与&,按位或|,按位异...
分类:
其他好文 时间:
2014-07-22 22:49:53
阅读次数:
204
补码: ????正数的补码:正数的补码就是原码本身 ????????例如:4的补码,转换成2进制原码:00000100,补码和原码相同,也就是:00000100 ????负数的补码:符号位为1,其他位为该数值的原码按位取...
分类:
其他好文 时间:
2014-07-22 22:37:54
阅读次数:
241
数值统计
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 53462 Accepted Submission(s): 27366
Problem Description
统计给定的n个数中,负数、零和正数的个...
分类:
其他好文 时间:
2014-07-22 22:34:34
阅读次数:
195
题目大意:在一个N * M的格子中,放有一些糖,这些糖有的会损害健康,有的对健康有益。有损害的被记为负数,有益的会记为正数。另外,对于每一个糖而言,他都比左边的糖和上面的糖更健康。 现在我要在在N*M这个矩阵中找到一个子矩阵,使得所有糖的有益值加起来最大。 题目已经是简化了的。糖果按照左上最小,右下...
分类:
其他好文 时间:
2014-07-21 11:13:08
阅读次数:
204