转自博客:http://www.infosec-wiki.com/?p=140760 一、关于异常检测 异常检测(outlier detection)在以下场景: 数据预处理 病毒木马检测 工业制造产品检测 网络流量检测 等,有着重要的作用。由于在以上场景中,异常的数据量都是很少的一部分,因此诸如: ...
分类:
编程语言 时间:
2017-11-03 11:05:21
阅读次数:
515
一、关键点 异常:存在于运行时的反常行为,这些行为超出了函数正常功能的范围。 典型的异常:失去数据库连接、遇到意外输入等。 异常处理机制:为程序中异常检测和异常处理这两部分的协作提供支持。 二、异常检测 形式:throw 表达式; 解释:上面的语句将引发一个异常,其中表达式的类型就是抛出的异常类型。 ...
分类:
其他好文 时间:
2017-10-12 20:32:49
阅读次数:
268
空间轨迹是一个(x,y)点的序列,每个点都有一个时间戳.因为轨迹通常是由传感器测量的,所以它们不可避免地会出现一些错误,需要对数据进行平滑化处理。 此外,司机绕路或者交通事故也会导致轨迹数据出现偏离,这时候我们需要对轨迹数据进行异常检测。 数据平滑化处理 过滤技术进行为了演示,我们用一个GPS记录器 ...
分类:
其他好文 时间:
2017-10-07 20:47:13
阅读次数:
1217
方式一: try 检测范围 except Exception[ as reason]: 出现异常(Exception)后的处理代码 方式二: 方式一: 运行结果: [fengjunjie@localhost ~]$ python3 test.py 文件出错拉T_T ...
分类:
编程语言 时间:
2017-09-11 15:18:11
阅读次数:
160
异常检测: 判断测试集是否异常。如下例中对飞机引擎的判断: 我们建立评估模型概率模型p(x)来判断,如果p(x)<ε异常,反之正常 用处举例:购物网站用户异常检测,计算机集群异常检测 ...
分类:
其他好文 时间:
2017-08-24 10:50:57
阅读次数:
117
多元高斯(正态)分布 多元高斯分布有两个参数u和Σ,u是一个n维向量,Σ协方差矩阵是一个n*n维矩阵。改变u与Σ的值可以得到不同的高斯分布。 参数估计(参数拟合),估计u和Σ的公式如上图所示,u为平均值,Σ为协方差矩阵 使用多元高斯分布来进行异常检测 首先用我我们的训练集来拟合参数u和Σ,从而拟合模 ...
分类:
其他好文 时间:
2017-08-23 20:48:11
阅读次数:
174
利用数值来评价一个异常检测算法的重要性 使用实数评价法很重要,当你用某个算法来开发一个具体的机器学习应用时,你常常需要做出很多决定,如选择什么样的特征等等,如果你能找到如何来评价算法,直接返回一个实数来告诉你算法的好坏,那样你做决定就会更容易一些。如现在有一个特征,要不要将这个特征考虑进来?如果你带 ...
分类:
编程语言 时间:
2017-08-21 00:35:36
阅读次数:
223
估计P(x)的分布--密度估计 我们有m个样本,每个样本有n个特征值,每个特征都分别服从不同的高斯分布,上图中的公式是在假设每个特征都独立的情况下,实际无论每个特征是否独立,这个公式的效果都不错。连乘的公式表达如上图所示。 估计p(x)的分布问题被称为密度估计问题(density estimatio ...
分类:
编程语言 时间:
2017-08-18 23:43:04
阅读次数:
281
高斯分布 高斯分布也称为正态分布,μ为平均值,它描述了正态分布概率曲线的中心点。σ为标准差,σ2为方差,σ描述了曲线的宽度。在中心点附近概率密度大,远离中心点概率密度小。 高斯分布图 概率曲线下方的面积为1(积分为1),概率和为1。μ为中心点,σ为宽度。σ小时图形更尖更高,σ大时图形更矮更宽,因为面 ...
分类:
其他好文 时间:
2017-08-18 22:30:33
阅读次数:
191
http://blog.csdn.net/wangyibo0201/article/details/51705966 在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和异常数据。异常检测也是数据挖掘的一个方向,用于反作弊、伪基站、金融诈骗等领域。 异常检测方法,针对不同 ...
分类:
编程语言 时间:
2017-08-04 20:34:39
阅读次数:
265