如今,大数据技术已***至电商、智慧城市、金融等社会各领域,审计行业也难以抵挡大数据时代的浪潮。然而,在推动审计进行转型的过程中,“大数据审计”常常沦为“审计大数据”。许多审计部门在开发或运用审计信息系统时,仅仅是利用功能更强大的数据采集和数据分析技术扩大了抽样范围,审计人员所使用的并非是真正意义上的“大数据”,而只是“大量数据”。收藏|"大数据审计"变“审计大数据”?用错方法,
分类:
其他好文 时间:
2020-09-12 21:37:45
阅读次数:
29
总结 样本类别分布不均衡处理(处理过拟合和欠拟合问题) 过抽样(上采样):通过增加分类中少数类样本的数量来实现样本均衡 from imblearn.over_sampling import SMOTE 欠抽样(下采样):通过减少分类中多数类样本的数量来实现样本均衡 (可能造成样本数据大量丢失) fr ...
分类:
其他好文 时间:
2020-07-28 00:04:11
阅读次数:
85
1 卡方分布(分布) 1.1 定义 设随机变量 X 是自由度为 n 的 χ2 随机变量, 则其概率密度函数为 表示的是一个gamma函数,它是整数k的封闭形式。gamma函数的介绍如下伽马函数的总结。 的密度函数 形状如下图 密度函数的支撑集 (即使密度函数为正的自变量的集合) 为(0, +∞), ...
分类:
其他好文 时间:
2020-07-25 09:53:47
阅读次数:
87
Py-Spy介绍 引用官方的介绍: Py-Spy是Python程序的抽样分析器。 它允许您可视化查看Python程序在哪些地方花了更多时间,整个监控方式无需重新启动程序或以任何方式修改工程代码。 Py-Spy的开销非常低:它是用Rust编写的,速度与编译的Python程序不在同一个进程中运行。 这意 ...
分类:
编程语言 时间:
2020-07-24 21:39:33
阅读次数:
133
一. 常用函数的傅里叶变换 1.冲激函数的傅里叶变换是 1 (根据抽样性质) 傅里叶逆变换是1/2pi 冲击偶的傅里叶变换: 同理就有: 2.阶跃函数: 阶跃函数的傅里叶变换: 二. 性质汇总 1.对称性 2.线性(叠加性) 3.奇偶虚实 如果f(t)是虚函数 4.尺度变换 5.时移性质 6.频移特 ...
分类:
其他好文 时间:
2020-07-21 14:08:12
阅读次数:
201
用户对于购买商品的行为分析案例 import pandas as pd from pandas import DataFrame,Series import numpy as np import matplotlib.pyplot as plt %matplotlib inline #数据量级达到一 ...
分类:
其他好文 时间:
2020-07-18 15:41:01
阅读次数:
137
深入浅出统计学 框架 第一印象 集中趋势的度量 分散性与变异度的度量 概率计算 离散概率分布的运用 排列与组合 几何分布、二项分布及泊松分布 正态分布的运用 再谈正态分布的运用 统计抽样的运用 总体和样本的估计 置信区间的构建 假设检验的运用 x^2分布 相关与回归 01 第一印象 基本概念 频数: ...
分类:
其他好文 时间:
2020-07-15 23:33:36
阅读次数:
76
1.应用背景 在进行分类器构建后,要对其分类性能进行评估,或新构建的分类器相对于其他分类器对数据集的分类效果进行评估,这时就会用到相应的评估方法 2.常见的评估方法 2.1评估分类器性能的度量 基本概念理解: 正元组:在一个分类问题中我们感兴趣的元组; 负元组:其他元组; 真比例/真阳性(TP):指 ...
分类:
其他好文 时间:
2020-07-03 19:24:56
阅读次数:
78
python内置函数-排列组合函数 product 笛卡尔积 (有放回抽样排列) permutations 排列 (不放回抽样排列) combinations 组合,没有重复 (不放回抽样组合) combinations_with_replacement 组合,有重复 (有放回抽样组合) 详细的参见 ...
分类:
编程语言 时间:
2020-07-01 14:13:21
阅读次数:
81
深度卷积生成对抗网络 Deep Convolutional Generative Adversarial Networks GANs如何工作的基本思想。可以从一些简单的,易于抽样的分布,如均匀分布或正态分布中提取样本,并将其转换成与某些数据集的分布相匹配的样本。虽然例子匹配一个二维高斯分布得到了交叉 ...
分类:
其他好文 时间:
2020-07-01 12:41:12
阅读次数:
58