CPU(CPUUsage)CPU利用率就是定义CPU使用的百分比.评估系统最重要的一个度量方式就是CPU的利用率.在监控服务器的CPU利用率时,我们一般采集三个数据:SystemTime、NiceTime、UserTime。SystemTime(译注:内核线程以及中断时间)-关于在kernelspace中线程和中断在CPU开销时间百分比.UserTime(译注:用户进程时间)-关于在userspa
分类:
其他好文 时间:
2018-12-11 00:34:16
阅读次数:
362
sysbench是一个模块化的、跨平台、多线程基准测试工具,主要用于评估测试各种不同系统参数下的数据库负载情况。目前sysbench代码托管在github上,项目地址:https://github.com/akopytov/sysbench 一、 下载安装 ### RHEL/CentOS``` sh ...
分类:
其他好文 时间:
2018-12-10 23:30:46
阅读次数:
190
TF IDF是什么 TF IDF是一种统计方法,用以评估一个词对于一篇文章或语料库中一篇文章的重要性。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 TF IDF的使用场景 TF IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度 ...
分类:
其他好文 时间:
2018-12-10 20:51:26
阅读次数:
200
过拟合和欠拟合 过拟合:在训练集上的准确率较高,而在测试集上的准确率较低 欠拟合:在训练集和测试集上的准确率均较低 1)概念概述 学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型是否方差偏高或偏差过高,以及增大训练集是否可以减小过拟合。 先明 ...
分类:
其他好文 时间:
2018-12-10 14:22:23
阅读次数:
320
l ROC曲线 预测 1 0 合计 实际 1 True Positive(TP) False Negative(FN) Actual Positive(TP+FN) 0 False Positive(FP) True Negative(TN) Actual Negative(FP+TN) 合计 Pr ...
分类:
其他好文 时间:
2018-12-10 14:10:05
阅读次数:
178
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.4, random ...
分类:
其他好文 时间:
2018-12-10 14:09:22
阅读次数:
204
混淆矩阵 from sklearn.metrics import confusion_matrix y_true = [2, 0, 2, 2, 0, 1] y_pred = [0, 0, 2, 2, 0, 2] confusion_matrix(y_true, y_pred) >>>array([ ...
分类:
其他好文 时间:
2018-12-10 13:50:26
阅读次数:
211
MySQL的连接查询 建表 1.一对一关系 2.一对多、多对一关系 3.多对多关系(需要建立一张关联表,进行二者的关联) 4.例:订单管理,用户下订单,一个用户可以下一个或多个订单,一个订单可能包含一个或多个商品。 sql 中什么时候用内连接查询,什么时候用外连接查询? 需要查找两张表同时存在的数据 ...
分类:
数据库 时间:
2018-12-09 12:15:30
阅读次数:
285
Linux性能评估工具 https://www.cnblogs.com/dianel/p/10085454.html Linux性能评估工具 目录 介绍 负载:uptime 查看内核的信息: dmesg 查看内存状态: free、vmstat free: 查看内存,已用内存,剩余内存、交换分区等 v ...
分类:
系统相关 时间:
2018-12-08 15:46:31
阅读次数:
275
1、概述 数据分析师是数据师Datician['det???n]的一种,指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。 有人经过调研,数据分析师职位普遍集中在北上广深城市,待遇也比相同层次的人员高出20-30个百分点,由此可见,数据分析师已经越来越 ...
分类:
其他好文 时间:
2018-12-08 13:05:36
阅读次数:
169