手册上查询优化器概述 查询优化器的任务是发现执行SQL查询的最佳方案。大多数查询优化器,包括MySQL的查询优化器,总或多或少地在所有可能的查询评估方案中搜索最佳方案。对于联接查询,MySQL优化器所调查的可能的方案数随查询中所引用的表的数目呈指数增长。对于小数量的表(典型小于7-10),这不是一个 ...
分类:
数据库 时间:
2019-09-05 18:18:38
阅读次数:
89
通过两组统计数据计算而得的协方差可以评估这两组统计数据的相似程度。 样本: 平均值: 离差(用样本中的每一个元素减去平均数,求得数据的误差程度): 协方差 协方差可以简单反映两组统计样本的相关性,值为正,则为正相关;值为负,则为负相关,绝对值越大相关性越强。 案例:计算两组数据的协方差,并绘图观察。 ...
分类:
其他好文 时间:
2019-09-05 15:20:42
阅读次数:
117
原文链接:http://tecdat.cn/?p=6310 在讨论ROC曲线之前,首先让我们在逻辑回归的背景下考虑校准和区分之间的区别。 良好的校准是不够的 对于模型协变量的给定值,我们可以获得预测的概率。如果观察到的风险与预测的风险(概率)相匹配,则称该模型已被很好地校准。也就是说,如果我们要分配 ...
分类:
编程语言 时间:
2019-09-04 17:40:30
阅读次数:
135
作者 | 贺满 链接 | cnblogs.com/puresoul/p/5388586.html 本文主要分为两个部分: 第一部分:主要从问题出发,引入接口测试的相关内容并与前端测试进行简单对比,总结两者之前的区别与联系。但该部分只交代了怎么做和如何做?并没有解释为什么要做? 第二部分:主要介绍为什 ...
分类:
其他好文 时间:
2019-09-04 10:21:42
阅读次数:
110
目录 1. 为什么需要RNN 2. LSTM的结构 3. LSTM网络 4. RNN 的评估 5. RNN的应用 6. Attention-based model 1. 为什么需要RNN? 传统的神经网络,一个输入会对应一个输出,如果输入不变,那输出也不会变。如下,一个Tappei是属于目的地类的, ...
分类:
其他好文 时间:
2019-09-03 22:45:12
阅读次数:
116
一、定义: 监督学习主要包括分类和回归 当输出被限制为有限的一组值(离散数值)时使用分类算法 当输出可以具有范围内的任何树值(连续数值)时使用回归算法 相似度学习是和回归和分类都密切相关的一类监督学习,它的目的是使用相似函数从样本中学习,这个函数可以度量两个对象之间的相似度或关联度 二、监督学习三要 ...
分类:
其他好文 时间:
2019-09-03 09:55:35
阅读次数:
104
TF-IDF介绍 TF-IDF是NLP中一种常用的统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度,通常用于提取文本的特征,即关键词。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 在NLP中,TF-IDF的计算公式如下: ...
分类:
其他好文 时间:
2019-09-02 15:44:17
阅读次数:
98
一、大数据的来源 1.人类活动 2.计算机 3.物理世界 二、大数据采集设备 1.科研数据 (1)大型强子对撞机 (2)射电望远镜 (3)电子显微镜 2.网络数据 我们可以利用数据中心采集网络中的数据。 三、大数据采集方法 1.科研数据 2.网络数据 爬虫(慎用) 3.系统日志 (1)Scribe是 ...
分类:
其他好文 时间:
2019-09-02 09:29:17
阅读次数:
85
7.1 分类模型评估 1、二分类 混淆矩阵中对角线的元素代表正确分类的数量; 非对角线元素代表错误分类的数量。 所以最为理想的模型(拿测试集来看),应该是一个对角阵。若无法得到对角阵,对角线上的数字之和如果占统治地位也是可以的。 片面的追求查准率可能会降低召回率 2、多分类 recall参数中的av ...
分类:
其他好文 时间:
2019-09-01 19:02:14
阅读次数:
128
1 #define _for(i,a,b) for(int i = (a);i < b;i ++) 2 #define _rep(i,a,b) for(int i = (a);i > b;i --) 3 4 class Solution 5 { 6 public: 7 int dietPlanPer... ...
分类:
其他好文 时间:
2019-09-01 15:05:54
阅读次数:
179