刚开始看这方面论文的时候对于各种评价方法特别困惑,还总是记混,不完全统计下,备忘。 关于召回率和精确率,假设二分类问题,正样本为x,负样本为o: 准确率存在的问题是当正负样本数量不均衡的时候: 精心设计的分类器最后算准确率还不如直接预测所有的都是正样本。 用Recall和Precision来衡量分类 ...
分类:
其他好文 时间:
2017-12-12 13:38:23
阅读次数:
114
首先,我们定义好一个LSTM网络,然后给出一个句子,每个句子都有很多个词构成,每个词可以用一个词向量表示,这样一句话就可以形成一个序列,我们将这个序列依次传入LSTM,然后就可以得到与序列等长的输出,每个输出都表示的是一种词性,比如名词,动词之类的,还是一种分类问题,每个单词都属于几种词性中的一种。 ...
分类:
其他好文 时间:
2017-12-08 23:12:09
阅读次数:
248
引子 对于一个特征数比较大的非线性分类问题,如果采用先前的回归算法,需要很多相关量和高阶量作为输入,算法的时间复杂度就会很大,还有可能会产生过拟合问题,如下图: 这时就可以选择采用神经网络算法。 神经网络算法最早是人们希望模仿大脑的学习功能而想出来的。 一个神经元,有多个树突(Dendrite)作为 ...
分类:
Web程序 时间:
2017-12-03 21:47:44
阅读次数:
292
1.经常使用决策树处理分类问题,决策树也是最经常使用的数据挖掘算法。 2.kNN可以完成很多分类任务,最大的缺点是无法给出数据的内在含义,决策树的优势在于数据形式容易理解。 3.1决策树的构造 决策树的优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关特征数据。 缺点:可能会 ...
分类:
其他好文 时间:
2017-11-28 23:13:30
阅读次数:
232
该算法由facebook在2016年开源,典型应用场景是“带监督的文本分类问题”。 模型 模型的优化目标如下: 其中,$<x_n,y_n>$是一条训练样本,$y_n$是训练目标,$x_n$是normalized bag of features。矩阵参数A是基于word的look-up table,也 ...
分类:
编程语言 时间:
2017-11-27 14:18:25
阅读次数:
179
http://blog.csdn.net/heyongluoyao8/article/details/49408131 http://blog.csdn.net/lxg0807/article/details/71440477 在很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另 ...
分类:
其他好文 时间:
2017-11-27 13:30:43
阅读次数:
679
神经网络做的主要事情就是分类,在上课中,最简单的问题为二分类问题,利用单层感知机,可以画出一条线将平面隔开分类。同样如果增加感知机个数,可以得到更强的分类能力,但是无论如何都是一个线性方程。只不过是线性的复杂组合,当然曲线可以用无限的直线去逼近,但是这显然会带来巨大的计算量。因此加入了激活函数,这样 ...
分类:
其他好文 时间:
2017-11-25 13:12:56
阅读次数:
116
Softmax回归模型,该模型是logistic回归模型在多分类问题上的推广,在多分类问题中,类标签 可以取两个以上的值。Softmax模型可以用来给不同的对象分配概率。即使在之后,我们训练更加精细的模型时,最后一步也需要用softmax来分配概率。本质上其实是一种多种类型的线性分割,当类标签 取 ...
分类:
其他好文 时间:
2017-11-25 13:10:02
阅读次数:
406
转自 http://blog.csdn.net/clodfront/article/details/6555717 关于网游服务器的分类和布局的问题是在网络游戏中比较关键的部分, 首先我们讨论网络游戏服务器的分类问题: 一般情况下游戏服务器分为: 登陆服务器, 网关服务器, 游戏服务器和数据库服务器 ...
分类:
其他好文 时间:
2017-11-22 13:07:39
阅读次数:
153
问题 G: 数字分类 (20) 题目描述 给定一系列正整数,请按要求对数字进行分类,并输出以下5个数字: A1 = 能被5整除的数字中所有偶数的和; A2 = 将被5除后余1的数字按给出顺序进行交错求和,即计算n1-n2+n3-n4...; A3 = 被5除后余2的数字的个数; A4 = 被5除后余 ...
分类:
其他好文 时间:
2017-11-11 11:41:48
阅读次数:
191