码迷,mamicode.com
首页 >  
搜索关键字:类别    ( 5145个结果
13-垃圾邮件分类2
1.读取 2.数据预处理 import csv import nltk import re from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer import pandas as pd #返回类别 def ...
分类:其他好文   时间:2020-05-23 20:02:00    阅读次数:60
《NLP中数据增强的综述,快速的生成大量的训练数据》2020-05,作者:amitness ,编译:ronghuaiyang
原文链接:https://amitness.com/2020/05/data augmentation for nlp/ 译文链接:https://blog.csdn.net/u011984148/article/details/106233312/ semantically invariant t ...
分类:其他好文   时间:2020-05-23 11:14:47    阅读次数:309
【一致性检验指标】Kappa(cappa)系数
1 定义 百度百科的定义: 它是通过把所有地表真实分类中的像元总数(N)乘以混淆矩阵对角线(Xkk)的和,再减去某一类地表真实像元总数与被误分成该类像元总数之积对所有类别求和的结果,再除以总像元数的平方减去某一类中地表真实像元总数与该类中被误分成该类像元总数之积对所有类别求和的结果所得到的。 这对于 ...
分类:移动开发   时间:2020-05-23 09:20:30    阅读次数:324
Java IO流
Java IO流 在 Java 中所有数据都是使用流读写的。流是一组有序的数据序列,将数据从一个地方带到另一个地方。根据数据流向的不同,可以分为输入(Input)流和输出(Output)流两种。 分类: 数据流是 Java 进行 I/O 操作的对象,它按照不同的标准可以分为不同的类别。 按照流的方向 ...
分类:编程语言   时间:2020-05-22 12:45:51    阅读次数:43
用户流失预警系统
数据清洗与格式转换 探索性数据分析 特征筛选 1.数据清洗与格式转换 通过pandas来导入csv:查看一下数据的基本情况,可以看到,整个数据集有3333条数据,21个维度,最后一列是分类 基本信息以及类型 我们可以看到 1.个人信息:州名、账号长度、区号、电话号码,这些个人信息对结果意义不大,删除 ...
分类:其他好文   时间:2020-05-22 10:08:31    阅读次数:80
Feature Engineering 特征工程 3. Feature Generation
从原始数据创建新特征是改进模型的最佳方法之一 例如,数据有很长连续时间的,我们可以把最近一周的提取出来作为一个新的特征 1. 组合特征 最简单方法之一是组合特征 例如,如果一条记录的国家/地区为"CA",类别为"Music",则可以创建一个新值" CA_Music" 可以从所有分类特征中构建组合特征 ...
分类:其他好文   时间:2020-05-21 16:11:40    阅读次数:58
聚类算法——DBSCAN算法原理及公式
聚类的定义 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。聚类算法是无监督的算法。 常见的相似度计算方法 闵可夫斯基距离Minkowski/欧式距离 在上述的计算中,当p=1时,则是计算绝对值距离,通常叫做曼哈顿距离,当p ...
分类:数据库   时间:2020-05-20 20:12:09    阅读次数:427
java双亲委派机制及作用
什么是双亲委派机制 当某个类加载器需要加载某个.class文件时,它首先把这个任务委托给他的上级类加载器,递归这个操作,如果上级的类加载器没有加载,自己才会去加载这个类。 类加载器的类别 BootstrapClassLoader(启动类加载器) c++编写,加载java核心库 java.*,构造Ex ...
分类:编程语言   时间:2020-05-20 18:46:16    阅读次数:51
Softmax函数原理及Python实现
Softmax原理 ___ Softmax函数用于将分类结果归一化,形成一个概率分布。作用类似于二分类中的Sigmoid函数。 对于一个k维向量z,我们想把这个结果转换为一个k个类别的概率分布 。softmax可以用于实现上述结果,具体计算公式为: $$ softmax(x_i) = \frac{e ...
分类:编程语言   时间:2020-05-20 12:43:34    阅读次数:110
python 机器学习(二)分类算法-k近邻算法
一、什么是K近邻算法? 定义: 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 来源: KNN算法最早是由Cover和Hart提出的一种分类算法. 计算距离公式: 两个样本的距离可以通过如下公式计算,又叫欧式距离。 比如说,a(a1 ...
分类:编程语言   时间:2020-05-20 12:17:07    阅读次数:62
5145条   上一页 1 ... 20 21 22 23 24 ... 515 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!