1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
分类:
其他好文 时间:
2018-12-06 21:23:36
阅读次数:
247
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
分类:
其他好文 时间:
2018-12-06 20:35:31
阅读次数:
106
朴素贝叶斯应用:垃圾邮件分类 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词 ...
分类:
其他好文 时间:
2018-12-06 11:05:10
阅读次数:
253
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
分类:
其他好文 时间:
2018-12-03 12:01:18
阅读次数:
169
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
分类:
其他好文 时间:
2018-12-03 12:00:56
阅读次数:
226
title: sklearn 特征工程之特征选择 date: 2016 11 25 22:49:24 categories: skearn tags: sklearn 抄袭/参考资料 "使用sklearn做单机特征工程" "sckearn中文" 周志华《机器学习》 当数据预处理完成后,我们需要选择有 ...
分类:
其他好文 时间:
2018-12-01 18:23:12
阅读次数:
400
应用ARIMA(1,1,0)对2015年1月1日到2015年2月6日某餐厅的销售数量做为期5天的预测 setwd('D:\\dat') #install.packages("forecast") #install.packages("plyr") #install.packages("fUnitRo ...
分类:
编程语言 时间:
2018-11-29 22:30:52
阅读次数:
393
一、 前言 大数据时代已经到来,企业迫切希望从已经积累的数据中分析出有价值的东西,而用户行为的分析尤为重要。利用大数据来分析用户的行为与消费习惯,可以预测商品的发展的趋势,提高产品质量,同时提高用户满意度。 二、 初识用户画像 右边是一个人的基本属性,通过一个人的基本属性我们可以了解到这个人的基本信 ...
分类:
数据库 时间:
2018-11-24 23:51:22
阅读次数:
246
脑图像的数据预处理 在“BrainWeb: Simulated Brain Database使用说明”中已经介绍了如何下载并打开脑数据库,这篇文章将0、1、2、3、8类分割出来,用以后续对图像的处理。 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 1 ...
分类:
其他好文 时间:
2018-11-24 16:35:36
阅读次数:
275
基于TextCNN汽车行业评论文本的情感分析 使用卷积神经网络对汽车行业评论文本进行情感分析。 数据集 爬取汽车之家车主口碑评论文本,抽取口碑中最满意以及最不满意评论文本,分别作为正向情感语料库和负向情感语料库。 语料库基本信息如下: 预处理 utils.py为数据的预处理代码。 经过数据预处理,数 ...
分类:
其他好文 时间:
2018-11-24 14:11:55
阅读次数:
726