概述 新课题研究:响应式邮件框架Formerly Ink(Formerly Ink官网:http://foundation.zurb.com/emails.html)姐妹篇: EDM响应式邮件框架:Formerly Ink 介绍 打开官网,就能看到Formerly Ink的主标题是Foundatio ...
分类:
其他好文 时间:
2020-05-23 20:32:48
阅读次数:
61
1.读取 2.数据预处理 # 词性还原def get_wordnet_pos(treebank_tag): if treebank_tag.startswith('J'): return nltk.corpus.wordnet.ADJ elif treebank_tag.startswith('V' ...
分类:
其他好文 时间:
2020-05-23 20:31:50
阅读次数:
70
1.读取 file_path=r'D:\PycharmProjects\data\SMSSpamCollection' sms=open(file_path,'r',encoding='utf-8') sms_data=[] sms_label=[] csv_reader=csv.reader(sm ...
分类:
其他好文 时间:
2020-05-23 20:30:03
阅读次数:
87
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, ...
分类:
其他好文 时间:
2020-05-23 20:25:55
阅读次数:
59
13-垃圾邮件分类2 TF-IDF 概念 是一种统计方法,用以评估一个词对于一个语料库中一份文件的重要程度。 词的重要性随着在文件中出现的次数正比增加,同时随着它在语料库其他文件中出现的频率反比下降。就是说一个词在某一个文档中出现次数比较多,其他文档没有出现,说明该词对该份文档分类很重要。然而如果其 ...
分类:
其他好文 时间:
2020-05-23 20:23:01
阅读次数:
66
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, ...
分类:
其他好文 时间:
2020-05-23 20:21:37
阅读次数:
45
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, ...
分类:
其他好文 时间:
2020-05-23 20:16:33
阅读次数:
59
前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 用Python也差不多一年多了,Python应用最多的场景还是Web快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码识别脚本。 爬 ...
分类:
编程语言 时间:
2020-05-23 20:13:48
阅读次数:
72
在Ubuntu 18.04安装Git 更新apt包列表 安装Git: 检查Git版本 配置Git 在Git中配置自己的名称和电子邮件地址 查看配置 获取帮助信息 参考:https://www.linuxidc.com/Linux/2018 05/152610.htm ...
分类:
系统相关 时间:
2020-05-23 20:12:30
阅读次数:
60
1.读取 2.数据预处理 import csv import nltk import re from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer import pandas as pd #返回类别 def ...
分类:
其他好文 时间:
2020-05-23 20:02:00
阅读次数:
60