朴素贝叶斯垃圾邮件分类 读邮件数据集文件,提取邮件本身与标签。 2.邮件预处理 2.1传统方法 2.1 nltk库 分词nltk.sent_tokenize(text) #对文本按照句子进行分割 nltk.word_tokenize(sent) #对句子进行分词 2.2 punkt 停用词from ...
分类:
其他好文 时间:
2020-05-17 22:04:44
阅读次数:
104
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-05-16 19:09:13
阅读次数:
60
视频1:复习环境 视频2:变量及定义 (结合 01数值类型和序列类型.ppt)xshell中练习: 查看关键字>>> import keyword>>> keyword.kwlist['False', 'None', 'True', 'and', 'as', 'assert', 'break', ' ...
分类:
其他好文 时间:
2020-05-16 10:56:11
阅读次数:
88
前言 前面的博客谈的大多数都是针对数据的缓存,今天我们来换换口味。来谈谈在ASP.NET Core中的ResponseCaching,与ResponseCaching关联密切的也就是常说的HTTP缓存。 在阅读本文内容之前,默认各位有HTTP缓存相关的基础,主要是Cache-Control相关的。 ...
分类:
Web程序 时间:
2020-05-16 10:51:36
阅读次数:
55
1 aggs GET searchcenter-prod-log-2019.12.03/_search { "size": 0, "aggs": { "group_by_ip": { "terms": { "field": "ip.keyword", "size": 100 } } } } size ...
分类:
其他好文 时间:
2020-05-15 11:29:05
阅读次数:
83
页面的渲染过程 当我们在浏览器里输入一个 URL 后,最终会呈现一个完整的网页。会经历以下几个步骤: 1、HTML 的加载 页面上输入 URL 后,会先拿到 HTML 文件。HTML是一个页面的基础,所以会在最开始的时候下载它,下载完毕后就开始对它进行解析 2、其他静态资源的下载 HTML 在解析的 ...
分类:
其他好文 时间:
2020-05-14 11:05:19
阅读次数:
57
刚刚看了一眼,距离上次更新博客差不多都快20天了,也该更新一下了! 1.这个是自己上个月给自己弄的计划,至于熬夜,虽然不是每晚十一点多必睡觉,但是一般到了十二点多一点也就睡了,不像3月那么肝,熬到凌晨。 2.mysql学习了一部分,感觉够用了就没继续学下去。感觉我们课上讲的有点浅了。 3.计组,有一 ...
分类:
其他好文 时间:
2020-05-12 23:10:50
阅读次数:
121
转 方式一 使用二进制 4 public static class ObjectCopier 5 { 6 public static T Clone<T>(T source) 7 { 8 if (!typeof(T).IsSerializable) 9 { 10 throw new Argument ...
import tkinter as tk from tkinter import messagebox import urllib.request import requests import re import sys def inquire(): cityName = entry.get() # ...
分类:
微信 时间:
2020-05-12 13:46:01
阅读次数:
91
一、错误处理原理分析 使用SpringBoot创建的web项目中,当我们请求的页面不存在(http状态码为404),或者器发生异常(http状态码一般为500)时,SpringBoot就会给我们返回错误信息。 也就是说,在SpringBoot的web项目中,会自动创建一个/error的错误接口,来返 ...
分类:
编程语言 时间:
2020-05-11 15:47:39
阅读次数:
77