1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path = r"SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') data = csv.reader(sms, deli ...
分类:
其他好文 时间:
2020-05-17 13:29:03
阅读次数:
57
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h ...
分类:
其他好文 时间:
2020-05-17 12:56:07
阅读次数:
51
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-05-16 19:09:13
阅读次数:
60
NumPy是python数值计算中最为重要的基础包,大多数计算包都提供了基于NumPy的科学函数功能,将NumPy的数组对象作为数据交换的通用语。 NumPy的优点 nddarray,一种高效多维数组,提供了基于数组的便捷算术操作以及灵活的广播功能。 对所有数据进行快速的矩阵计算,而无须编写循环程序 ...
分类:
编程语言 时间:
2020-05-16 14:04:06
阅读次数:
101
种子值seed、维度ndim、形状shape、尺寸size、数据类型dtype、元素字节大小itemsize;总字节大小nbytes 1.设置种子值可以确保每次程序执行时都可以生成同样的随机数组: np.random.seed(0) # 设置随机数种子 x1 = np.random.randint( ...
分类:
其他好文 时间:
2020-05-15 15:34:40
阅读次数:
70
1.根据Python列表创建数组 np.array([2, 3, 7, 5, 6]) 注意,和Python列表不同,NumPy要求数组内的数据必须为同一类型。如果类型不匹配,NumPy将会向上转换(如果可行)。 np.array([3.14, 3, 5]) # array([3.14, 3. , 5 ...
分类:
其他好文 时间:
2020-05-15 15:34:17
阅读次数:
91
numpy.array 属性 维数:.ndim 形状:.shape 总元素个数:.size 创建数组 元素在指定范围的数组 np.arange() 类似range 可选参数step 全零数组 np.zeros((形状)) 全一数组 np.ones((形状)) 改变数组形状(浅拷贝) array.re ...
分类:
其他好文 时间:
2020-05-15 00:04:45
阅读次数:
49
1. 下载 basemap 包 https://github.com/matplotlib/basemap/releases 2. 解压 tar -zxvf basemap-1.2.1rel.tar.gz 3. 安装依赖包 pip install numpy -i https://mirrors.a ...
分类:
其他好文 时间:
2020-05-14 22:13:18
阅读次数:
69
图3.1 import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np mpl.rcParams['font.sans-serif']=['SimHei'] mpl.rcParams['axes.unicode ...
分类:
编程语言 时间:
2020-05-14 19:25:53
阅读次数:
66
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-05-14 13:18:59
阅读次数:
66