码迷,mamicode.com
首页 > 编程语言 > 详细

【PythonCoach】WordCloud教程(上)

时间:2020-03-30 12:40:17      阅读:96      评论:0      收藏:0      [点我收藏+]

标签:enc   文件的   字符   创建   管理   comm   txt   ase   please   

大家可能会问:一上来就讲Wordcloud,会很难学习的!

不用怕,我们就通过这个案例来告诉大家Python的知识,准备好了吗?开车喽!

先贴代码:

import wordcloud,jieba
with open(datas/1.txt) as rt:#,encoding=‘utf-8‘
    comment_text=rt.read()
    cut_text = " ".join(jieba.cut(comment_text))
    wordclud = wordcloud.WordCloud(scale=4,background_color="white", width=1000, height=860, margin=2).generate(cut_text)
    wordclud.to_file(test.png)
    print(OK,Please Look!)

(1.txt就是随便一段中文文本)

1.import知识

如果学过C语言,那么import就是#include

import就是导入一个包,导入后可以使用里面的工具??(函数,类,变量)

for example:

 

1 import time
2 import urllib.request
3 import os as cmd 
4 from threading import Thread
5 from math import *

用as可以为模块起别名,一旦起了别名,以后调用都要用别名,如下:

import math as num
print(圆周率是+str(num.pi))

 

结果:

1 圆周率是3.141592653589793

print是输出,能输出什么呢?Anything you want!

如:

1 print("Hello, World!")

变量:

python中变量的创建很简单,跟公式差不多:

a = 20
b = 9+3
b,c = 10,9
d=object()#一个对象

open:

open可以打开一个文件,可以对文件进行操作,但要看标志:

标志大全:

1.‘r‘,只读,如果不存在会报错

2.‘w‘,  只写,不存在指定文件名的文件的话就会创建一个

3.‘rb‘,  只读,二进制格式

4.‘wb‘, 只写,二进制格式

5.‘a‘ ,追加,和只写不同之处在于只写会把文件原有内容覆盖,而追加不会

6.‘ab‘,追加,二进制格式

7.’w+‘ ; ‘r+‘:可读可写

8.’a+‘:追加+读取

For Example:

#with是另外一个知识点
with open(wer.txt) as er:
    print(er.read())
open(ert.txt,w).write(hello)

口诀:read读取,write写,追加还用write方法。

with:

with是python对于上下文管理器的一种实现方法

with b as a: a是b的返回值,当with里面的代码执行完后,b就会执行退出语句

栗(例)子:

with open(123.txt,w) as r:
    r.write(help me!)

join:

很简单,就是把一段字符串插入到列表(下次教程会讲)中每一个元素的后面,然后合成一个字符串

下面来看看WordCloud有关的:

jieba:

jieba是中文分词的一个模块,用cut函数就可以分词得到结果对象,在list一下即可。

wordcloud:

这个模块里面的WordCloud对象(可以暂时理解为带参数模块,不过python中并没有这样的模块)可以生成可视化的图片(按词的出现频率统计),只要指定一下宽、高、背景颜色即可。

 

好啦今天的教程就这么多啦!

【PythonCoach】WordCloud教程(上)

标签:enc   文件的   字符   创建   管理   comm   txt   ase   please   

原文地址:https://www.cnblogs.com/7-pjk/p/12597745.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!