1.选一个自己感兴趣的主题(所有人不能雷同)。 我选择了我们学校的新闻网来爬取数据,主要是通过获取文本然后结巴来分析 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 打开广州商学院的网址进入到校园的新闻网。然后通过对每一页的来获取信息。 3.对爬了的数据进行文本分析,生成词云。 首先 ...
分类:
其他好文 时间:
2018-04-27 02:40:40
阅读次数:
267
SELECT DISTNCT 列名称 FROM 表名称SQL SELECT DISTINCT 语句在表中,可能会包含重复值。 关键词 DISTINCT 用于返回唯一不同的值。 语法:新建数据库 test新建表 Table_1 新建列 Mike 广州mary 深圳Mike 南京huali 北京查询: ...
分类:
数据库 时间:
2018-04-26 12:14:29
阅读次数:
187
name|city|money | | 张三|北京|100 张三|上海|200 张三|广州|300 面试题:test表中有以上数据,使用SQL查询出下列效果。 name|北京|上海|广州 | | | 张三|100|200|300 将数据库字段中的数据横向显示,考察的是对于 判断语句的使用,下列代码为 ...
分类:
数据库 时间:
2018-04-19 17:04:28
阅读次数:
189
data = { '福建':{ "泉州":{"南安":['黄小东'] ,"晋江":[] }, "厦门":["鼓浪屿","曾厝垵"], }, '广东':{ "深圳":["南山","福田","宝安"], "广州":["天河"], }, "香港":{ "旺角":[], &quo ...
分类:
其他好文 时间:
2018-04-18 23:37:58
阅读次数:
215
VPC对等连接(VPCPeering)用于打通两个同区域的VPC(是否为同一账号无所谓)的内网连接。这里的区域是指四个大区:华北-北京、华东-上海、华东-宿迁、华南-广州。1.基本概念:VPC对等连接是一种跨VPC网络互联服务,可以使私有网络IP在对等VPC之间路由流量,就像它们属于同一网络一样。您可以实现同地域的相同/不同用户的私有网络互联,通过在两端配置路由策略,可以实现不同私有网络的流量互通
分类:
其他好文 时间:
2018-04-17 16:58:52
阅读次数:
754
import re import xlwt import time import pandas import requests from multiprocessing import Process,Pool from bs4 import BeautifulSoup def getClickCou... ...
分类:
其他好文 时间:
2018-04-16 12:04:50
阅读次数:
195
1、一套规则,浏览器认识的规则 2、开发者: 3、学习HTML规则 4、开发后台程序 写html文件(充当模板的作用) 数据库获取数据,然后替换到HTML文件的指定位置(web框架) 4.1本地测试 找到文件路径,直接浏览器打开 pychatm打开测试 4.2编写HTML文件 doctype对应关系 ...
分类:
Web程序 时间:
2018-04-15 13:30:22
阅读次数:
212
1. 用正则表达式判定邮箱是否输入正确。 2. 用正则表达式识别出全部电话号码 3用正则表达式进行英文分词 4. 使用正则表达式取得新闻编号 5. 生成点击次数的Request URL 6. 获取点击次数 7. 将456步骤定义成一个函数 def getClickCount(newsUrl): 8. ...
分类:
其他好文 时间:
2018-04-12 11:39:57
阅读次数:
175
单身狗: 单身狗: 下载图片 被一只狗挡住了的二维码,用图片处理软件把上面两个正方形随便一个覆盖狗的地方 我直接用美图秀秀处理一下,扫一下就得到flag ...
分类:
其他好文 时间:
2018-04-12 00:19:53
阅读次数:
165
1)字典相关操作方法 infos ={'name':'张三','sex':'男','addr':'广州市','age':'20'} #查找 infos.get('name') #获取name对应的值 infos.['sex'] #获取sex对应的值, infos.get('phone') #取不到这 ...
分类:
编程语言 时间:
2018-04-11 23:08:08
阅读次数:
255