一、主题式网络爬虫设计方案 1. 主题式网络爬虫的名称 纵横小说网的爬取 2. 主题式网络爬虫的内容与数据特征分析 爬取内容:小说网链接,小说网页面链接,小说链接,小说名 小说的字数、总推荐、总点击、周推荐、作品总数和每月更新 数据特征分析: 把书名、总推荐和总点击做透视表和可视化 做用每月更新和作 ...
分类:
编程语言 时间:
2019-12-20 22:38:39
阅读次数:
188
正则表达式语法 1. 普通字符 字母,数字,汉字,下划线,没有特殊意义的标点符号。匹配与之一样的字符 2. 简单的转义字符 | | | | | | | \n | 换行 | | \t | 制表符 | | \\\ | 本身 | | \^,\\$,\\{,\\}等等 | 匹配本身 | ?3. 标准字符集合 ...
分类:
其他好文 时间:
2019-12-20 16:38:51
阅读次数:
96
unicode转中文时可以使用json_decode()函数实现。 中文转unicode时需要对字符串转换成UCS-4编码,再转成16进制,再从16进制转换成10进制加上&#前缀来实现中文转unicode编码。 一、unicode转中文 二、中文转unicode ...
分类:
Web程序 时间:
2019-12-19 12:41:02
阅读次数:
102
一、python的基本语法: 1)编码:默认情况下,python3源码文件以UTF-8编码,所有字符串都是Unicode字符串,当然也可以为源码文件指定不同的编码。 如:# -*- coding: cp-1252 -*- 2)标识符:第一个字符必须是字母或下划线_,对大写敏感。 3)python保留 ...
分类:
编程语言 时间:
2019-12-18 14:23:55
阅读次数:
157
#include <iostream> #include <assert.h> #include <fstream> #include <string> #include <string.h> using namespace std; #ifdef _WIN32 #include <Windows.... ...
分类:
编程语言 时间:
2019-12-18 13:14:22
阅读次数:
152
1. 基础语法 python书写时采用缩进方式,缩进四个空格。 2. 注释 可以在代码前加‘#’进行注释。 3. 大小写 python是大小写敏感的语言,一定要注意大小写 4. 数据类型 4.1 整数 同数学上的整数 4.2 浮点数 就是小数 4.3 字符串 是以单引号或者双引号括起来的任意文本。 ...
分类:
编程语言 时间:
2019-12-16 19:39:31
阅读次数:
102
一、yml基本语法 key: value(注意有空格) server: port: 8080 二、值的写法 1、普通值(字面量)数字、字符串、布尔型 字符串默认不用加引号。 双引号不会转义字符串里面的转义字符,单引号会转义。 2、对象 user: username: law gender: male ...
分类:
其他好文 时间:
2019-12-16 17:32:56
阅读次数:
152
一、Golang转义字符 转义字符(escape char) 1.1 常见的转义字符 第一个斜杠表示转义 1.1.1 \t 一个制表位,常用于对齐排版功能 1.1.2 \n 换行符 1.1.3 \r 回车符,\r是不会换行的! 从当前行的顶头开始输出,覆盖掉之前的内容。简而言之:\r后面的内容会覆盖 ...
分类:
其他好文 时间:
2019-12-15 18:36:33
阅读次数:
101
python2内容进行编码(默认ascii),而python3对内容进行编码的默认为utf-8。 ascii: 最多只能用8位来表示(一个字节),即:2**8 = 256(即pow(2,8)=256), 所以,ASCII码最多只能表示256个符号。 unicode:万国码,任何一个字符==两个字节 ...
分类:
其他好文 时间:
2019-12-15 14:26:45
阅读次数:
97
server: port: 8091 servlet: context-path: /spring: datasource: driver-class-name: com.mysql.jdbc.Driver url: jdbc:mysql://localhost:3306/jtdb?serverTi ...
分类:
移动开发 时间:
2019-12-13 21:27:29
阅读次数:
118