CrawlSpider一直无法进入回调函数的 碰到的两个坑: 1、正则表达式写的不对 start_urls = ['http://wz.sun0769.com/political/index/politicsNewest?id=1&page=1'] link = LinkExtractor(allo ...
分类:
其他好文 时间:
2020-07-26 01:52:52
阅读次数:
85
版权 由于服务器升级内存(4g升级到48G),需要调整oracle 参数。 sga 调整参数具体大小根据实际业务情况,自己搞定。我的这个sga参数比较呵呵 下面是详细操作步骤(经过实践证明OK的): 1.关闭数据库以及准备工作 关掉 所有业务连接: ps -ef|grep LOCAL=NO|grep ...
分类:
数据库 时间:
2020-07-26 01:07:50
阅读次数:
102
= :精确匹配(必须全部相等) ~ :大小写敏感 ~* :忽略大小写 ^~ :只需匹配uri部分,不匹配正则表达式。 @ :内部服务跳转 匹配顺序: = > ^~ > ~* > /document/ > / request / :A request /index.html :B request /d ...
分类:
其他好文 时间:
2020-07-26 01:00:55
阅读次数:
62
正则表达式 一说规则我已经知道你很晕了,现在就让我们先来看一些实际的应用。在线测试工具 http://tool.chinaz.com/regex/ 正则表达式测试工具 正则表达式本身也和python没有什么关系,就是匹配字符串内容的一种规则。 官方定义:正则表达式是对字符串操作的一种逻辑公式,就是用 ...
分类:
编程语言 时间:
2020-07-26 00:48:23
阅读次数:
76
python 网页解析器 1、常见的python网页解析工具有:re正则匹配、python自带的html.parser模块、第三方库BeautifulSoup(重点学习)以及lxm库。 2、常见网页解析器分类 (1)模糊匹配 :re正则表达式即为字符串式的模糊匹配模式; (2)结构化解析: Beat ...
分类:
编程语言 时间:
2020-07-26 00:29:13
阅读次数:
83
用正则表达式,去除无效字符非常简单。让我们看一个例子 const str = "https://en.wikipedia.org/" str.replace(/[<>|:"*?\\/]+/g, '') // => "httpsen.wikipedia.org" [] 称为字符类,JS 会把字符串与方 ...
分类:
其他好文 时间:
2020-07-26 00:22:37
阅读次数:
73
基本的cd、pwd、ls、cp、mv之类的就不写了 1.grep命令 在指定目录下查找包含某个字段的文件 grep “name” XXX -R 在目录XXX里面查找包含“name”字段的文件,-R是递归查找目录。 grep “name” * -R 在当前目录下的所有文件目录里面查找包含"name"字 ...
分类:
系统相关 时间:
2020-07-24 22:01:17
阅读次数:
113
reg_test.cpp内容如下: #include <vector> #include <fmt/format.h> #include <console_color.h> #include <re2/re2.h> using namespace re2; using namespace std; ...
分类:
其他好文 时间:
2020-07-24 21:48:06
阅读次数:
101
[root@localhost src]# rpm -qa|grep grafanagrafana-7.1.0-1.x86_64[root@localhost src]# rpm -ql grafana-7.1.0-1.x86_64 |more/etc/grafana/etc/init.d/graf ...
分类:
其他好文 时间:
2020-07-24 21:11:30
阅读次数:
76
问题 在我们查看很多配置文件的时候都会有一大堆注释影响我们阅读配置,我们可以采取下面的方法过滤掉注释进行阅读: cat server.properties |grep -v "#" 这样就只会查看到配置,不会看到注释 ...
分类:
系统相关 时间:
2020-07-24 15:59:43
阅读次数:
111