不管哪门语言中都有括号。正则表达式也是一门语言,而括号的存在使这门语言更为强大。 对括号的使用是否得心应手,是衡量对正则的掌握水平的一个侧面标准。 括号的作用,其实三言两语就能说明白,括号提供了分组,便于我们引用它。 引用某个分组,会有两种情形:在 JavaScript 里引用它,在正则表达式里引用 ...
分类:
其他好文 时间:
2020-05-15 15:14:59
阅读次数:
69
1. 分组 () 包裹的就是分组,可以得到结果,或者进行交换等整体操作 2. 捕获 () 分组默认就是捕获组,(?:) 加上?:,就是非捕获组,只参与匹配,整体结果中会存在,消耗字符,分组不会在结果中,节约性能 3. 环视 (?=) (?!) (?<=) (?<!) 有4种环视,分别可以正向和反向, ...
分类:
其他好文 时间:
2020-05-15 13:55:44
阅读次数:
60
一、小括号()、中括号[]、大括号的区别 1>. 小括号():匹配小括号内的字符串,可以是一个,也可以是多个,常跟“|”(或)符号搭配使用,是多选结构的 示例1:string name = "way2014"; regex:(way|zgw) result:结果是可以匹配出way的,因为是多选结构, ...
分类:
其他好文 时间:
2020-05-15 13:18:42
阅读次数:
81
背景 文本分类属于文本挖掘。文本挖掘从已知文本提取未知的知识,即从非结构的文本中提取知识。文本挖掘主要领域:搜索和信息检索;文本聚类;文本分类;Web挖掘;信息抽取;自然语言处理;概念提取。[1] 搜索和信息检索:存储和文本文档的检索,包括搜索引擎和关键字搜索。 文本聚类:使用聚类方法,对词汇,片段 ...
分类:
其他好文 时间:
2020-05-14 23:50:55
阅读次数:
113
function myFunction(){ //yyyy-mm-dd hh:mm:ss var reDateTime =/^(?:19|20)[0-9][0-9]-(?:(?:0[1-9])|(?:1[0-2]))-(?:(?:[0-2] [1-9])|(?:[1-3][0-1])) (?:(?: ...
分类:
其他好文 时间:
2020-05-14 19:15:17
阅读次数:
265
一、爬虫入门Python爬虫入门一之综述Python爬虫入门二之爬虫基础了解Python爬虫入门三之Urllib库的基本使用Python爬虫入门四之Urllib库的高级用法Python爬虫入门五之URLError异常处理Python爬虫入门六之Cookie的使用Python爬虫入门七之正则表达式二、爬虫实战Python爬虫实战一之爬取糗事百科段子Python爬虫实战二之爬取百度贴吧帖子Python
分类:
其他好文 时间:
2020-05-14 01:46:17
阅读次数:
85
文章推荐 https://www.cnblogs.com/moyand/p/9047978.html 身份验证 尼码,学到和用到之间是 知道 和做到。问题问题问题,解决解决解决,运用运用运用。案例案例案例 想问天问地问问我自己。 整理正则表达式:字符串匹配的模式 ^ 为匹配输入字符串的开始位置。 [ ...
分类:
其他好文 时间:
2020-05-14 01:09:49
阅读次数:
79
1. like 与 regexp比较 like有的功能,regexp都有;regexp还能进行更精确的匹配 -- 模糊匹配两者完全等价 SELECT * FROM rp_dag_sdu_log where task_number like '%rp%'; SELECT * FROM rp_dag_s ...
分类:
数据库 时间:
2020-05-13 15:17:24
阅读次数:
82
1.下载mysql源码 wget https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-boost-5.7.20.tar.gz 2.新建my.cnf文件 [client] port = 3306 default-character-set=utf8 ...
分类:
数据库 时间:
2020-05-13 11:41:21
阅读次数:
94
一般的处理方式,是建立一个正则表达式列表,依次尝试匹配,成功则返回,这种方式往往会遇到性能问题 同样的样本数据, 用传统的newlogp方式仅做re部分,用hp做先定位后匹配,后者有明显的优势 ubuntu@VM-0-13-ubuntu:~/highperf_re$ time python norm ...
分类:
其他好文 时间:
2020-05-13 00:26:43
阅读次数:
71