正则表达式解析 常用正则表达式回顾: Xpath解析 XPath在Python的爬虫学习中,起着举足轻重的地位,对比正则表达式 re两者可以完成同样的工作,实现的功能也差不多,但XPath明显比re具有优势,在网页分析上使re退居二线。 常用xpath表达式 代码中使用xpath表达式进行数据解析 ...
分类:
其他好文 时间:
2019-01-22 23:00:46
阅读次数:
179
一.正则表达式解析 常用正则表达式回顾: Xpath解析 测试页面数据 ...
分类:
其他好文 时间:
2019-01-22 14:16:21
阅读次数:
176
[regexp]core.zh='[\u4e00-\u9fa5]'core.mb='[^\x00-\xff]'core.email='\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}'core.url='((https|http|ftp|r ...
分类:
其他好文 时间:
2019-01-15 21:07:36
阅读次数:
187
/// <summary> /// 判断string类型否为数字 /// </summary> /// <param name="strNumber"></param> /// <returns></returns> public static bool IsNumber(string strNum ...
分类:
Web程序 时间:
2019-01-15 12:01:23
阅读次数:
176
史上最全常用正则表达式大全 很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。给自己留个底,也给朋友们做个参考。 一、校验数字的表达式 1. 数字:^[0-9]*$ 2. n位的数字: ...
分类:
其他好文 时间:
2019-01-14 14:39:50
阅读次数:
132
常用正则表达式 一、校验数字的表达式 数字:^[0-9]*$ n位的数字:^\d{n}$ 至少n位的数字:^\d{n,}$ m-n位的数字:^\d{m,n}$ 零和非零开头的数字:^(0|[1-9][0-9]*)$ 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(\.[0-9]{1, ...
分类:
其他好文 时间:
2019-01-12 10:32:15
阅读次数:
160
平时在开发过程中,正则验证总是少不了的,每次都要去网上找一些正则表达式,比较麻烦。今天整理一些常用的正则表达式,以做备用。 一、数字相关表达式 1. 至少n位数字 ^\d{n,}$ 2. m-n位的数字:^\d{m,n}$ 3. 最多保留两位小数的数字:^[0-9]+(\.[0-9]{1,2})?$ ...
分类:
其他好文 时间:
2019-01-11 13:09:39
阅读次数:
128
引入 回顾requests实现数据爬取的流程 指定url 基于requests模块发起请求 获取响应对象中的数据 进行持久化存储 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需要进行指定数据解析。因为大多数情况下的需求,我们都会指定去使用聚焦爬虫,也就是爬取页面中指定部分的数据值,而 ...
分类:
编程语言 时间:
2019-01-07 22:44:23
阅读次数:
254
两位整数,两位小数,小数部分可以不输 /^[\d]{1,2}([.]{1}[\d]{1,2})?$/ 手机 /^1[3|4|5|7|8|9][0-9]\d{8}$/ 邮箱 /^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$/ ip ...
分类:
其他好文 时间:
2018-12-20 16:56:42
阅读次数:
109