前言:写这篇文章之前,主要是我看了几篇类似的爬虫写法,有的是用的队列来写,感觉不是很直观,还有的只有一个请求然后进行页面解析,根本就没有自动爬起来这也叫爬虫?因此我结合自己的思路写了一下简单的爬虫,测试用例就是自动抓取我的博客网站(http://www.zifangsky.cn)..
分类:
编程语言 时间:
2015-12-29 16:23:25
阅读次数:
297
先放出测试代码,然后再对几个关键点进行简单解释packagetest;
importjava.util.regex.Matcher;
importjava.util.regex.Pattern;
publicclassTest1{
publicstaticvoidmain(String[]args){
Stringstr1="<ahref=\"http://www.zifangsky.cn/2015/10/hello-world/\"title=..
分类:
编程语言 时间:
2015-12-28 18:48:05
阅读次数:
330
在日常开发中,往往牵涉到用户输入时,我们都会进行一下用户输入参数合法性判断,这就需要用到我们今天讨论的正则表达式知识,我将日常我们经常使用的正则表达式判断,整理打了一个JAR包,方便我们日后开发使用,JAR包下载地址:http://pan.baidu.com/s/1i3TrH5N;JAR包中方法.....
分类:
编程语言 时间:
2015-12-22 16:02:26
阅读次数:
238
一、正则表达式术语1)元字符 : 非一般字符,具有某种意义的字符。如 : \bX : \b边界符, 以 X开始的单词 2) 常用 : \d : 匹配一个数字 : \d , 匹配至少一个以上数字 \d+ \b : 单词边界符 , 如 \bhe 则匹配以he开头的单词, hello等 \w :与"...
分类:
编程语言 时间:
2015-12-21 00:07:17
阅读次数:
290
1、首先是说明一些容易混淆的符号\w Matches any word character.\W Matches any non-word character.如果是在java中的话,需要双引号 \\w 才可以;而且这里需要注意大小写区分\s 是代表空格The*character is a quan...
分类:
编程语言 时间:
2015-12-18 18:15:18
阅读次数:
124
原文地址译者序(下载代码) 正则表达式善于处理文本,对匹配、搜索和替换等操作都有意想不到的作用。正因如此,正则表达式现在是作为程序员七种基本技能之一*,因此学习和使用它在工作中都能达到很高的效率。 正则表达式应用于程序设计语言中,首次是出现在 Perl 语言,这也让 Perl 奠定了正则表达式旗.....
分类:
编程语言 时间:
2015-12-18 16:33:37
阅读次数:
223
概述做日志分析工作的经常需要跟成千上万的日志条目打交道,为了在庞大的数据量中找到特定模式的数据,常常需要编写很多复杂的正则表达式。例如枚举出日志文件中不包含某个特定字符串的条目,找出不以某个特定字符串打头的条目,等等。使用否定式前瞻正则表达式中有前瞻(Lookahead)和后顾(Lookbehind...
分类:
编程语言 时间:
2015-12-16 09:33:26
阅读次数:
207
这一章节我们来讨论一下Pattern和Matcher。之前我们都是简单的使用正则表达式来匹配字符串,其实java里面提供了强大的正则匹配类,我们下面将以几个例子来说明。package com.ray.ch11;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public...
分类:
编程语言 时间:
2015-12-02 22:50:27
阅读次数:
383
这一章节我们会简要的介绍一下正则表达式的基本语法。我们的目的不是写出最复杂的表达式,是写出能够完成任务的表达式。1.字符字符意义\t制表符\n换行\r回车\f换页\e转义\xhh十六进制\uhhhhunicode十六进制2.字符类字符类意义.任意字符[abc]包含abc的任意字符[^abc]不包含abc的任意字符[a-zA-z]a-z的大小写任意字符[abc[ijk]]跟a|b|c|i|j|k的意...
分类:
编程语言 时间:
2015-12-02 12:38:04
阅读次数:
178
这一章节我们来感受一下正则表达式。正则表达式就是以某种形式来描述字符串。注意:在java里面正则表达式的反斜杠需要"\\"来描述,如果是普通的反斜杠,需要“\\\\”来描述。在字符串中,可以使用正则的方法有几个,分别是matches、split还有replaceAll1.matches方法下面只是举一些例子,让大家感觉一下正在表达式。package com.ray.ch11;
public cl...
分类:
编程语言 时间:
2015-12-02 10:36:51
阅读次数:
188