码迷,mamicode.com
首页 >  
搜索关键字:preg_replace 正则表达式    ( 15690个结果
使用正则表达式提取网页有效信息
从HTML页面提取内容所面临的主要问题是,我们必须寻找一种方法精确地识别出自己想要的那一部分内容。以下是利用正则表达式匹配并提取网页中特定信息的方法:采集网页中所有链接标记:]*?>[\s\S]*?以上可以修改a标记采集对应的标记元素。采集图片:]*?/?>以上可以修改img标记采集对应的标记元素。...
分类:Web程序   时间:2014-05-26 19:12:12    阅读次数:288
利用Python进行数据分析——数据规整化:清理、转换、合并、重塑(七)(5)
Python能够成为流行的数据处理语言,部分原因是其简单易用的字符串和文本处理功能。大部分文本运算都直接做成了字符串对象的内置方法。对于更为复杂的模式匹配和文本操作,则可能需要用到正则表达式。pandas对此进行了加强,它使你能够对数组数据应用字符串表达式和正则表达式,而且能处理烦人的缺失数据。...
分类:编程语言   时间:2014-05-26 03:42:44    阅读次数:443
正则表达式中$1,$2 ===算是什么意思
能举个例子吗?我也知道是括号里面取得值 但是哪个和哪个括号不清楚 还有是小括号中括号大括号也不清楚 能举个实例吗?$1,$2...是表示的小括号里的内容 $1是第一个小括号里的 ,$2是第2个小括号里的 比如 /gai([\w]+?)over([\d]+)/ 匹配 gainover123 $1= 括...
分类:其他好文   时间:2014-05-26 00:04:22    阅读次数:282
python实现图片爬虫
#encoding:utf-8 import sys reload(sys) sys.setdefaultencoding('utf8') from sgmllib import SGMLParser import re import urllib class URLLister(SGMLParser): def start_a(self, attrs): url = [v ...
分类:编程语言   时间:2014-05-25 22:47:56    阅读次数:340
Java实现敏感词过滤
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢。我把它程序拿过来一看,整个过程如下:读取敏感词库、如果HashSet集合中,获取页面上传文字,然后进行匹配。我就想这个过程肯定是非常慢的。对于他这个没有接触的人来说我想也只能想到这个,更高级点就是正则表达式。但是非常...
分类:编程语言   时间:2014-05-25 21:26:01    阅读次数:386
0524.深入浅出理解iOS常用的正则表达式—基础篇[Foundation]
参考资料:cocoachina的zys475481075的文章   几个单词   Regular  ['regj?l?] adj. 定期的;有规律的 Expression [?k'spre?(?)n; ek-] n. 表现,表示 Regular expression 正则表达式   什么是正则表达式?     用一个描述字符串去验证另一个字符串是否符合描...
分类:移动开发   时间:2014-05-25 16:17:20    阅读次数:270
Javascript正则表达式
正则表达式正则用来从字符串筛选出子字符串。简单使用编辑器搜索时,勾选上正则,可以搜索出满足特定条件的结果。\bfunction\b这样可以搜索出function单词。做搜索功能时 var reg = new RegExp(inpStr); apps.forEach(function (v, i).....
分类:编程语言   时间:2014-05-25 16:05:08    阅读次数:272
javascript 正则表达式
一、基础javascript允许你通过以下两种方式创建RegExp对象,1)直接量。2)使用RegExp()varpattern=/java$/;//直接量创建 varpattern=newRegExp("java$"); 二、元字符 正则表达式中,字母和数字都是按照字面意思进行匹配的,同时javascript也支持非字母的..
分类:编程语言   时间:2014-05-25 04:56:22    阅读次数:462
grep、egrep
正则表达式是基于样式匹配的进行文本处理,透过一些特殊符号的辅助,可以达到搜寻、删除、取代某特定的字符串。 grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。 ..
分类:其他好文   时间:2014-05-24 16:58:02    阅读次数:270
常见正则表达式
PHP常用表达式用法1.匹配正整数:/^[1-9]\d*$/2.匹配非负整数(正整数+0):/^\d+$/3.匹配中文:/^[\x{4e00}-\x{9fa5}]+$/u4.匹配Email:/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*/5.匹配网址URL...
分类:其他好文   时间:2014-05-24 09:12:52    阅读次数:282
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!