码迷,mamicode.com
首页 >  
搜索关键字:python正则表达式    ( 564个结果
我是一只百度贴吧的小爬虫
总体功能:查看特定帖子楼主的发言(不包含图片)前段时间大概看了python的语法,但是确实第一次用python来写东西。很久之前就想学python,学爬虫了,现在终于开始了!谢了自己的第一个爬虫,很开心O(∩_∩)O 觉得学东西兴趣很重要,爬虫真的好玩!整个功能的实现含有两个类,一个是工具类Tool,另一个是百度贴吧的爬虫类BaiduTieba,提取网页的内容主要还是正则表达式。代码如下:# -*-...
分类:其他好文   时间:2015-08-01 19:04:56    阅读次数:251
Python正则表达式小结(1)
学习一段python正则表达式了, 对match、search、findall、finditer等函数作一小结  下面以一段网页为例,用python正则表达式作一个范例: strHtml = ''' ...
分类:编程语言   时间:2015-07-30 13:38:04    阅读次数:130
3.2.1 正则表达式的语法(2)
(?!...)向前识别不等于指定字符就匹配,当下一个单词不等于...时就识别出来括号前面指定的单词。比如Isaac(?!Asimov),就会这样判断,当紧跟着Isaac后面不是单词Asimov时,就把它匹配出来。例子:print('Isaac(?!Asimov)')print(u'abcdAsimovIsaacttttt')m = re.findall(u'Isaac(?!Asimov)', u'...
分类:其他好文   时间:2015-07-26 11:15:40    阅读次数:163
Python - 连续替换(replace)的正则表达式(re)
字符串连续替换, 可以连续使用replace, 也可以使用正则表达式. 正则表达式, 通过字典的样式, key为待替换, value为替换成, 进行一次替换即可.代码# -*- coding: utf-8 -*-import remy_str = "(condition1) and --condition2--" print my_str.replace("condition1", "").rep...
分类:编程语言   时间:2015-07-26 08:38:34    阅读次数:407
Python正则表达式指南
Python正则表达式指南本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌...
分类:编程语言   时间:2015-07-25 22:46:37    阅读次数:244
3.2.1 正则表达式的语法(1)
(?...)这个语法规则是前面的扩展,主要在问号位置可以替换为特定的字符。例子:print('(?...)')m = re.findall(r'(a...)', r'abcdefaghijk')if m:    print(m) 输出结果如下:(?...)['abcd', 'aghi'](?#...)括号内容注释掉,不起作用。在正则表达式分析时,跳过这些规则。例子:print('(?#a)')m ...
分类:其他好文   时间:2015-07-25 10:41:25    阅读次数:208
3.2.1 正则表达式的语法
特别字符集:‘.’点号,在缺省的情况下,可以用来代替任何除换行符之外的字符;如果DOTALL标志设置了,它可以用来代替任何字符,包括换行符。例子:#re import re m = re.findall('a.', 'ab a2 bb a+')if m:    print(m)结果输出如下:['ab', 'a2', 'a+']在这个例子里,先使用import语句导入正则表达式库re,然后使用函数f...
分类:其他好文   时间:2015-07-18 09:36:15    阅读次数:189
python正则表达式基础
#1字符匹配importrer=r‘ab‘printre.findall(r,‘abcdefgabcd‘)#2如果有元字符,注意使用转义符‘\‘r=r‘1\*2‘printre.findall(r,‘01*234501*2345‘)#元字符介绍#3^匹配行首r=r‘^123‘printre.findall(r,‘1234512345‘)#4$匹配行尾r=r‘345$‘printre.findall(r,‘1234512345‘)#5.匹配单..
分类:编程语言   时间:2015-07-17 07:12:02    阅读次数:212
3.2 re--正则表达式操作(Regular expression operations)
本模块提供了正则表达式的匹配操作,它的功能跟Perl语言里的功能一样。 无论是Unicode字符串还是单字节8位组成的字符串,都可以使用模式匹配和字符串查找的功能。不过要注意的是Unicode字符串与8位的字符串不能混合使用,也就是说你不能在Unicode里去匹配单字节的模式,或者其它查找的功能。同样也不能在不同类型的字符串里相互替换字符串。 正则表达式使用反斜线(‘\’)来指定特定的格式的意义,...
分类:其他好文   时间:2015-07-12 08:25:19    阅读次数:190
Python将一个大文件按段落分隔为多个小文件的简单方法
今天帮同学处理一点语料。语料文件有点大,并且是以连续两个换行符作为段落标志,他想把它按段落分隔成多个小文件,即每3个段落组成一个新文件。由于以前没有遇到过类似的操作,在网上找了一些相似的方法,看起来都有点复杂。所以经尝试,自己写了一段代码,完美解决问题。 基本思路是,由先读原文件内容,并使用正则表达式,依据\n\n进行切片处理,结果为一个列表,其中每一个列表元素都存放一个切片中的内容;然后创建一个...
分类:编程语言   时间:2015-07-08 02:08:10    阅读次数:173
564条   上一页 1 ... 45 46 47 48 49 ... 57 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!