二元字符 . 、^ 、$、 + 、 ?、 {}、 [] 、 |、 () 、 \ . 匹配除换行符以外的任意字符,只能匹配一次 >>> re.findall('bot.x','sdqwoiujbotwx') >> ['botwx'] ^ 匹配字符串的开始 ,在中间匹配不出来 >>>re.findall ...
分类:
其他好文 时间:
2017-09-09 13:00:14
阅读次数:
175
1,正则表达提取 (findall函数提取) import re a= "<div class='content'>你大爷</div>"x=re.findall("<div class='content'>(.*)</div>",a) print x[0] ...
分类:
编程语言 时间:
2017-09-07 13:24:14
阅读次数:
135
!只用于学习用途! plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html) :获得商品价格和view_price字段,并保存在plt中 tlt = re.findall(r'\"raw_title\"\:\".*?\"',html) :获得商品名称 ...
分类:
编程语言 时间:
2017-09-06 18:27:28
阅读次数:
170
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码。这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件。 什么是xml? xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进 ...
分类:
编程语言 时间:
2017-09-01 21:18:59
阅读次数:
167
前言: 这是一篇来自整理EVERNOTE的笔记所产生的小博客,实现功能主要为用广度优先算法爬取小故事网,爬满100个链接并写入mysql,虽然CS作为双学位已经修习了三年多了,但不仅理论知识一般,动手能力也很差,在学习的空余时间前前后后DEBUG了很多次,下面给出源代码及所遇到的BUG。 本博客参照 ...
分类:
数据库 时间:
2017-09-01 00:02:57
阅读次数:
226
方式有3种:@FindBy、@FindBys、@FindAll。下文对3中类型的区别和使用场景进行介绍 1)@FindBy @FindBy(id= "A") private WebElement A; 多个元素用FindBy也可以 @FindBy(id = "userName") private L ...
分类:
数据库 时间:
2017-08-29 14:34:59
阅读次数:
459
云图详细解析笔记 说明:本文是参看大牛代码后总结的笔记,不清楚的地方可参看大牛源码 大牛源码地址:https://www.zhihu.com/question/28975391/answer/100796070 生成云图的主要函数为: WordCloud方法里面的generate函数 eg: my_ ...
分类:
其他好文 时间:
2017-08-25 15:50:21
阅读次数:
178
Return all non-overlapping matches of pattern in string, as a list of strings. The string is scanned left-to-right, and matches are returned in the or ...
分类:
其他好文 时间:
2017-08-25 09:39:51
阅读次数:
487
正则是用一些特殊含义的符号组合到一起来描述字符或者字符串的方法。python中内置了re模块。 贪婪匹配与非贪婪匹配 findall :默认为贪婪匹配,就是会匹配字符中所有符合正则条件的结果 当在正则使用?时:例如 :re.findall(a.*?b,aqddddddddda1b) 结果为:aqb ...
分类:
编程语言 时间:
2017-08-24 20:16:47
阅读次数:
196