码迷,mamicode.com
首页 > 其他好文 > 详细

【网络爬虫】 预备知识

时间:2014-12-03 18:50:29      阅读:213      评论:0      收藏:0      [点我收藏+]

标签:使用   sp   数据   问题   bs   nbsp   网络   11   搜索   

【网络爬虫】 预备知识

 一. 正则表达式之常用表达式

 正则表达式里有很多东西,学精不易,但做爬虫不需要学精,只要会其中部分就行,下面将介绍本人常用的表达式,基本够用了。

 1. 去头去尾 --- (?<=...)...(?=...)

 该表达式是本人用的最多的,如题意,去头去尾匹配中间,匹配单条数据时非常好用,正则好写,容易理解,且匹配出来的东西就是想要的

 2. 分组 ---(?<组名>...)...

 该表达式主要用在用一个正则匹配多条数据时使用

 会了上面2个基本就没问题了

二. 抓包工具,做爬虫这是至关重要的,没有工具基本是做不出来的

 这里推荐 ie11 自带的 F12。

 目前还没发现抓不到的包,而且自带搜索功能也很给力

 

【网络爬虫】 预备知识

标签:使用   sp   数据   问题   bs   nbsp   网络   11   搜索   

原文地址:http://www.cnblogs.com/fzz2727551894/p/4140646.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!