码迷,mamicode.com
首页 > 其他好文 > 详细

xpath简单入门

时间:2018-01-04 11:09:55      阅读:126      评论:0      收藏:0      [点我收藏+]

标签:pos   post   contains   导入   简单   lis   img   inf   url   

技术分享图片

语法:

选取节点:

技术分享图片

实例:

技术分享图片

 

 技术分享图片

技术分享图片

技术分享图片(贴图转载自w3school)


 

补充:

/a/@href        #获取a标签的href属性

当<div class="demo"></div>种情况的时候我们可以写成/div[@class="demo"]

但如果是

<div class="demo1 demo2 demo3"></div>

这种情况我们如果匹配demo2就不能直接用等于的方法

可以用/div[contains(@class,‘demo2‘)]

如果选择demo2和demo3

可以用/div[contains(@class,‘demo2‘) and contains(@class,‘demo3‘)]

/*网上的一个相关解答还有一个*/

如果目标Class不一定是第一个,那么

//div[contains(concat(‘ ‘,@class,‘ ‘),‘demo‘)]

 没看明白,但是暂且保留


 

python下用lxml模块

导入的时候只需要一个etree来接收就可以

import ...

from lxml import etree

...

html = urllib.request.urlopen(url)

content = etree.HTML(html)

cont_list = content.xpath(‘/div[@class="test"]‘)

//cont_list接收的是一个匹配成功的列表

xpath简单入门

标签:pos   post   contains   导入   简单   lis   img   inf   url   

原文地址:https://www.cnblogs.com/lawliet-y/p/8191317.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!