首页 > 编程语言 > 详细

R语言爬虫：CSS方法与XPath方法对比（表格介绍）

时间：2018-01-18 17:21:42 阅读：141 评论：0 收藏：0 [点我收藏+]

标签：标题 eve tab 三级爬虫无法 value nta api

css 选择器与 xpath 用法对比

目标	匹配节点	CSS 3	XPath
所有节点	`~`	`*`	`//*`
查找一级、二级、三级标题节点	`<h1>`,`<h2>`,`<h3>`	`h1`,`h2`,`h3`	`//h1`,`//h2`,`//h3`
所有的P节点	`<p>`	`p`	`//p`
p节点的所有子节点	`<p>`标签下的所有节点	`p > *`	`//p/*`
查找所有包含attr属性的li标签	`<li attr="~">`	`li[attr]`	`li[@attr]`
查找所有attr值为value的li标签	`<li attr="value">`	`li[attr=value]`	`//li[@attr=‘value‘]`
查找id值为item的所有div节点	`<div id="item">`	`div#item`	`//div[@id=‘item‘]`
查找class值中包含foo的所有标签	`<* class="foo blahblah">`	`.foo`	`//*[contains(@class,‘foo‘)]`
第一个P节点	众多`<p>`中的第一个 `<p>`	`p:first-child`	`//p[1]`
第n个P节点	众多`<p>`中的第n个 `<p>`	`p:nth-child`	`//p[n]`
拥有子节点a的所有P节点	`<p><a></p>`	css无法实现	`//p[a]`
查找文本内容是“Web Scraping”的p节点	`<p>Web Scraping</p>`	css无法实现	`//p[text()="Web Scraping"]`

R语言爬虫：CSS方法与XPath方法对比（表格介绍）

标签：标题 eve tab 三级爬虫无法 value nta api

原文地址：https://www.cnblogs.com/xihehe/p/8310190.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！