[Python爬虫] 之二十六:Selenium +phantomjs 利用 pyquery抓取智能电视网站图片信息 ...
分类:
编程语言 时间:
2017-06-23 12:57:45
阅读次数:
244
[Python爬虫] 之十九:Selenium +phantomjs 利用 pyquery抓取超级TV网数据 ...
分类:
编程语言 时间:
2017-06-20 15:29:41
阅读次数:
237
一直听同事说Python是个奇妙的语言,上周在逛知乎的时候深受这个话题的启示。 能利用爬虫技术做到哪些非常酷非常有趣非常实用的事情? 先是说到IDE的选择,作为python新人,尽管知道mac终端自带Python,但在一番谷歌百度之后,还是选择了PyCharm 。理由大概是 PyCharm比較像xc ...
分类:
编程语言 时间:
2017-05-25 20:47:07
阅读次数:
171
pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,使用方法: 代码如下: from pyquery import PyQuery as pq 1、可加载一段HTML字符串,或一个HTML文件,或是一个url地址,例: 代码如下: d = pq("<html><title ...
分类:
编程语言 时间:
2017-05-08 14:28:20
阅读次数:
252
如果熟悉jquery,那么使用pyquery进行网页信息提取将会是非常方便的,因为语法都是一样的 1、字符串初始化 2、url和文件初始化 3、CSS选择器 4、子元素 5、父元素 6、兄弟节点 7、遍历元素 8、获取属性 9、获取文本,这里跟beautifulsoup一样 10、获取html 11 ...
分类:
编程语言 时间:
2017-04-14 14:17:23
阅读次数:
216
前言 你是否觉得 XPath 的用法多少有点晦涩难记呢? 你是否觉得 BeautifulSoup 的语法多少有些悭吝难懂呢? 你是否甚至还在苦苦研究正则表达式却因为少些了一个点而抓狂呢? 你是否已经有了一些前端基础了解选择器却与另外一些奇怪的选择器语法混淆了呢? 嗯,那么,前端大大们的福音来了,Py ...
分类:
编程语言 时间:
2017-02-08 22:38:54
阅读次数:
275
windows 64位操作系统下,用 Python 抓取网页,并用 pyQuery 解析网页 但是用pip命令安装pyquey的时候,报错了 提示需要先安装 lxml ,于是用如下命令安装 lxml 报错 查资料,知乎上找到如下解决方案:https://www.zhihu.com/question/ ...
分类:
编程语言 时间:
2016-12-24 13:59:18
阅读次数:
886
之前用python写爬虫,都是自己用requests库请求,beautifulsoup(pyquery、lxml等)解析。没有用过高大上的框架。早就听说过Scrapy,一直想研究一下。下面记录一下我学习使用Scrapy的系列代码及笔记。 安装 Scrapy的安装很简单,官方文档也有详细的说明 htt ...
分类:
其他好文 时间:
2016-12-20 20:16:02
阅读次数:
435
本系列文章主要记录和讲解pyspider的示例代码,希望能抛砖引玉。pyspider示例代码官方网站是http://demo.pyspider.org/。上面的示例代码太多,无从下手。因此本人找出一下比较经典的示例进行简单讲解,希望对新手有一些帮助。 示例说明: 本示例主要是PyQuery解析返回的 ...
分类:
其他好文 时间:
2016-11-29 06:55:31
阅读次数:
247
安装pyquery之前首先要明确一点,easyinstall 是一款python包管理器,类似于node的npm,用于安装python的扩展包,它安装的包是以*.egg的方式。 要安装pq需要经历以下步骤: 1:下载easyinstall 官网 设置环境变量,将python目录加入path,在cmd ...
分类:
编程语言 时间:
2016-11-27 08:04:01
阅读次数:
326