#!/usr/bin/env python# -*- coding: utf-8 -*-import requests from lxml import etree from selenium import webdriverfrom pymongo import MongoClientfrom s ...
分类:
其他好文 时间:
2019-08-07 10:53:02
阅读次数:
171
```
appdirs==1.4.3
attrs==19.1.0
cached-property==1.5.1
certifi==2019.3.9
chardet==3.0.4
defusedxml==0.5.0
Django==2.1.7
idna==2.8
isodate==0.6.0
lxml... ...
分类:
其他好文 时间:
2019-08-07 09:14:07
阅读次数:
96
案例前提:已安装Python 已安装pip 1、进入官网https://www.lfd.uci.edu/~gohlke/pythonlibs/,搜索lxml库,下载到本地(放到Python目录下的Scripts文件中) 2、打开cmd,键入pip install wheel,先安装wheel库了才能 ...
分类:
编程语言 时间:
2019-08-06 01:08:14
阅读次数:
166
import requests from lxml import etree class TieBa(object): def __init__(self,query_string): self.query_string = query_string self.base_url = 'https:/... ...
分类:
其他好文 时间:
2019-08-05 13:50:39
阅读次数:
102
使用requests来打开URL地址,获取编码为utf-8 得到的标签或信息在显示时用gb18030来显示。 ...
分类:
编程语言 时间:
2019-08-03 13:11:30
阅读次数:
101
我本人比较喜欢蜡笔小新,这个实例批量下载蜡笔小新图片 源码分析:所有图片包含在class为searchbqppdiv tagbqppdiv的div下的a标签的src属性中 思路:获取源码,提取数据,下载图片 目标地址:https://www.fabiaoqing.com/ requests+lxml ...
分类:
其他好文 时间:
2019-08-02 00:29:42
阅读次数:
154
抓取下网页代码之后,下一步就是从网页中提取信息,提取信息的方式有多种多样,可以使用正则来提取,但是写起来会相对比较繁琐。在这里还有许多强大的解析库,如LXML、BeautifulSoup、PyQuery等等,提供了非常强大的解析方法,如XPath解析、CSS选择器解析等等,利用它们我们可以高效便捷地从从网页中提取出有效信息。本节我们就来介绍一下这些库的安装过程。1.2.1LXML的安装LXML是P
分类:
数据库 时间:
2019-07-30 09:16:22
阅读次数:
161
python 常用的模块 面试的过程中经常被问到使用过那些python模块,然后我大脑就出现了一片空白各种模块一顿说,其实一点顺序也没有然后给面试官造成的印象就是自己是否真实的用到这些模块,所以总结下自己实际工作中常用的模块; 时间模块 time datatime 时间模块常用的方法 1.获取时间戳 ...
分类:
编程语言 时间:
2019-07-24 22:46:29
阅读次数:
142
import requestsfrom lxml import etreeimport jsonimport timeclass Toutiao(object): def __init__(self): self.headers = { 'user-agent': 'Mozilla/5.0 (Win ...
分类:
其他好文 时间:
2019-07-24 13:16:33
阅读次数:
97
解决办法: from lxml import etree xml = etree.parse("./cee.xml") root = xml.getroot() print(root.xpath(".//i:Reviews", namespaces={"i":"http://www.bazaarvo ...
分类:
编程语言 时间:
2019-07-23 16:45:37
阅读次数:
945