在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也能分析html结构), 利用其lxml.html的xpath对html进行分析,获取抓取信息:首先,我们需要安装一个支持xpath的python库。目前在libxml2的网站上被...
分类:
编程语言 时间:
2015-04-07 23:03:12
阅读次数:
782
xml解析主要可以使用CData,libxml2以及NSXMLParser,以下对各个方法给出了相应的例子: 1.CDataXML: 1.1.创建FKBook类 #import <Foundation/Foundation.h>
@interface FKBook : NSObject
@property (nonatomic ,...
分类:
移动开发 时间:
2015-04-07 10:11:04
阅读次数:
154
1.XML格式 表示XML文件版本, 内部文本使用的编码 表示根节点北京 一个结点,CityName是结点名,北京结点值 key="1"是结点属性, key属性名, "1"属性值2.如何使用GData开源库实现XML解析 常用的XML解析方式 (1)unix - libxml2 C接口 (2...
分类:
其他好文 时间:
2015-04-05 11:51:36
阅读次数:
124
XML解析及上拉加载下拉刷新1.XML格式 2.GData和XPath遍历//配置XML库(配置完才能使用) //(1)添加头文件搜索路径 // Header Search Paths-> /usr/include/libxml2 //(2)添加二进制库 // Link library...
分类:
其他好文 时间:
2015-04-04 15:04:05
阅读次数:
134
一、安装所需软件包yum -y install gcc gcc-c++ autoconf libjpeg libjpeg-devel libpng libpng-devel freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel g...
分类:
数据库 时间:
2015-04-01 19:01:49
阅读次数:
201
ERROR: /bin/sh: 1: xslt-config: not foundmake sure the development packages of libxml2 and libxslt are installed **参考:http://stackoverflow.com/questio...
分类:
其他好文 时间:
2015-03-18 23:12:08
阅读次数:
175
一、kissXML的github地址 https://github.com/robbiehanson/KissXML二、使用前注意? 项目要导入libxml2.dylib。另运行时提示"libxml/tree.h"找不到,需要在项目的Build Settings搜索Header S,将Header ...
分类:
其他好文 时间:
2015-03-18 11:59:17
阅读次数:
178
安装这个模块坎坷颇多首先确认ubuntu源。。我的版本是14.04.去找了官网的元替换source.list然后apt-getupdate在用pip和easy_install安装LXML的时候会提示少两个包**makesurethedevelopmentpackagesoflibxml2andlibxsltareinstalled**需要安装libxml2和libxslt确保你已经更新了..
分类:
其他好文 时间:
2015-03-17 14:22:33
阅读次数:
165
Lamp准备篇请看前文博客 安装rrdtool工具 这里使用源码安装 解压rrdtool包 配置(编译安装需要gcc等编译程序支持) 注意如果配置出错缺乏libxml2-devel、pango-devel、需要进行自我解决,否则不会成功。 配置完成 编译和安装 Make &&make install...
分类:
其他好文 时间:
2015-03-15 00:34:34
阅读次数:
242