加载html时,会在data/应用下生成database和cache两个文件夹;请求的url存在webviewcache.db下面,url的内容保存在webviewCache下面, Webview的两种缓存:网页数据缓存(存储打开的页面及资源),另一种则是h5转存,即appcache; 一、网页缓存 ...
分类:
移动开发 时间:
2016-06-01 12:57:36
阅读次数:
240
1. 注册账号 打开神箭手官网(http://www.shenjianshou.cn/),注册一个账号: 2.获取采集规则 点击官网首页右上角的“云市场”,在市场里免费获取采集规则: 3.采集数据 1) 进入“管理控制台”; 2) 新建任务(“我的任务”->“创建爬虫任务”->选择刚获取的规则(模板 ...
分类:
Web程序 时间:
2016-05-24 14:56:19
阅读次数:
460
1. 注册账号 打开神箭手官网(http://www.shenjianshou.cn/),注册一个账号: 2.获取采集规则 点击官网首页右上角的“云市场”,在市场里免费获取采集规则: 3.采集数据 1) 进入“管理控制台”; 2) 新建任务(“我的任务”->“创建爬虫任务”->选择刚获取的规则(模板 ...
分类:
Web程序 时间:
2016-05-23 16:42:41
阅读次数:
668
云采集使用教程(发布到WeCenter) 1. 注册账号 打开神箭手官网(http://www.shenjianshou.cn/),注册一个账号: 2.获取采集规则 点击官网首页右上角的“云市场”,在市场里免费获取采集规则: 3.采集数据 1) 进入“管理控制台”; 2) 新建任务(“我的任务”-> ...
分类:
Web程序 时间:
2016-05-21 11:43:09
阅读次数:
477
对比分析目前市场上主流的六大网页数据采集器,对他们各自的特色进行总结。对需要进行数据采集的人来说帮助很大。 ...
分类:
Web程序 时间:
2016-05-20 19:31:10
阅读次数:
221
本文前言:方法来至Excel图表之道这本数,偶然看到,好久没出数据分析的文章了,也难怪最近几个月都忙作网页,数据分析自己也就用excell和sql 正文: 带象限的散点图效果如下: 看到图片,这里制作的是带名称的四象限散点图,首先先绘制散点图,然后通过在X和Y轴的格式中设置刻度的最大值和最小值,可以 ...
分类:
其他好文 时间:
2016-05-20 11:31:25
阅读次数:
5012
在上一篇python使用xslt提取网页数据中,要提取的内容是直接从网页的source code里拿到的。 但是对于一些Ajax或动态html, 很多时候要提取的内容是在source code找不到的,这种情况就要想办法把异步或动态加载的内容提取出来。 python中可以使用selenium执行ja ...
分类:
编程语言 时间:
2016-05-20 11:22:37
阅读次数:
240
在上一篇python使用xslt提取网页数据中,要提取的内容是直接从网页的sourcecode里拿到的。但是对于一些Ajax或动态html,很多时候要提取的内容是在sourcecode找不到的,这种情况就要想办法把异步或动态加载的内容提取出来。python中可以使用selenium执行javascript,selenium可以..
分类:
编程语言 时间:
2016-05-19 19:39:00
阅读次数:
231
在python使用xslt提取网页数据一文中,使用xslt来提取目标网页上的内容。示例的小程序,直接把一长段xslt赋值给变量。原文没有讲这一段xslt是怎么来的。有的网友有疑问,这个xslt这么长,编写不是要花很长时间?实际情况是,这个xslt是通过GooSeeker谋数台的直观标注来自动生成..
分类:
Web程序 时间:
2016-05-19 19:36:49
阅读次数:
172
lxml是python的一个库,可以迅速、灵活地处理XML。它支持XMLPathLanguage(XPath)和ExtensibleStylesheetLanguageTransformation(XSLT),并且实现了常见的ElementTreeAPI。这2天测试了一下在python中通过xslt来提取网页内容,记录如下:1.要提取集搜客官网旧版论坛的帖子标题和..
分类:
编程语言 时间:
2016-05-16 20:10:17
阅读次数:
265