今天在用scrapy爬某个网站的数据,其中DOM解析我用的是BeautifulSoup,速度上没有XPath来得快,不过因为用了习惯了,所以一直用的bs,版本是bs4不过在爬取过程中遇到了一些问题,其中一个是Unicode转码问题,这也算是python中一个著名问题了。我遇到的算是Beautiful...
分类:
其他好文 时间:
2014-07-22 22:53:55
阅读次数:
229
$dom?=?new?DOMDocument?(?‘1.0‘,?‘gbk‘?);
????$dom->formatOutput?=?true;
????$comment_str?=?‘?file?create?time:?‘?.?date(‘Y-m-d?H:i:s‘,?time())??.?‘?by?tree....
分类:
Web程序 时间:
2014-07-22 08:34:33
阅读次数:
237
凝视 在DOM中,用 Comment 类型 节点表示, 构造器函数为: function Comment(){[native code]}.comment 节点的特征:nodeType:8nodeName:#comment,nodeValue: 凝视的内容,parsentNode: 可能是Eleme...
分类:
编程语言 时间:
2014-07-21 10:02:53
阅读次数:
269
async与script动态加载都能使文件异步加载,本文叙述它们对页面渲染和load加载的影响方面。目前我用demo.js作为执行文件操作.代码:var now = function() { return +(new Date()); }var t_s = now();while(now() - t...
分类:
Web程序 时间:
2014-07-21 10:02:47
阅读次数:
330
一、DOM操作慢的本质原因文档对象模型(DOM)是一个与语言无关的,用于操作XML和HTML文档的应用程序接口。DOM在浏览器中的接口是用JavaScript实现的。浏览器通常会把DOM和JavaScript独立实现。(1)在IE中,JavaScript的实现名为JScript,位于jscript....
分类:
其他好文 时间:
2014-07-19 23:21:15
阅读次数:
285
在JS原生里面,没有提供insertAfter这个方法,不过我们可以利用appendChild、insertBefore、parentNode这些方法创建一个insertAfter方法,代码如下:function insertAfter(newElement,targetElement){ ...
分类:
编程语言 时间:
2014-07-19 19:09:30
阅读次数:
207
Waits目前大部分Web应用都使用的是AJAX技术。当一个页面被加载到浏览器时,这个页面的元素可能在不同时间段进行加载。 如果元素不存在与DOM中,将很难被定位到并将会报出ElementNotVisibleException 异常。我们可以使用waits来解决这个问题。Waiting 操作执行之间...
分类:
其他好文 时间:
2014-07-19 18:02:41
阅读次数:
211
一、PHP DOM1、 主要类: DOMDocument :文档类—— $dom->new DOMDocument('1.0','gb2312') DOMNodeList :节点列表类——$dom->getElementsByTagName('') DOMElement :元素类——$d...
分类:
Web程序 时间:
2014-07-19 17:08:47
阅读次数:
254
Ext中的get、getDom、getCmp、getBody、getDoc的区别Ext中包含了几个以get开头的方法,这些方法可以用来得到文档中DOM、得到当前文档中的组件、得到Ext元素等,在使用中要注意区别使用。◇get方法get方法用来得到一个Ext元素,也就是类型为Ext.Element的对...
分类:
其他好文 时间:
2014-07-19 14:01:56
阅读次数:
247
最新在做公司的一个项目,需要实现一个敲打代码的动画效果,粗意味比较简单,果断自己直接开写,写着写着发现是一个坑。需要支持语法高亮,并不能直接简单的用setTimeout来动态附件innerHTML。苦思猛想数小时后,果断用动态生成DOM的方法实现了整个效果。typing.js的打印效果甚至能够支持表...
分类:
Web程序 时间:
2014-07-18 12:17:54
阅读次数:
307