1.pyquery简介
python中的pyquery模块语法与jquery相近,可用来解析HTML文件。官方文档地址:https://pythonhosted.org/pyquery/ 。通过HTML中的标签、id、给定的索引等来获取元素,使得解析HTML文件极为方便。
2.实例
2.1 爬取豆瓣电影页面中主演
右键chrome中的审查元素,观察到主演的标...
分类:
编程语言 时间:
2014-07-22 23:02:54
阅读次数:
455
最近在做的两个项目,都需要使用Restful Api,接口的安全性和访问控制便成为一个问题,看了一下别家的API访问控制办法。
新浪的API访问控制使用的是AccessToken,有两种方式来使用该AccessToken:
1、API请求 URL 的后面加上一个AccessToken
2、Http头里面加一个字段AccessToken=xxx
这种AccessToken是写死在程序里面的,...
form表单的使用
<!--
标签名称:form 表单标签
属性:action:提交的去向,目标地址的url
method:设置提交请求的方式,get和post;默认为get
get和post提交有什么区别?------------------------
get传输:将内容信息放在地址栏传输,而且长度限制在1k,而且安全性不好。
post传输:将内容房子body信...
分类:
Web程序 时间:
2014-07-22 23:01:15
阅读次数:
359
原文地址:http://www.jbxue.com/article/15175.html一个批处理脚本,用于系统补丁的安装。安装好操作系统后花费时间最长的就是下载补丁安装补丁了,往往下载补丁安装补丁都花去了大半天的事情,下面介绍一种快速安装系统补丁的两种办法.:方法1:用360安全卫士下载下最新的系...
分类:
其他好文 时间:
2014-07-22 23:01:12
阅读次数:
285
帮朋友抓取微信公众平台的用户评论信息。只说核心的部分,怎么解析评论信息。
查看HTML代码,没有发现关于评论部分的标签。看了是用JS动态生成的,但是查找ajax请求也没有找到。最后搜索一下,原来是在这里:
wx.cgiData = {
total_count : 91,
latest_msg_id : '200325222...
分类:
微信 时间:
2014-07-22 22:59:35
阅读次数:
4934
今天来讲如何利用Python爬虫下载文章,拿韩寒的博客为例来一步一步进行详细探讨。。。
韩寒的博客地址是:http://blog.sina.com.cn/s/articlelist_1191258123_0_1.html
可以看出左边是文章列表,而且不止一页,我们先从最简单的开始,先对一篇文章进行下载,再研究对一页所有的文
章进行下载,最后再研究对所有的文章下载。...
分类:
编程语言 时间:
2014-07-22 22:59:35
阅读次数:
330
本文介绍如何配置SSAS数据库和cube相关维度的安全设置。
分类:
数据库 时间:
2014-05-02 00:23:41
阅读次数:
527
工具篇《10款用于网络发现和绘图的安全工具》《绿盟科技分析报告:DDoS兵器谱2014Q1版》《Nmap从探测到漏洞利用备忘录 –
Nmap简介(一)》知识篇《安全科普:流量劫持能有多大危害?》《安全科普:详解流量劫持的形成原因》
分类:
其他好文 时间:
2014-05-02 00:03:50
阅读次数:
348
SPDY 是什么 ? SPDY 是 Google 开发的基于传输控制协议 (TCP)
的应用层协议。SPDY 协议旨在通过压缩、多路复用和优先级来缩短网页的加载时间和提高安全性。(SPDY 是 Speedy 的昵音,意思是更快) SPDY
协议只是在性能上对 HTTP 做了很大的优化,其核心思想是尽...
分类:
其他好文 时间:
2014-05-01 22:23:01
阅读次数:
472