Python操作mysql数据库 ----基于Red Hat Enterprise Linux Server release 6.4 (Santiago);python 2.6.6 简介:Python标准数据库接口为 Python DB-API,Python DB-API为开发人员提供了数据库应用编程接口。 下面...
分类:
数据库 时间:
2015-08-03 17:09:42
阅读次数:
169
现在,我们已经进入到大数据时代,在对数据进行处理分析时,首要的是需要有数据,而作为数据的一个重要来源则来自于网络爬虫,鉴于Python语言的简洁高效,以及对爬虫技术的大力支持,我们选择利用Python作...
分类:
编程语言 时间:
2015-08-03 17:05:38
阅读次数:
261
Python中,字典是容器,所以可以使用len()方法统计字典中的键值对的个数;字典是可迭代的,迭代的依据是字典中的键。in, not in 等运算符判断指定的键是否在字典中;如果索引一个字典中不存在的键,将会抛出异常KeyError;del d[k]将会删除k对应的键值对,如果d中不存在k,则抛出...
分类:
编程语言 时间:
2015-08-03 16:26:47
阅读次数:
170
添加.gitignore的正确姿势# Windows:Thumbs.dbehthumbs.dbDesktop.ini# Python:*.py[cod]*.so*.egg*.egg-infodistbuild# My configurations:db.inideploy_key_rsa*.clas...
分类:
其他好文 时间:
2015-08-03 16:23:36
阅读次数:
209
之前自己在写一个爬虫项目的时候,用到了多线程的内容;但只是调用了java和python的线程池的库函数,而且没有涉及到多线程的核心内容(最起码连互斥都没有用到)。面试时被问到了相关的内容,回答的不太好,也提醒了自己把这块内容捡起来并夯实一下。学习的原则是从最简单的可以run的demo开始。主要参考了...
分类:
编程语言 时间:
2015-08-03 16:13:55
阅读次数:
274
# -*- coding: utf-8 –*- 目的是告诉Python解释器,用UTF-8编码读取源代码。然后用Notepad++ 另存为... 并选择UTF-8格式保存。 print u‘中文‘(u和中文之间没有空格) print会依次打印每个字符串,遇到逗号“,”会...
分类:
编程语言 时间:
2015-08-03 15:04:56
阅读次数:
134
原文链接:http://www.rabbitmq.com/tutorials/tutorial-five-python.html ????在前面的例子中我们改进了我们的日志系统。使用 fanout 类型的exchage 只能广播消息。我们使用 direct 来代替,获得了选...
分类:
其他好文 时间:
2015-08-03 15:03:52
阅读次数:
145
简介:
web.py 是一个Python 的web 框架,它简单而且功能强大。安装:
ubuntu系统下,我们可以只用几条指令完成web.py的安装,首先得安装pip:sudo apt-get install python-pip之后安装web.py:sudo pip install web.py之后进行测试,在python解释器中输入:import web没有报错即成功。入门
我们新建一个s...
分类:
编程语言 时间:
2015-08-03 14:49:57
阅读次数:
139
众所周知,很多网站都设置了登录之后才能获取查看页面的权利,因此模拟登录成了爬取信息的第一步,这一步成功了,嘿嘿,just do it!
好,废话不多说,直接说重点:
首先,你应该要了解网站登录的流程以及你需要post的信息,以豆瓣为例:
这就是你需要提交的信息了,包括用户名和密码,以及验证码和验证码的ID,看到这可能有人会想我怎么知道验证码的ID,各位放心,在页面加载时就已经到客户端这边来了,也就是说你可以直接从浏览器中看到,是不是很炫酷!
第二步,需要了解一些requests这个库了,因为reque...
分类:
编程语言 时间:
2015-08-03 14:42:55
阅读次数:
183