上学期参加了一个大数据比赛,需要抓取大量数据,于是我从新浪微博下手,本来准备使用新浪的API的,无奈新浪并没有开放关键字搜索的API,所以只能用爬虫来获取了。幸运的是,新浪提供了一个高级搜索功能,为我们爬取数据提供了一个很好的切入点。 在查阅了一些资料,参考了一些爬虫的例子后,得到大体思路:构造UR ...
分类:
编程语言 时间:
2016-10-08 16:03:41
阅读次数:
219
转载至http://www.cnblogs.com/coser/archive/2012/01/06/2315216.html 首先列一下,sellect、poll、epoll三者的区别 select select最早于1983年出现在4.2BSD中,它通过一个select()系统调用来监视多个文件 ...
分类:
编程语言 时间:
2016-10-01 19:16:24
阅读次数:
188
今天将python中socket模块的基本API学习完后,照着书上的实例编写一个套接字服务器和客户端。采用python3.5版本,在注释中会标明python2和python3的不同之处。 1.代码 (1)服务器端及对应代码解释 1 # ! /usr/bin/env python 2 # -*- co ...
分类:
编程语言 时间:
2016-09-26 21:45:51
阅读次数:
184
很多情况下,默认的套接字缓冲区大小可能不够用。此时,可以将默认的套接字缓冲区大小改成一个更合适的值。 1. 代码 2.setsockopt()和getsockopt() 3.AF_INET和SOCK_STREAM解释 4.运行结果 ...
分类:
编程语言 时间:
2016-09-22 00:57:15
阅读次数:
576
在网络应用中,经常会遇到这种情况:一方尝试连接,但另一方由于网络媒介失效或者其他原因无法响应。 Python的Socket库提供了一个方法,能通过socket。error异常优雅地处理套接字错误。 1. 代码及相关解释 ...
分类:
编程语言 时间:
2016-09-21 23:03:46
阅读次数:
234
链接:http://www.jb51.net/article/88825.htm 引言 解释器环境:python3.5.1 我们都知道python网络编程的两大必学模块socket和socketserver,其中的socketserver是一个支持IO多路复用和多线程、多进程的模块。一般我们在soc ...
分类:
编程语言 时间:
2016-09-17 00:16:39
阅读次数:
237
Sometimes,you need to manipulate the default values of certain properties of a socket library, for example, the socket timeout. 设定并获取默认的套接字超时时间。 1.代码 ...
分类:
编程语言 时间:
2016-09-16 22:53:54
阅读次数:
236
If you ever need to write a low-level network application, it may be necessary to handle the low-level data transmission over the wire between two mac ...
分类:
编程语言 时间:
2016-09-16 01:33:06
阅读次数:
225
#encoding=utf-8#创建一个socketserverTCP服务器#高级模块,简化客户和服务器的实现from SocketServer import (TCPServer as TCP,StreamRequestHandler as SRH)from time import ctime h ...
分类:
编程语言 时间:
2016-09-01 18:11:53
阅读次数:
170
pycurl是个用c语言实现的python 库,虽然据说不是那么pythonic,但是却很高效,它支持的协议居多: supporting FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE and LDAP. libcurl supports HTT ...
分类:
编程语言 时间:
2016-08-19 00:37:23
阅读次数:
227