目的:爬取昵称 目标网站:糗事百科 依赖的库文件:request、sys、beautifulSoup4、imp、io Python使用版本:3.4 说明:参考http://cn.python-requests.org/zh_CN/latest/user/quickstart.html 步骤: 一、熟 ...
分类:
编程语言 时间:
2016-12-20 23:53:07
阅读次数:
251
参照网上的教程再做修改,抓取糗事百科段子(去除图片),详情见下面源码: #coding=utf-8#!/usr/bin/pythonimport urllibimport urllib2import reimport threadimport timeimport sys #定义要抓取的网页#url ...
分类:
编程语言 时间:
2016-11-19 15:39:57
阅读次数:
179
程序用来爬取糗事百科上的图片的,程序设有超时功能,具有异常处理能力 下面直接上源码: ...
分类:
编程语言 时间:
2016-10-21 22:00:44
阅读次数:
281
#-*-coding:utf-8-*-
importurllib2
importsys
importre
reload(sys)
sys.setdefaultencoding(‘utf-8‘)
url=‘http://www.qiushibaike.com/hot/page/1/‘
header={‘User-Agent‘:‘Mozilla/5.0(WindowsNT6.1;WOW64)‘}
try:
page=1
whileTrue:
rawurl=‘http://www.qiushibaike.com/h..
分类:
编程语言 时间:
2016-10-20 15:56:25
阅读次数:
141
上篇文章已经介绍了抓取糗事百科的段子,这篇文章来抓取百度贴吧帖子内容,涉及到urllib,urllib2,re等模块。 代码实现功能: 1.获取某一个帖子的标题 2.获取帖子回复的所有页数,以及每一页的内容 3.可以只获取楼主的回复(使用数字1声明),或者所有回复(使用数字0声明) 直接使用oop编 ...
分类:
其他好文 时间:
2016-09-13 20:33:34
阅读次数:
201
这是小白学习笔记....大神勿喷。 本次学习糗事百科的网络爬虫。 http://blog.csdn.net/pleasecallmewhy/article/details/8932310 因为那个糗事百科网页改版了,content类中已经没有title...所以源码也有所改动。 所以找到一个改进版的 ...
分类:
编程语言 时间:
2016-08-26 19:44:32
阅读次数:
260
参考链接:http://python.jobbole.com/81351/#comment-93968 主要参考自伯乐在线的内容,但是该链接博客下的源码部分的正则表达式部分应该是有问题,试了好几次,没试成功。后来在下面的评论中看到有个使用BeautifulSoup的童鞋,试了试,感觉Beautifu ...
分类:
编程语言 时间:
2016-07-30 22:18:02
阅读次数:
142
<div class="content"> 看到吃的一瞬间,眼睛都在发光…… </div><div class="content"> 办公室一大龄剩女,经常说让别人给她介绍男朋友,刚一逗比男同事说“我去哪里给你找,你自己去网上找找吧”<br/>大龄剩女说“真爱网吗?”<br/>“不,淘宝网” </d ...
分类:
其他好文 时间:
2016-07-14 02:29:28
阅读次数:
6005
快上车,这是一款日常生活中非常有趣的安卓手机软件,致力于打造一个大学生的专属娱乐创意社区,讨论的话题轻松休闲贴近大学生活,与在社会中十分流行的贴吧,糗事百科类似。在快上车中可以查看他人发布的吐槽并与网友分享自己最珍贵的开心经历或听说到的油菜、杯具、草蛋、有意思的、不顺心的等各类情形的生活小笑话,快上 ...
分类:
其他好文 时间:
2016-06-13 15:30:04
阅读次数:
121