#!/usr/bin/python#encoding=utf-8from bs4 import BeautifulSoup as bsimport requestsheaders = { "host": "www.jd.com", "User-Agent": "Mozilla/5.0 (Window ...
分类:
编程语言 时间:
2016-09-01 17:59:51
阅读次数:
229
1、使用工具:
Python3.5
BeautifulSoup
2、抓取网站:
csdn热门文章列表 http://blog.csdn.net/hot.html
3、实现代码:__author__ = 'Administrator'
import urllib.request
import re
from bs4 import BeautifulSoup
#################...
分类:
编程语言 时间:
2016-08-23 19:07:11
阅读次数:
169
1、使用工具:
Python3.5
BeautifulSoup
2、抓取网站:
csdn首页文章列表 http://blog.csdn.net/
3、实现代码:__author__ = 'Administrator'
import urllib.request
import re
from bs4 import BeautifulSoup
#####################...
分类:
编程语言 时间:
2016-08-23 19:06:22
阅读次数:
181
在网上看到爬百度贴吧的例子,仿照写了一个用BeautifulSoup实现的,直接上代码吧 #coding:gbk import urllib2 from bs4 import BeautifulSoup import re import os class TiebatoTxt: def __init... ...
分类:
其他好文 时间:
2016-08-19 18:51:24
阅读次数:
166
Python3.5Mac ios系统爬取天气预报的小程序:import requests, csv, random, time, socketfrom bs4 import BeautifulSoupimport http.clientdef get_content(url, data = None ...
分类:
其他好文 时间:
2016-08-13 10:03:50
阅读次数:
413
这是我以前的BS4笔记,交流请联系 QQ 328123440 ...
分类:
编程语言 时间:
2016-07-19 09:06:18
阅读次数:
135
上一篇中有关于安装nginx、python、uwsgi的过程,这里不再重述。下面是有关在具体布署中的一些过程和问题处理 一、因为用到了bs4(BeautifulSoup)\paste\lxml所以这些先安装,pip安装即可 二、nginx端口更改为了8001,防止与原来已经存在的apache服务器冲 ...
分类:
编程语言 时间:
2016-07-05 22:38:22
阅读次数:
221
# coding:utf8 from bs4 import BeautifulSoup import re html_doc = """ The Dormouse's story The Dormouse's story Once upon a time there were three littl... ...
分类:
编程语言 时间:
2016-06-10 14:56:35
阅读次数:
177
python3.4, 使用了url.request,re ,bs4这些库, 在mooc看了很久爬虫的代码, 感觉自己可以实现这么一个贱贱的功能, 但是写完了之后访问页面是可以的, 但是浏览量并不增加。 宝宝心里苦, 感觉还要每次清空Cookie, 有空再改。 ...
分类:
编程语言 时间:
2016-05-27 21:47:50
阅读次数:
224
1.apt-get install python-bs4 bs4只有py2的代码,安装在py3下会很麻烦 bs4支持HTML parser,也可以支持第三方的分析器 2.apt-get install python-lxml 3. apt-get install python-html5lib 4. ...
分类:
编程语言 时间:
2016-05-18 12:27:32
阅读次数:
165