码迷,mamicode.com
首页 > 移动开发 > 详细

python爬取手机归属地

时间:2016-11-25 17:28:06      阅读:256      评论:0      收藏:0      [点我收藏+]

标签:gen   cep   tab   ges   效果   build   pre   line   use   

用python+bs4爬取了手机归属地数据:
 
import urllib.request
from bs4 import BeautifulSoup

def spider1(url):

    headers = {User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11,
    Accept:text/html;q=0.9,*/*;q=0.8
    }

    opener = urllib.request.build_opener()
    opener.addheaders = [headers]

    source_code=opener.open(url).read()
    soup=BeautifulSoup(source_code,"html.parser",from_encoding="gbk")
    for link in soup.find_all(dd):
        baseurl=rhttp://guisd.com+link.a[href]+rall/
        haoduan=link.a.text
        print(haoduan)
        source_code=opener.open(baseurl).read()
        soup=BeautifulSoup(source_code,"html.parser",from_encoding="gbk")
        for tabb in soup.find_all(tr)[1:]:
            for tdd in tabb.find_all(td)[0:6]:
                f.writelines(tdd.get_text()+,)
            f.writelines(\n)         
f=open(text.txt,w+)
spider1(http://guisd.com/lb/)
f.close()

最终效果如下:

技术分享

python爬取手机归属地

标签:gen   cep   tab   ges   效果   build   pre   line   use   

原文地址:http://www.cnblogs.com/stephen2016/p/6101978.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!