1 # -*- coding: utf-8 -*- 2 import urllib 3 import urllib2 4 import json 5 6 def getloca(loca): 7 url='http://api.map.baidu.com/geocoder/v2/?address=' ...
分类:
编程语言 时间:
2018-09-19 13:51:36
阅读次数:
161
一.函数名的运用 函数名是一个变量, 但它是一个特殊的变量, 与括号配合可以执行函数的变量. 1. 函数名的内存地址 2. 函数名可以赋值给其他变量 3. 函数名可以当做容器类的元素 4. 函数名可以当做函数的参数 5. 函数名可以作为函数的返回值 二. 闭包 什么是闭包? 闭包就是内层函数, 对外 ...
分类:
其他好文 时间:
2018-09-18 19:55:32
阅读次数:
207
'''' This is a module ''' import re from urllib import request # 断点调试 class Spider(): ''' This is a class ''' # 私有方法 # 匹配所有字符 [\s\S]*? 非贪婪 url='https:... ...
分类:
其他好文 时间:
2018-09-17 17:44:41
阅读次数:
165
学习网络抓取时,第一步出现问题。 执行示例代码 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://www.pythonscraping.com/exercises/exerc ...
分类:
编程语言 时间:
2018-09-16 22:03:19
阅读次数:
782
1 '''' 2 This is a module 3 ''' 4 5 import re 6 7 from urllib import request 8 # 断点调试 9 10 class Spider(): 11 ''' 12 This is a class 13 ''' 14 # 私有方法 ...
分类:
其他好文 时间:
2018-09-16 19:41:56
阅读次数:
222
json模块四个常用方法son.dumps()将python对象编码成为json的字符串格式(最常用的是字典,列表集合等都可以)json.dump()将python对象编码成为json的字符串格式并写入文件json.loads()将json的字符串格式解码成python对象json.load()将文件中的json的字符串格式解码成python对象例子importjson#将python对象编码成为
分类:
编程语言 时间:
2018-09-13 21:40:59
阅读次数:
218
抓取糗事百科内容及评论,不包含图片信息。user-agent填入浏览器的即可。user-agent对应的value,360极速浏览器的话,可以在地址栏输入about:version,回车,用户代理后面的一长串就是需要填入''里面的内容。其他的可以自行百度 import urllib.request ...
分类:
其他好文 时间:
2018-09-09 23:58:13
阅读次数:
351
豆瓣# coding:utf - 8 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("https://movie.douban.com/") bsObj = BeautifulSoup(... ...
分类:
编程语言 时间:
2018-09-09 19:45:26
阅读次数:
338
Py2.x:Urllib库Urllin2库Py3.x:Urllib库变化:在Pytho2.x中使用import urllib2——-对应的,在Python3.x中会使用import urllib.request,urllib.error。在Pytho2.x中使用import urllib——-对应的... ...
分类:
编程语言 时间:
2018-09-08 15:27:42
阅读次数:
323
本章由网络爬虫的编写来学习python。首先写几行代码抓取百度首页,提提精神,代码如下: 除了第一行导入第三方包之外,我们用5行代码实现了一个简单的程序:读取百度首页并存储在本地制定文件。下面来详细介绍代码: 1.import urllib.request urllib库是python的一个操作ur ...
分类:
编程语言 时间:
2018-09-07 13:58:26
阅读次数:
177