搜索关键字：bs4，搜索到922个结果！码迷,mamicode.com！

python爬虫-静态爬取豆瓣评论

from bs4 import BeautifulSoupimport requestsimport pandas as pdheader = {'Referer': 'https://movie.douban.com/subject/33420285/comments?status=P','Use ...

分类：编程语言时间：2020-05-19 22:41:42 阅读次数：115

Python-网易音乐下载

# 爬取网易音乐 import requests from bs4 import BeautifulSoup import urllib.request headers = {"origin": "https://music.163.com", "referer": "https://music.1 ...

分类：编程语言时间：2020-05-19 18:40:16 阅读次数：107

爬虫中国大学排名

功能描述输入：大学排名URL链接输出：大学排名信息的屏幕输出（排名，大学名称，总分）技术路线：requests-bs4 定向爬虫：仅对输入URL进行爬取，不扩展爬取程序的结构设计步骤1：从网络上获取大学排名网页内容 getHTMLText() 步骤2：提取网页内容中信息到合适的数据结构 ...

分类：其他好文时间：2020-05-19 12:31:40 阅读次数：107

20,爬取豆瓣电影TOP250,教程为BiliBili IT私塾

耗时两天,终于将李巍老师的爬虫部分学习完,非常感谢李老师,讲课很生动,课程来源bilibili UP主:IT私塾. 以下为源代码: #-*- codeing= utf-8 -*-#__author__: zoe#date: 2020/5/15from bs4 import BeautifulSoup ...

分类：其他好文时间：2020-05-18 12:11:07 阅读次数：130

第一次爬虫和测试

一、requests库的get()函数访问必应主页20次，打印返回状态，text()内容，计算text()属性和content属性所返回网页内容的长度。 1>返回状态。 import requests from bs4 import BeautifulSoup def JudgeState(r): ...

分类：其他好文时间：2020-05-17 19:24:12 阅读次数：89

一篇文章带你用Python网络爬虫实现网易云音乐歌词抓取

前几天小编给大家分享了数据可视化分析，在文尾提及了网易云音乐歌词爬取，今天小编给大家分享网易云音乐歌词爬取方法。本文的总体思路如下：找到正确的URL，获取源码；利用bs4解析源码，获取歌曲名和歌曲ID；调用网易云歌曲API，获取歌词；将歌词写入文件，并存入本地。本文的目的是获取网易云音乐 ...

分类：编程语言时间：2020-05-15 10:07:18 阅读次数：81

Python第一条网络爬虫，爬取一个网页的内容

一、球赛结果预测代码部分函数测试。二、用requests库函数访问搜狗网页20次。 1 import requests 2 from bs4 import BeautifulSoup 3 def getHTMLText(self): 4 try: 5 r=requests.get(url,time ...

分类：编程语言时间：2020-05-13 23:42:42 阅读次数：142

python-爬取中国大学排名网站信息【IndexError：list index out of range】

代码1、2如下 #方法一import requests from bs4 import BeautifulSoup #对bs4库中的Beautiful类引用 allUniv = []#获取界面的信息 def getHTMLText(url): try: r = requests.get(url, t ...

分类：编程语言时间：2020-05-13 23:30:18 阅读次数：120

5.13 第一次爬虫和测试

1 import requests 2 from bs4 import BeautifulSoup 3 4 count = 0 5 for x in range(20): 6 count += 1 7 res_web = requests.get('https://www.baidu.com/') ...

分类：其他好文时间：2020-05-13 23:28:06 阅读次数：119

第一个爬虫和测试

1.  <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>简单的html页面 53</title> </head> <body> <h1 style="color:green">我的第一个标题</h ...

分类：其他好文时间：2020-05-13 18:39:43 阅读次数：62

共922条上一页 1 ... 7 8 9 10 11 ... 93 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)