码迷,mamicode.com
首页 > 其他好文 > 详细

爬取爱奇艺热搜

时间:2020-03-19 21:45:16      阅读:68      评论:0      收藏:0      [点我收藏+]

标签:frame   use   ike   int   code   ima   safari   headers   win64   

#爱奇艺网址:http://v.iqiyi.com/index/resou/index.html

import requests
from bs4 import BeautifulSoup
import pandas as pd
url=‘http://v.iqiyi.com/index/resou/index.html‘#搜索网址
headers={‘User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18363‘}#伪装爬虫
r=requests.get(url)#发送get请求
r.encoding=r.apparent_encoding#统一编码
soup=BeautifulSoup(r.text,‘lxml‘)#SOUP对象
a=[]#建立表格
b=[]
for y in soup.find_all(class_="title-box-1"):
a.append(y.get_text().strip())
for x in soup.find_all(class_="title-box-3"):
b.append(x.get_text().strip())
data=[title,index]
print(data)
c=pd.DataFrame(data,index=["标题","热度"])#可视化
print(c.T)

 

技术图片

获取标题 热度

 

技术图片

得出的结果

技术图片

 

爬取爱奇艺热搜

标签:frame   use   ike   int   code   ima   safari   headers   win64   

原文地址:https://www.cnblogs.com/cwddbky/p/12526989.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!