(1)和lxml一样,Beautifu Soup也是一个HTML/XML的解析器,主要的功能也是如何解析和提取HTML/XML数据。 (2)lxml只会局部遍历,而Beautiful Soup是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lx ...
分类:
Web程序 时间:
2020-05-10 14:37:17
阅读次数:
68
新学了一下笛卡尔树,这道题是模板题,统计一下以 $x$ 为 lca 的点对就行. 然后统计的话用线段树合并 + 启发式合并就行了. code: #include <bits/stdc++.h> #define N 100006 #define ll long long #define lson s[ ...
分类:
其他好文 时间:
2020-05-08 23:00:23
阅读次数:
78
给你 $ a $ 个 $ 0 $,$ b $ 个 $1$,$ c $ 个 $ 2 $,$ d $ 个 $ 3 $,要求排成一个长度为 $ a+b+c+d $ 的数列,相邻两个差的绝对值为 $ 1 $,并输出任一方案。 ...
分类:
其他好文 时间:
2020-05-08 22:38:01
阅读次数:
90
http://acm.hdu.edu.cn/showproblem.php?pid=6351 题目 给一个数字n,可以执行k次交换,每次交换都选择数字中的2位,并且交换后不能出现前导0,问能得到的最小值和最大值是多少。 T<=100,n,k<=10^9 题解 方法一 把交换看为对换,枚举排列,然后分 ...
分类:
其他好文 时间:
2020-05-08 13:09:47
阅读次数:
52
注意:使用前要装selenium第三方的库才可以使用 版本:python3 from bs4 import BeautifulSoup from urllib import request # 要请求的网络地址 url = 'https://www.hao123.com/' # 请求网络地址得到ht ...
分类:
编程语言 时间:
2020-05-07 23:09:21
阅读次数:
90
快速使用 from bs4 import BeautifulSoup soup = BeautifulSoup(html,'lxml') 一、基本使用 1、标签选择器 soup.标签名 获取这个标签内容,如果有多个该标签,就返回第一个 获取名称 soup.title.name 获取属性 soup.p ...
分类:
编程语言 时间:
2020-05-05 12:28:47
阅读次数:
73
https://starchart.cc/ 后面加上用户和repo的名字即可。 例如https://starchart.cc/hupo376787/A-Beautiful-UWP-Frame 最后拷贝最下面的markdown文本嵌入到Readme.md即可 ...
分类:
其他好文 时间:
2020-05-04 15:39:50
阅读次数:
166
Beautiful Land #include<cstdio>价值背包 #include<cstdlib> #include<iostream> #include<algorithm> #include<cmath> #include<cstring> #include<map> #define m ...
分类:
其他好文 时间:
2020-05-03 20:35:46
阅读次数:
57
爬取起点月票榜 一、实现过程: 1、找到一个感兴趣的网页——起点中文网的月票排行榜(https://www.qidian.com/rank/yuepiao),并尝试爬取: 2、分析网页源代码,思考提取数据方法 书名在h4标签,简介在p标签 利用soup.find_all(name, attrs, r ...
分类:
其他好文 时间:
2020-04-30 19:36:03
阅读次数:
100
简述:BeautifulSoup 外, python常用的解析HTML、XML的第三方库:lxml, lxml中语法为xpath 1. 使用爬取的页面数据,来定义一个对象。 2. 使用xpath来解析这个对象中的标签树。 """lxml使用xpath语法,来解析HTML""" from lxml i ...
分类:
Web程序 时间:
2020-04-30 17:24:01
阅读次数:
86