Python之爬取网页时遇到的问题——BeautifulSoup https://cuiqingcai.com/1319.htmlhttp://cuiqingcai.com/1319.html , http://blog.csdn.net/akak714/article/details/501307 ...
分类:
编程语言 时间:
2020-05-31 19:44:08
阅读次数:
105
by 某某白米饭 正则表达式是一个特殊的字符串序列、一种模式,用来判断字符串是否符合这种模式,如:判断邮件地址是否有 @ 符号,判断手机号是否正确等待。 基本语法 在正则表达式中,可以使用 \d 匹配数字,\w 匹配数字和子母,. 可以匹配除了换行符之外的任意字符,\s 匹配空白字符 1\d 可以匹 ...
分类:
其他好文 时间:
2020-05-31 16:13:07
阅读次数:
64
##目录 1. 实验步骤 1.1 JDK1.8 & WebGoat 1.2 SQL 1.2.1 Command Injection 1.2.2 Numeric SQL Injection 1.2.3 Log Spoofing 1.2.4 String SQL Injection 1.2.5 LAB: ...
分类:
Web程序 时间:
2020-05-31 00:53:45
阅读次数:
82
grep:查找文件中符合条件的字符串 根据模式搜索文件内容,并将符合模式的字符串行显示出来 语法:grep [选项][模式][文件或目录名] 选项: -i :查找时,忽略字符大小写 --color:将匹配的行的关键字,以高亮的颜色显示 -v :反向匹配,被模式匹配的行不显示,不匹配的行显示 -o : ...
分类:
系统相关 时间:
2020-05-31 00:40:03
阅读次数:
90
〇、环境 语言版本:python 3.8.3 编辑器:IDLE(python自带) 操作系统:win10 一、需求 1、获取taobao指定商品页面中的 价格和名称,这里以书包为例子。 2、格式化输出 二、分析 1、taobao商品页面的源代码组织形式 在商品页右键查看源代码,然后根据商品价格和商品 ...
分类:
编程语言 时间:
2020-05-30 16:04:26
阅读次数:
119
常用命令总结:sed用途:处理文本用法:sed[option]...‘script‘inputfile...-n不输出模式空间内容到屏幕,即不自动打印-e多点编辑-f/PATH/SCRIPT_FILE从指定文件中读取编辑脚本-r支持使用扩展正则表达式-i.bak备份文件并原处编辑地址定界:(1)不给地址:对全文进行处理(2)单地址:#:指定的行,$:最后一行/pattern/:被此处模式所能够匹配
分类:
其他好文 时间:
2020-05-30 09:14:41
阅读次数:
87
"""替换"""""" 在字符串中替换子串时,使用模块re并通过正则表达式指定被替换的子串可以实现更加强大的替换功能。模块re提供了两个实现字符串替换的方法 一、sub() 二、subn()"""import re""" 一、sub() sub(pattern, repl, string, coun ...
分类:
其他好文 时间:
2020-05-30 00:53:28
阅读次数:
77
"""逻辑匹配"""""" 在正则表达式中可以使用 | 进行逻辑匹配,规则: 先尝试匹配左边的表达式,如果匹配成功则跳过匹配右边的表达式;如果匹配不成功,再匹配右边的表达式。 如果 | 没有在括号内,则它的作用范围是整个正则表达式。"""import reprint(re.match(r'123|1 ...
分类:
其他好文 时间:
2020-05-29 23:23:59
阅读次数:
70
"""分组匹配"""import re""" 可以用小括号将正则表达式中的部分内容括起来,从而括号内的部分为一个分组。 可以给某个分组起一个别名,语法为:?P<别名>"""import repattern_obj = re.compile(r'(\d+)-(\d+)')match_obj = pat ...
分类:
其他好文 时间:
2020-05-29 23:10:56
阅读次数:
61
零宽断言是正则表达式中的一种方法,正则表达式在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。本文主要是介绍Python中,使用正则表达式的零宽正负向断言的方法,和使用零宽断言来解决包含某个字符串且不包含某字符串的问题,以及相关示例代码。 原文地址:https:// ...
分类:
编程语言 时间:
2020-05-29 23:09:39
阅读次数:
95