主页 分类 关于

爬虫 正则表达式(牢饭吃到饱)

每天一个入狱小技巧

正则表达式的优点和缺点

优点: 速度快, 效率高, 准确度高

缺点: 优点老手福利, 新手? ? ?

正则表达式的概念

使用元字符进行排列组合用来匹配字符串

元字符

常用元字符

.          # 匹配除换行符以外的任意字符

\w # 匹配字母或数字或下划线

\s # 匹配任意的空白符

\d # 匹配数字

\n # 匹配一个换行符

\t # 匹配一个制表符

^ # 匹配字符串的开始

$ # 匹配字符串的结尾

\w # 匹配非字母或数字或下划线

\D # 匹配非数字

\S # 匹配非空白符

a|b # 匹配字符a或字符b

() # 匹配括号内的表达式, 也表示一个组

[] # 匹配字符中的字符 例如 [a-zA-z0-9]

[^] # 匹配除了字符组中字符的所有字符

量词: 控制前面的元字符出现的次数

*          # 重复零次或更多次 

+ # 重复一次或更多次

? # 重复零次或一次 说白了就是出现或者不出现

{n} # 重复n次

{n,} # 重复n次或更多次

{n,m} # 重复n到m次

贪婪匹配和惰性匹配

.*          # 贪婪匹配      说白了就是尽可能多的匹配

.*? # 惰性匹配 说白了就是尽可能少的匹配









作者: 我叫史迪奇
本文来自于: https://sdq3.link/reptile-RegEx.html博客内容遵循 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议