博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
正则表达式中的懒惰匹配与非捕获组
阅读量:4512 次
发布时间:2019-06-08

本文共 778 字,大约阅读时间需要 2 分钟。

当正则表达式中包含能接受重复的限定符(指定数量的代码,例如*,{5,12}等)时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。

    考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

    有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:

     a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。

 

 举例1:

   表达式 "<td>(.*)</td>" 与字符串 "<td><p>aa</p></td> <td><p>bb</p></td>" 匹配时,匹配的结果是:成功;匹配到的内容是 "<td><p>aa</p></td> <td><p>bb</p></td>" 整个字符串, 表达式中的 "</td>" 将与字符串中最后一个 "</td>" 匹配。

举例2:

   相比之下,表达式 "<td>(.*?)</td>" 匹配举例1中同样的字符串时,将只得到 "<td><p>aa</p></td>", 再次匹配下一个时,可以得到第二个 "<td><p>bb</p></td>"。

懒惰限定符

*? 重复任意次,但尽可能少重复 
+? 重复1次或更多次,但尽可能少重复 
?? 重复0次或1次,但尽可能少重复 
{n,m}? 重复n到m次,但尽可能少重复 
{n,}? 重复n次以上,但尽可能少重复

转载于:https://www.cnblogs.com/psunny/archive/2010/06/02/1749652.html

你可能感兴趣的文章
单变量微积分笔记16——定积分的应用1(对数与面积)
查看>>
ACM模板——最短路
查看>>
实验3 分支语句和循环语句(1)
查看>>
JSP页面上添加Fckeditor
查看>>
scrapyd spiderkeeper docker部署
查看>>
Qt教程
查看>>
http://linux-mtd.infradead.org/doc/nand.html nand
查看>>
Verilog语言:还真的是人格分裂的语言
查看>>
BTC全节点搭建
查看>>
mac安装Redis可视化工具-Redis Desktop Manager
查看>>
css3_圆角导航栏(2例)
查看>>
Xcode SDK模拟器安装及安装路径
查看>>
uva1625颜色的长度
查看>>
待研究
查看>>
C语言对结构体何时用-> , 何时用.
查看>>
Android 常用命令集的使用
查看>>
Android ADT,SDK的安装,让人烦恼的在线方式!
查看>>
mac显示隐藏文件
查看>>
RobotFramework下的http接口自动化Follow Response关键字的使用
查看>>
this&super两个关键字的意义和用法
查看>>