正则贪婪的贪婪匹配问题

正则表达式的量词,同样的量词,“贪婪的”、“勉强的”、“占有的”有什么区别?
比如:X+是贪婪的,X+?是勉强的,X++是占有的。这三个都匹配1个或多个X,但它们有什么区别?
1)贪婪的。量词总是贪婪的,贪婪表达式会为所有可能的模式发现尽可能多的匹配。
例:有一只大熊猫,还有一只小熊猫。
正则表达式:.+
结果:会匹配这一整句话“有一只大熊猫,还有一只小熊猫。”。
2)勉强的。有问号来指定,这个量词匹配满足模式所需的最少字符数。因此也称作懒惰的,最少匹配的,非贪婪的、或不贪婪的。
例:有一只大熊猫,还有一只小熊猫。
正则表达式:.+?
结果:匹配第一个符合要求的结果“有”。
3) 占有的。量词当前只有在JAVA语言中才可用(在其他语言中不可用),并且它也是更高级,因此我们大概不会立刻用到它。当正则表达式被应用于字符串时,它会产生相当多的状态,以便在匹配失败时可以回溯。而占有的量词并不保存这些中间状态,因此我们可以防止回溯。它们常常由于防止正则表达式失控,因此可以使正则表达式执行起来更有效。
中国邮政编码:[1-9]\d{5}(?!\d)
评注:中国邮政编码为6位数字
国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}
评注:匹配形式如 0...
正则表达式(regular expression)对象包含一个正则表达式模式(pattern)。它具有用正则表达式模式去匹配或代替一个串(string)中特定字...
1.测试字符串的某个模式。例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证。
2.替换文本。可...
它允许替换一个字符串或字符为另一个字符串或字符,并以正则表达式的形式执行
好像没有。
答: java想从控制台舒服“青”这个字 import java.util.Scanner Scanner input = new S 下一句语句是什
答: JavaServerPages(JSP)是一种实现普通静态HTML和动态HTML混合编码的技术,JSP并没有增加任何本质上不能用Servlet实现的功能
答: 还要看个人因素。两个职业么,呵呵
我目前是程序员,感觉比网络工程师累,每天作者不动,体能日益下降,十指也饱受摧残,而且程序员一定要向设计员发展,而且一般也是这样...
餐饮业厨房产生的油烟,顾名思义,废气中主要污染物为油烟,一般采用静电除油。
液化气属较清洁能源,废气污染程度不高,主要含二氧化碳一氧化碳吧。
柴油属石油类,废气含二氧化硫和氮氧化物,二氧化硫碱液喷淋即可去除,氮氧化物主要以一氧化氮为主,要催化氧化成二氧化氮才能被碱吸收,造价成本非常高,一般的柴油发电机尾气难以治理,除非大型发电厂。
煤炭废气含二氧化硫多,一般常用的脱硫工艺即可。
海鸟的种类约350种,其中大洋性海鸟约150种。比较著名的海鸟有信天翁、海燕、海鸥、鹈鹕、鸬鹚、鲣鸟、军舰鸟等。海鸟终日生活在海洋上,饥餐鱼虾,渴饮海水。海鸟食量大,一只海鸥一天要吃6000只磷虾,一只鹈鹕一天能吃(2~2.5)kg鱼。在秘鲁海域,上千万只海鸟每年要消耗?鱼400×104t,它们对渔业有一定的危害,但鸟粪是极好的天然肥料。中国南海著名的金丝燕,用唾液等作成的巢被称为燕窝,是上等的营养补品。
目前我们的生活水平必竟非同以往.吃得好休息得好,能量消耗慢,食欲比较旺盛,活动又少,不知不觉脂肪堆积开始胖啦。                                                                                         减肥诀窍:一.注意调整生活习惯,二。科学合理饮食结构,三。坚持不懈适量运动。
   具体说来:不要暴饮暴食。宜细嚼慢咽。忌辛辣油腻,清淡为好。多喝水,多吃脆平果青香焦,芹菜,冬瓜,黄瓜,罗卜,番茄,既助减肥,又益养颜,两全其美!
有减肥史或顽固型症状则需经药物治疗.
如有其他问题,请发电子邮件:jiaoaozihao53@ .或新浪QQ: 1
考虑是由于天气比较干燥和身体上火导致的,建议不要吃香辣和煎炸的食物,多喝水,多吃点水果,不能吃牛肉和海鱼。可以服用(穿心莲片,维生素b2和b6)。也可以服用一些中药,如清热解毒的。
确实没有偿还能力的,应当与贷款机构进行协商,宽展还款期间或者分期归还; 如果贷款机构起诉到法院胜诉之后,在履行期未履行法院判决,会申请法院强制执行; 法院在受理强制执行时,会依法查询贷款人名下的房产、车辆、证券和存款;贷款人名下没有可供执行的财产而又拒绝履行法院的生效判决,则有逾期还款等负面信息记录在个人的信用报告中并被限制高消费及出入境,甚至有可能会被司法拘留。
第一步:教育引导
不同年龄阶段的孩子“吮指癖”的原因不尽相同,但于力认为,如果没有什么异常的症状,应该以教育引导为首要方式,并注意经常帮孩子洗手,以防细菌入侵引起胃肠道感染。
第二步:转移注意力
比起严厉指责、打骂,转移注意力是一种明智的做法。比如,多让孩子进行动手游戏,让他双手都不得闲,或者用其他的玩具吸引他,还可以多带孩子出去游玩,让他在五彩缤纷的世界里获得知识,增长见识,逐渐忘记原来的坏习惯。对于小婴儿,还可以做个小布手套,或者用纱布缠住手指,直接防止他吃手。但是,不主张给孩子手指上“涂味”,比如黄连水、辣椒水等,以免影响孩子的胃口,黄连有清热解毒的功效,吃多了还可导致腹泻、呕吐。
合肥政务区网络广告推广网络推广哪家公司比较好 一套能在互联网上跑业务的系统,被网络营销专家赞为目前最 有效的网络推广方式!
1、搜索引擎营销:分两种SEO和PPC,即搜索引擎优化,是通过对网站结构、高质量的网站主题内容、丰富而有价值的相关性外部链接进行优化而使网站为用户及搜索引擎更加友好,以获得在搜索引擎上的优势排名为网站引入流量。
良工拥有十多位资深制冷维修工程师,十二年生产与制造经验,技术力量雄厚,配有先进的测试仪器,建有系列低温测试设备,备有充足的零部件,包括大量品牌的压缩机,冷凝器,蒸发器,水泵,膨胀阀等备品库,能为客户提供迅捷,优质的工业冷水机及模温机维修和保养。
楼主,龙德教育就挺好的,你可以去试试,我们家孩子一直在龙德教育补习的,我觉得还不错。
成人可以学爵士舞。不过对柔软度的拒绝比较大。  不论跳什么舞,如果要跳得美,身体的柔软度必须要好,否则无法充分发挥出理应的线条美感,爵士舞也不值得注意。在展开暖身的弯曲动作必须注意,不适合在身体肌肉未几乎和暖前用弹振形式来做弯曲,否则更容易弄巧反拙,骨折肌肉。用静态方式弯曲较安全,不过也较必须耐性。柔软度的锻炼动作之幅度更不该超过疼痛的地步,肌肉有向上的感觉即可,动作(角度)保持的时间可由10馀秒至30-40秒平均,时间愈长对肌肉及关节附近的联结的组织之负荷也愈高。
正在加载...
Copyright &
Corporation, All Rights Reserved
确定举报此问题
举报原因(必选):
广告或垃圾信息
激进时政或意识形态话题
不雅词句或人身攻击
侵犯他人隐私
其它违法和不良信息
报告,这不是个问题
报告原因(必选):
这不是个问题
这个问题分类似乎错了
这个不是我熟悉的地区&nbsp>&nbsp
&nbsp>&nbsp
&nbsp>&nbsp
Java正则表达式 贪婪 勉强 匹配说明 greedy vs ( lazy | reluctant )
摘要:问题描述:Stringstr=&aaa/&bbb/&ccc/&ddd/&eee&;str=str.replaceAll(&/&(.*)/&&,&@&);此时默认为贪婪匹配模式,输出结果str==&Stringstr=&aaa/&bbb/&ccc/&ddd/&eee&
String str = &aaa/&bbb/&ccc/&ddd/&eee&;
str = str.replaceAll(&/&(.*)/&&, &@&);
此时默认为贪婪匹配模式, 输出结果 str==&
String str = &aaa/&bbb/&ccc/&ddd/&eee&;
str = str.replaceAll(&/&(.*?)/&&, &@&);
此时为勉强匹配模式, 输出结果 str==&
相信大家已经发现了,java 正则表达式默认用的是greedy贪婪匹配模式既是这种类型
(.*)的最长匹配, 如果需要最短匹配则改为(.*?)既是勉强匹配模式
如果是贪婪匹配模式,正则表达式引擎会一直匹配到字符串最后,当匹配为false时,通过
回溯的方式,倒退找到倒数第一个匹配位置,返回匹配结果
如果是勉强匹配模式,正则表达式引擎会匹配到符合pattern的末尾位置那个字符,然后再往后走一步,发现匹配为false, 又回溯到找到回退的最近一个匹配为true的位置,返回结果
不是很好表达,大家意会下
以上是的内容,更多
的内容,请您使用右上方搜索功能获取相关信息。
若你要投稿、删除文章请联系邮箱:zixun-group@service.aliyun.com,工作人员会在五个工作日内给你回复。
新用户大礼包!
现在注册,免费体验40+云产品,及域名优惠!
云服务器 ECS
可弹性伸缩、安全稳定、简单易用
&40.8元/月起
预测未发生的攻击
&24元/月起
你可能还喜欢
你可能感兴趣
阿里云教程中心为您免费提供
Java正则表达式 贪婪 勉强 匹配说明 greedy vs ( lazy | reluctant )相关信息,包括
的信息,所有Java正则表达式 贪婪 勉强 匹配说明 greedy vs ( lazy | reluctant )相关内容均不代表阿里云的意见!投稿删除文章请联系邮箱:zixun-group@service.aliyun.com,工作人员会在五个工作日内答复
售前咨询热线
支持与服务
资源和社区
关注阿里云
International博客分类:
正则表达式中使用问号可以取消贪婪模式
使用正则表达式抽取整个页面的特定内容是非常方便的,但在使用时有一些细节问题还是很关键的,比如合理的使用问号(?)可以取消贪婪的抽取问题。
比如页面中包含有很多段&p&…&/p&,如果我们使用下面的方法抽取:
Regex rx = new Regex("&p&(.*)&/p&");
Match match = rx.Match(str);
结果是只提出一个,内容是从第一个&p&开始到最后一个&/p&结束。
这里我们只要加上问号,如下代码:
Regex rx = new Regex("&p&(.*?)&/p&");
Match match = rx.Match(str);
这时提到出来的就是一个个独立的&p&…&/p&,有时这才是我们想要的。
另外上面正则表达式里的括号也很有用,使用match.Group[0]得到匹配的结果,用match.Group[1]即得到括号中的内容。有多个括号按从外到内、从左到右的原则依次从Group里取。
PS. C#中还有个Group的概念,挺鬼异的,这里有解释,抽空研究一下:
Updated:更多正则表达式的揭密参见这里:
zhangjiaweixt
浏览: 225870 次
来自: 武汉
不可以喃,楼主
感谢分享,还在下载中,一直都用plsql,昨天听别人说toad ...
赞一个,可以使用
关键是那个服务器端怎么写啊 ,求指教啊,
net.sourceforge.jdbclogger.Jdbc ...
(window.slotbydup=window.slotbydup || []).push({
id: '4773203',
container: s,
size: '200,200',
display: 'inlay-fix'在 SegmentFault,学习技能、解决问题
每个月,我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。
点击阅读原文
正则表达式--递归匹配与非贪婪匹配
日 发布,来源:
1. 表达式的递归匹配
有时候,我们需要用正则表达式来分析一个计算式中的括号配对情况。比如,。但是如果,则这种写法将不能够匹配正确,得到的结果是 "( ( )" 。类似情况的还有 HTML 中支持嵌套的标签如 "&font& &/font&" 等。本节将要讨论的是,想办法把有嵌套的的成对括号或者成对标签匹配出来。
匹配未知层次的嵌套:
有的正则表达式引擎,专门针对这种嵌套提供了支持。并且在栈空间允许的情况下,能够支持任意未知层次的嵌套:比如 Perl,PHP,GRETA 等。在 PHP 和 GRETA 中,表达式中使用 "(?R)" 来表示嵌套部分。
匹配嵌套了未知层次的 "小括号对" 的表达式写法如下:"/(
匹配有限层次的嵌套:
对于不支持嵌套的正则表达式引擎,只能通过一定的办法来匹配有限层次的嵌套。思路如下:
第一步,写一个不能支持嵌套的表达式:"",""。 这两个表达式在匹配有嵌套的文本时,只匹配最内层。
第二步,写一个可匹配嵌套一层的表达式:""。这个表达式在匹配嵌套层数大于一时,只能匹配最里面的两层,同时,这个表达式或者嵌套的最里层。
匹配嵌套一层的 "&font&" 标签,表达式为:""。这个表达式在匹配 "&font&" 嵌套层数大于一的文本时,只匹配最里面的两层。
第三步,找到匹配嵌套(n)层的表达式 与 嵌套(n-1)层的表达式之间的关系。比如,能够匹配嵌套(n)层的表达式为:
( [匹配 [标记头] 和 [标记尾] 之外的表达式] | [匹配 n-1 层的表达式] )*
回头来看前面编写的“可匹配嵌套一层”的表达式:
/(([^()])*/)
(?!&/?font&).
(&font&((?!&/?font&).)*&/font&)
PHP 和 GRETA 的简便之处在于,匹配嵌套(n-1)层的表达式用 (?R) 表示:
第四步,依此类推,可以编写出匹配有限(n)层的表达式。这种方式写出来的表达式,虽然看上去很长,但是这种表达式经过编译后,匹配效率仍然是很高的。
2. 非贪婪匹配的效率
可能有不少的人和我一样,有过这样的经历:当我们要匹配类似 "&td&内容&/td&" 或者 "[b]加粗[/b]" 这样的文本时,我们根据功能写出这样的表达式:"" 或者 ""。
当发现之时,恍然大悟,同样功能的表达式可以写得如此简单:""。 顿时间如获至宝,凡是按边界匹配的地方,尽量使用简捷的非贪婪匹配 ".*?"。特别是对于复杂的表达式来说,采用非贪婪匹配 ".*?" 写出来的表达式的确是简练了许多。
然而,当一个表达式中,有多个非贪婪匹配时,或者多个的表达式时,这个表达式将可能存在效率上的陷阱。有时候,匹配速度慢得莫名奇妙,甚至开始怀疑正则表达式是否实用。
效率陷阱的产生:
在本站里,对的描述中说到:“如果少匹配就会导致整个表达式匹配失败的时候,与贪婪模式类似,非贪婪模式会最小限度的再匹配一些,以使整个表达式匹配成功。”
具体的匹配过程是这样的:
"非贪婪部分" 先匹配最少次数,然后尝试匹配 "右侧的表达式"。
如果右侧的表达式匹配成功,则整个表达式匹配结束。如果右侧表达式匹配失败,则 "非贪婪部分" 将增加匹配一次,然后再尝试匹配 "右侧的表达式"。
如果右侧的表达式又匹配失败,则 "非贪婪部分" 将再增加匹配一次。再尝试匹配 "右侧的表达式"。
依此类推,最后得到的结果是 "非贪婪部分" 以尽可能少的匹配次数,使整个表达式匹配成功。或者最终仍然匹配失败。
当一个表达式中有多个非贪婪匹配,以表达式 "d(/w+?)d(/w+?)z" 为例,对于第一个括号中的 "/w+?" 来说,右边的 "d(/w+?)z" 属于它的 "右侧的表达式",对于第二个括号中的 "/w+?" 来说,右边的 "z" 属于它的 "右侧的表达式"。
当 "z" 匹配失败时,第二个 "/w+?" 会 "增加匹配一次",再尝试匹配 "z"。如果第二个 "/w+?" 无论怎样 "增加匹配次数",直至整篇文本结束,"z" 都不能匹配,那么表示 "d(/w+?)z" 匹配失败,也就是说第一个 "/w+?" 的 "右侧" 匹配失败。此时,第一个 "/w+?" 会增加匹配一次,然后再进行 "d(/w+?)z" 的匹配。循环前面所讲的过程,直至第一个 "/w+?" 无论怎么 "增加匹配次数",后边的 "d(/w+?)z" 都不能匹配时,整个表达式才宣告匹配失败。
其实,为了使整个表达式匹配成功,也会适当的“让出”已经匹配的字符。因此贪婪匹配也有类似的情况。当一个表达式中有较多的的表达式时,为了让整个表达式匹配成功,各个贪婪或非贪婪的表达式都要进行尝试减少或增加匹配次数,由此容易形成一个大循环的尝试,造成了很长的匹配时间。本文之所以称之为“陷阱”,因为这种效率问题往往不易察觉。
举例:,将花费较长一段时间才能判断出匹配失败 。
效率陷阱的避免:
避免效率陷阱的原则是:避免“多重循环”的“尝试匹配”。并不是说非贪婪匹配就是不好的,只是在运用非贪婪匹配的时候,需要注意避免过多“循环尝试”的问题。
情况一:对于只有一个非贪婪或者贪婪匹配的表达式来说,不存在效率陷阱。也就是说,要匹配类似 "&td& 内容 &/td&" 这样的文本,表达式 "" 和 "" 和 "" 的效率是完全相同的。
情况二:如果一个表达式中有多个的表达式,应防止进行不必要的尝试匹配。
比如,对表达式 "" 来说, 如果前面部分表达式在遇到 "&script language='vbscript'&" 时匹配成功后,而后边的 "(.*?)&/script&" 却匹配失败,将导致第一个 ".*?" 增加匹配次数再尝试。而对于表达式真正目的,让第一个 ".*?" 增加匹配成“vbscript'&”是不对的,因此这种尝试是不必要的尝试。
因此,对依靠边界来识别的表达式,不要让的部分跨过它的边界。前面的表达式中,第一个 ".*?" 应该改写成 "[^']*"。后边那个 ".*?" 的右边再没有的表达式,因此这个非贪婪匹配没有效率陷阱。于是,这个匹配脚本块的表达式,应该写成:"" 更好。
我要该,理由是:
关闭理由:
删除理由:
忽略理由:
推广(招聘、广告、SEO 等)方面的内容
与已有问题重复(请编辑该提问指向已有相同问题)
答非所问,不符合答题要求
宜作评论而非答案
带有人身攻击、辱骂、仇恨等违反条款的内容
无法获得确切结果的问题
非开发直接相关的问题
非技术提问的讨论型问题
其他原因(请补充说明)

我要回帖

更多关于 python正则贪婪 的文章

 

随机推荐