python 正则表达式 反斜杠(/)的麻烦和陷阱

2016-02-19 09:50 2 1 收藏

下面请跟着图老师小编一起来了解下python 正则表达式 反斜杠(/)的麻烦和陷阱,精心挑选的内容希望大家喜欢,不要忘记点个赞哦!

【 tulaoshi.com - Web开发 】

要匹配字符串中1个反斜杠应该怎么写正则表达式?"",这样行吗?试试就知道了,re模块抛异常了,因为""就是一个反斜杠,对于正则表达式解析器来说,是一个转义字符,但是后面啥也没有,自然就报错了,""三个肯定是不行的,试试四个"\",完美匹配。
代码如下:

import re
re_str_patt = "\"
reObj = re.compile(re_str_patt)
str_test = "abccdhh"
print reObj.findall(str_test)


输出:['', '']

这里要这么理解,首先第一重转换是字符串自身的转义,那么"\",实际上就是表示两个反斜杠(两个字符),然后传入正则表达式解析器,因为反斜杠依然是转义字符,那么进行第二重转换,两个反斜杠就代表一个反斜杠,所以就能和一个反斜杠进行匹配了,那么匹配连续的两个反斜杠,写正则表达式时就要写8次""了,相当壮观,要匹配/d+(这个在正则表达式里面表示连续1一个以上的数字字符)这个字符串怎么写呢?
代码如下:

import re
re_str_patt = "\d+"
print re_str_patt
reObj = re.compile(re_str_patt)
print reObj.findall("d+")
写成re_str_patt = "\d+"也行,因为+对于字符串来说,没有转义意义,所以就当成一个反斜杠了。

在python中写正则表达式时用得最多的是raw字符串,原生字符串,什么意思?就是只有一重转换了,没有字符串转换了,只在正则表达式内部进行转换了,这样匹配一个反斜杠的正则表达式可以这样写,re_str_patt = r"",有人会想,以后写windows的文件路径什么的方便了,呵呵直接 path = r"c:myforderxx" 搞定,是的,这句没有问题,但是如果你写成 path = r"c:myforderxx",直接报错了,为什么?因为反斜杠虽然不作为转义字符了,但是还是对它后面的引号(包括单引号)有影响,使这个引号不被视为字符串的终止,以为它后面还有字符,但是实际没有,因此会报错。其实可以反过来想raw字符串里面要表示引号怎么办呢?,可以发现 path = r"123"xxx" 是可以的,那用raw字符串岂不是有局限性?不过raw在设计之初就是用来支持正则表达式的,而在正则里面反斜杠是转义字符,所以不可能出现在字符串的末尾的,所以建议不要图方便在其他的地方使用raw。

来源:https://www.tulaoshi.com/n/20160219/1592296.html

延伸阅读
标签: Web开发
最后写了一个IP地址的正则表达式验证程序。 代码如下: ((25[0-5]|2[0-4]\d|1?\d?\d)\.){3}(25[0-5]|2[0-4]\d|1?\d?\d) 截图如下:
标签: ASP
       最近很多帖子问如何将内容从数据库取出后换行,这就要用到正则表达式。简单的说,正则表达式是一种可以用于模式匹配和替换的强有力的工具。我们可以在许多编程语言中找到正则表达式的身影,例如,vi编辑器,Perl或PHP脚本语言,以及awk或sed shell程序等。此外,象JavaScript这种客户端的脚本语言也...
标签: ASP
  14.后向引用 正则表达式一个最重要的特性就是将匹配成功的模式的某部分进行存储供以后使用这一能力。请回想一下,对一个正则表 达式模式或部分模式两边添加圆括号将导致这部分表达式存储到一个临时缓冲区中。可以使用非捕获元字符 '?:', '?=', or '?!' 来忽略对这部分正则表达式的保存。 所捕获的每个子匹配都按照在正则表达式模式中...
标签: Web开发
首先,我们先看几个实际的例子: 1.验证输入字符是否 javascript: var ex = "^\\w+$"; var re = new RegExp(ex,"i"); return re.test(str); VBScript Dim regEx,flag,ex ex = "^\w+$" Set regEx = New RegExp regEx.IgnoreCase = True regEx.Global = True regEx.Pattern = ex flag = regEx.Test( str ) C# System...
标签: Web开发
当表达式被检查的时候,文字符号提供了编辑正则表达式的方法。利用文字符号可以使到正则表达式保持为常数。例如,如果你在一个循环中使用文字符号来构造一个正则表达式,正则表达式不需进行反复编译。正则表达式对象构造器,例如,new RegExp("ab+c"),提供正则表达式的运行时编译。当你知道正则表达式的模式会变化的时候,应该使用构造函...

经验教程

62

收藏

17
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部