正则表达式是查找和替换文本模式的一种简洁而灵活的表示法。Visual Studio “查找和替换”窗口的“查找内容”字段中可使用一组特定的正则表达式。
在“快速查找”、“在文件中查找”、“快速替换”或“在文件中替换”操作中,要在“查找内容”字段中使用正则表达式,请选择“查找选项”下的“使用”选项然后选择“正则表达式”。
“查找内容”字段旁的三角形“表达式生成器”按钮将可用。单击此按钮显示最常用正则表达式的列表。当从“表达式生成器”中选择任何项时,该项将插入到“查找内容”字符串中。
注意 |
“查找内容”字符串中可使用的正则表达式与 .NET Framework 编程中的有效正则表达式有语法上的区别。例如,在“查找和替换”中,大括号表示法 {} 用于带标记的表达式。因此,表达式 zo{1} 匹配所有 zo 后跟有标记 1 的搜索项,例如 Alonzo1 和 Gonzo1。但在 .NET Framework 中,{} 表示法用做限定符。因此表达式 zo{1} 匹配所有 z 后仅跟有一个 o 的搜索项,例如 zone,而 zoo 则不匹配。
|
用于“查找和替换”的正则表达式
以下是“表达式生成器”中可用的正则表达式。
表达式 |
语法 |
说明 |
任一字符
|
.
|
匹配除分行符外的任何一个字符。
|
零个或更多个
|
*
|
匹配前面表达式的零个或多个搜索项,寻找所有可能匹配。
|
一个或更多个
|
+
|
匹配前面表达式的至少一个搜索项。
|
行首
|
^
|
将匹配字符串锚定到行首。
|
行尾
|
$
|
将匹配字符串锚定到行尾。
|
词首
|
<
|
仅当词在文本中的此位置开始时才匹配。
|
词尾
|
>
|
仅当词在文本中的此位置结束时才匹配。
|
换行符
|
\n
|
匹配与平台无关的换行符。在“替换”表达式中,插入换行符。
|
集中的任何一个字符
|
[]
|
匹配 [] 内的任何一个字符。要指定字符的范围,请列出由短划线 (-) 分隔的起始字符和结束字符,如 [a-z] 中所示。
|
集中没有的任何一个字符
|
[^...]
|
匹配跟在 ^ 之后的不在字符集中的任何字符。
|
或
|
|
|
匹配 OR 符号 (|) 之前或之后的表达式。最常用在分组中。例如,(sponge|mud) bath 匹配“sponge bath”和“mud bath”。
|
转义符
|
\
|
按原义匹配反斜杠 (\) 之后的字符。这使您可以查找在正则表达式表示法中使用的字符,如 { 和 ^。例如,\^ 搜索 ^ 字符。
|
带标记的表达式
|
{}
|
匹配以带括号的表达式标记的文本。
|
C/C++ 标识符
|
:i
|
匹配表达式
([a-zA-Z_$ ][a-zA-Z0-9_$ ]*)。
|
带引号的字符串
|
:q
|
匹配表达式 (("[^"]*")|('[^']*'))。
|
空格或制表符
|
:b
|
匹配空格或制表符。
|
整数
|
:z
|
匹配表达式
([0-9]+)。
|
“查找”和“替换”操作中所有有效正则表达式的列表,比“表达式生成器”中可显示的列表长。您还可将以下任意正则表达式插入到“查找内容”字符串中:
表达式 |
语法 |
说明 |
最少 — 零个或更多个
|
@
|
匹配前面表达式的 0 个或更多搜索项,匹配尽可能少的字符。
|
最少 — 一个或更多个
|
#
|
匹配前面表达式的一个或更多搜索项,匹配尽可能少的字符。
|
重复 n 次
|
^n
|
匹配前面表达式的 n 次出现。例如,[0-9]^4 匹配任意 4 位数字的序列。
|
分组
|
()
|
将子表达式分组。
|
第 n 个带标记的文本
|
\n
|
在“查找”或“替换”表达式中,指示第 n 个带标记的表达式所匹配的文本,其中 n 是从 1 至 9 的数字。
在“替换”表达式中,\0 插入整个匹配的文本。
|
右对齐字段
|
\(w,n)
|
在“替换”表达式中,将字段中第 n 个带标记的表达式右对齐至少 w 字符宽。
|
左对齐字段
|
\(-w,n)
|
在“替换”表达式中,将字段中第 n 个带标记的表达式左对齐至少 w 字符宽。
|
禁止匹配
|
~(X)
|
当 X 出现在表达式中的此位置时禁止匹配。例如,real~(ity) 匹配“realty”和“really”中的“real”,而不匹配“reality”中的“real”。
|
字母数字字符
|
:a
|
匹配表达式
([a-zA-Z0-9])。
|
字母字符
|
:c
|
匹配表达式
([a-zA-Z])。
|
十进制数字
|
:d
|
匹配表达式
([0-9])。
|
十六进制数
|
:h
|
匹配表达式
([0-9a-fA-F]+)。
|
有理数
|
:n
|
匹配表达式 (([0-9]+.[0-9]*)|([0-9]*.[0-9]+)|([0-9]+))。
|
字母字符串
|
:w
|
匹配表达式
([a-zA-Z]+)。
|
转义符
|
\e
|
Unicode U+001B。
|
Bell
|
\g
|
Unicode U+0007。
|
Backspace
|
\h
|
Unicode U+0008。
|
制表符
|
\t
|
匹配制表符,Unicode U+0009。
|
Unicode 字符
|
\x#### 或 \u####
|
匹配 Unicode 值给定的字符,其中 #### 是十六进制数。可以用 ISO 10646 代码点或两个提供代理项对的值的 Unicode 码位指定基本多语种平面(即一个代理项)外的字符。
|
下表列出按标准 Unicode 字符属性进行匹配的语法。两个字母的缩写词与 Unicode 字符属性数据库中所列的一样。可将这些指定为字符集的一部分。例如,表达式 [:Nd:Nl:No] 匹配任何种类的数字。
表达式 |
语法 |
说明 |
大写字母
|
:Lu
|
匹配任何一个大写字母。例如,:Luhe 匹配“The”但不匹配“the”。
|
小写字母
|
:Ll
|
匹配任何一个小写字母。例如,:Llhe 匹配“the”但不匹配“The”。
|
词首大写字母
|
:Lt
|
匹配将大写字母和小写字母结合的字符,例如,Nj 和 Dz。
|
修饰符字母
|
:Lm
|
匹配字母或标点符号,例如逗号、交叉重音符和双撇号,用于表示对前一字母的修饰。
|
其它字母
|
:Lo
|
匹配其他字母,如哥特体字母 ahsa。
|
十进制数字
|
:Nd
|
匹配十进制数(如 0-9)和它们的双字节等效数。
|
字母数字
|
:Nl
|
匹配字母数字,例如罗马数字和表意数字零。
|
其它数字
|
:No
|
匹配其他数字,如旧斜体数字一。
|
开始标点符号
|
:Ps
|
匹配开始标点符号,例如左方括号和左大括号。
|
结束标点符号
|
:Pe
|
匹配结束标点符号,例如右方括号和右大括号。
|
左引号
|
:Pi
|
匹配左双引号。
|
右引号
|
:Pf
|
匹配单引号和右双引号。
|
破折号
|
:Pd
|
匹配破折号标记。
|
连接符号
|
:Pc
|
匹配下划线标记。
|
其他标点符号
|
:Po
|
匹配 (,)、?、"、!、@、#、%、&、*、\、(:)、(;)、' 和 /。
|
空白分隔符
|
:Zs
|
匹配空白。
|
行分隔符
|
:Zl
|
匹配 Unicode 字符 U+2028。
|
段落分隔符
|
:Zp
|
匹配 Unicode 字符 U+2029。
|
无间隔标记
|
:Mn
|
匹配无间隔标记。
|
组合标记
|
:Mc
|
匹配组合标记。
|
封闭标记
|
:Me
|
匹配封闭标记。
|
数学符号
|
:Sm
|
匹配 +、=、~、|、< 和 >。
|
货币符号
|
:Sc
|
匹配 $ 和其他货币符号。
|
修饰符号
|
:Sk
|
匹配修饰符号,如抑扬音、抑音符号和长音符号。
|
其它符号
|
:So
|
匹配其他符号,如版权符号、段落标记和度数符号。
|
其他控制
|
:Cc
|
匹配类似 TAB 和 NEWLINE 这样的 Unicode 控制字符。
|
其他格式
|
:Cf
|
格式控制字符,例如双向控制字符。
|
代理项
|
:Cs
|
匹配代理项对的一半。
|
其他私用
|
:Co
|
匹配私用区域的任何字符。
|
其它未分配字符
|
:Cn
|
匹配未映射到 Unicode 字符的字符。
|
除标准 Unicode 字符属性外,还可以指定下列附加属性作为字符集的一部分。
表达式 |
语法 |
说明 |
Alpha
|
:Al
|
匹配任何一个字符。例如,:Alhe 匹配“The”、“then”、“reached”等单词。
|
Numeric
|
:Nu
|
匹配任何一个数或数字。
|
标点
|
:Pu
|
匹配任何一个标点符号,如 ?、@、' 等等。
|
空白
|
:Wh
|
匹配所有类型的空格,包括印刷和表意文字的空格。
|
Bidi
|
:Bi
|
匹配诸如阿拉伯文和希伯来文这类从右向左书写的字符。
|
朝鲜文
|
:Ha
|
匹配朝鲜文和组合朝鲜文字母。
|
平假名
|
:Hi
|
匹配平假名字符。
|
片假名
|
:Ka
|
匹配片假名字符。
|
表意文字/汉字/日文汉字
|
:Id
|
匹配表意文字字符,如汉字和日文汉字
|