正则表达式

# 正则表达式（Regex）

正则表达式（Regular Expression，简称Regex）是一种用于匹配字符串的强大工具，在文本搜索、数据提取、字符串替换等领域广泛应用。本教程将从基础到高级，系统介绍正则表达式的使用方法。

正则表达式是一种模式（Pattern），用于匹配文本中的特定字符串。它可以用于：

在Python、JavaScript、Java等多种编程语言中，正则表达式都有相应的支持库。

符号	含义	示例
`.`	匹配任意单个字符（除换行符）	`c.t` 可匹配 `cat`, `cut`, `c1t` 等
`^`	匹配字符串的开头	`^hello` 可匹配 `"hello world"` 但不匹配 `"hi hello"`
`$`	匹配字符串的结尾	`world$` 可匹配 `"hello world"` 但不匹配 `"world hello"`
`*`	匹配前一个字符 0 次或多次	`ab*c` 可匹配 `"ac"`, `"abc"`, `"abbc"`
`+`	匹配前一个字符 1 次或多次	`ab+c` 可匹配 `"abc"`, `"abbc"`，但不匹配 `"ac"`
`?`	匹配前一个字符 0 次或1次	`ab?c` 可匹配 `"ac"` 和 `"abc"`
`{n}`	匹配前一个字符 n 次	`a{3}` 只匹配 `"aaa"`
`{n,}`	匹配前一个字符至少 n 次	`a{2,}` 匹配 `"aa"`, `"aaa"`, `"aaaa"`
`{n,m}`	匹配前一个字符 n 到 m 次	`a{2,4}` 匹配 `"aa"`, `"aaa"`, `"aaaa"`
`[]`	匹配括号中的任意字符	`[abc]` 可匹配 `"a"`, `"b"`, `"c"`
`\|`	逻辑“或”
`\`	转义特殊字符	`\.` 可匹配 `.`（点）本身

字符类用于定义一组可匹配的字符。

正则表达式提供了一些预定义的字符，代表常见的字符类型。

用小括号 () 将部分模式分组，以便引用。

示例：

(\d{3})-(\d{2})-(\d{4})

匹配 "123-45-6789"，并捕获：

在替换或匹配中，可用 \1 引用之前匹配的组。

示例：

(\w+)\s\1

可匹配 "hello hello"（重复单词）。

模式	匹配规则
`.*`	贪婪匹配（尽可能多匹配）
`.*?`	惰性匹配（尽可能少匹配）

示例：

<.*>

匹配 <div>hello</div>，但会匹配整个 <div>hello</div>。

如果使用：

<.*?>

则只匹配 <div>。

^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

^1[3-9]\d{9}$

https?:\/\/(www\.)?[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}(/.*)?$

上次更新: 2025/10/30, 11:12:14