成为正则表达式大师的 20 个小步骤

“贪财是万恶之源……”

--钦定本圣经，提摩太前书 6:10

上述圣经经文经常被断章取义，开头几句被删去：“金钱是万恶之源”。完整的引文（如上所示）澄清了作者认为邪恶的并非金钱本身，而是对金钱的贪爱。前后几节经文强调，只要我们衣食无忧，还有什么可缺的呢？这短短的一段话是对贪婪的警示，同时也是对意图的教导，以及无意识事物固有的道德中立性。

一个常见的反对在编程中使用正则表达式（“RegEx”或简称“regex”）的俏皮话是 Jamie Zawinsky 的一句名言：

有些人遇到问题时会想：‘我知道，我会用正则表达式。’现在他们面临两个问题。 [来源]

……但使用正则表达式本身并无好坏之分。它本身不会增加你的问题，也不会解决任何问题。它只是一个工具。你使用它的方式（无论正确与否）决定了你会看到什么样的结果。如果你尝试使用正则表达式构建 HTML 解析器，你肯定会遇到麻烦。但如果你只是想从一些字符串中提取一些时间戳，那么应该没什么问题。

为了帮助您更好地掌握正则表达式，我整理了本教程，只需二十个小步骤，即可帮助您从零开始精通正则表达式。本指南主要侧重于正则表达式的基本概念，并仅在必要时深入探讨更复杂的主题/特定语言的扩展。

注意：除非另有说明，下面的所有正则表达式都是 Perl 兼容正则表达式(PCRE)。

步骤 1：正则表达式的用途
步骤 2：方括号[]
步骤 3：转义序列
步骤 4：“任意”字符.
步骤 5：字符范围
步骤 6：“非”插入符号^
步骤 7：字符类
步骤 8：星号*和加号+
步骤 9：“可选”问号?
步骤 10：“或”管道|
步骤 11：用于捕获组的括号()
步骤 12：首先定义更具体的匹配
步骤 13：用于定义重复的花括号{}
步骤 14：，\b零宽度边界字符
步骤 15：“行首”插入符号^和“行尾”美元符号$
步骤 16：非捕获组(?:)
步骤 17：反向引用\N和命名捕获组
步骤 18：前瞻和后瞻
步骤 19：条件
步骤 20：递归和进一步学习

步骤 1：正则表达式的目的

正则表达式用于在文本中查找模式。就是这样。这个模式可能很简单，比如这句话中的“dog”这个词：

The quick brown fox jumps over the lazy dog.

该正则表达式看起来像

dog

...很简单，是吧？

该模式也可以是任何包含 'o' 的单词。该正则表达式可能如下所示

\w*o\w*

（您可以在这里尝试该正则表达式。）

您会发现，随着“匹配”要求的复杂化，正则表达式也变得越来越复杂。有一些额外的符号用于指定字符组和匹配重复的模式，我将在下面进行解释。

但是，一旦我们在文本中发现了某种模式，我们该如何处理呢？现代正则表达式引擎允许你从文本中提取这些子字符串，或者删除它们，或者用其他文本替换它们。正则表达式用于文本解析和操作。

我们可能会提取类似 IP 地址的信息，然后尝试 ping 一下；或者我们可能会提取姓名和电子邮件地址，并将它们存入数据库。又或者，我们可能会使用正则表达式来查找电子邮件中的敏感信息（例如社保号或电话号码），并提醒用户他们可能正在面临风险。正则表达式确实是一个功能多样的工具，易于学习，但难以精通：

“就像演奏好一首乐曲和创作音乐之间存在差异一样，了解正则表达式和真正理解正则表达式之间也存在差异。”

—— Jeffrey EF Friedl，《掌握正则表达式》

[返回目录]

第二步：方括号`[]`

最容易理解的正则表达式是那些简单地寻找正则表达式模式和目标字符串之间的字符到字符匹配的表达式，例如：

pattern: cat
string:  The cat was cut when it ran under the car.
matches:     ^^^

班级	人物
`\d`	“数字”`[0-9]`
`\w`	“单词字符”`[A-Za-z0-9_]`
`\s`	“空白”`[ \t\r\n\f]`

成为正则表达式大师的 20 个小步骤

成为正则表达式大师的 20 个小步骤

目录

步骤 1：正则表达式的目的

第二步：方括号[]

流行测验：

步骤 3：转义序列

流行测验：

步骤 4：“任意”字符.

步骤 5：字符范围

流行测验：

第 6 步：非克拉^

流行测验：

步骤 7：字符类

流行测验：

步骤 8：星号*和加号+

流行测验：

步骤 9：“可选”问号?

流行测验：

步骤 10：“或”管道|

流行测验：

步骤 11：()用于捕获组的括号

流行测验：

步骤 12：首先定义更具体的匹配

流行测验：

步骤 13：花括号{}用于定义重复

流行测验：

步骤 14：，\b零宽度边界字符

流行测验：

步骤 15：“行首”克拉^和“行尾”美元符号$

流行测验：

步骤 16：非捕获组(?:)

流行测验：

步骤 17：反向引用\N和命名捕获组

流行测验：

步骤 18：前瞻和后瞻

流行测验：

步骤19：条件

流行测验：

步骤20：递归和进一步学习

第二步：方括号`[]`

步骤 4：“任意”字符`.`

第 6 步：非克拉`^`

步骤 8：星号`*`和加号`+`

步骤 9：“可选”问号`?`

步骤 10：“或”管道`|`

步骤 11：`()`用于捕获组的括号

步骤 13：花括号`{}`用于定义重复

步骤 14：，`\b`零宽度边界字符

步骤 15：“行首”克拉`^`和“行尾”美元符号`$`

步骤 16：非捕获组`(?:)`

步骤 17：反向引用`\N`和命名捕获组