JavaScript正则表达式与RegExp对象

你好,有抱负的程序员们!今天,我们将踏上一段激动人心的旅程,探索JavaScript中的正则表达式(RegEx)世界。如果你之前从未听说过RegEx,不用担心——我们将从最基础的知识开始,逐步深入。在本教程结束时,你将能够像专业人士一样挥舞RegEx的力量!

JavaScript - RegExp

什么是正则表达式?

正则表达式,通常简称为RegEx,是用于模式匹配和字符串操作的强大工具。可以将其视为一种用于描述文本中模式的特殊语言。它们就像瑞士军刀一样,用于处理字符串——多功能且极其有用!

让我们从一个简单的例子开始:

let pattern = /hello/;
let text = "Hello, world!";
console.log(pattern.test(text));  // 输出: false

在这个例子中,/hello/是我们的RegEx模式,我们在测试它是否与文本"Hello, world!"匹配。结果是false,因为RegEx默认是区分大小写的。

RegExp对象

在JavaScript中,我们可以使用RegExp对象来创建RegEx模式。下面是如何操作:

let pattern1 = new RegExp("hello");
let pattern2 = /hello/;

console.log(pattern1.test("hello world"));  // 输出: true
console.log(pattern2.test("hello world"));  // 输出: true

这两种创建RegExp对象的方式是等价的。字面量表示法(/pattern/)由于简单性而更常被使用。

修饰符

修饰符允许我们改变RegEx模式的行为。让我们看看一些常见的修饰符:

修饰符 描述
i 不区分大小写匹配
g 全局匹配(找到所有匹配项,而不仅仅是第一个)
m 多行匹配

以下是一个使用'i'修饰符的例子:

let pattern = /hello/i;
let text = "Hello, World!";
console.log(pattern.test(text));  // 输出: true

现在,我们的模式无论大小写都可以匹配"Hello"!

括号

在RegEx中,括号用于定义要匹配的字符集或范围:

括号 描述
[abc] 匹配括号中的任何字符
[^abc] 匹配不在括号中的任何字符
[0-9] 匹配从0到9的任何数字
[a-z] 匹配任何小写字母

以下是一个例子:

let pattern = /[aeiou]/;
console.log(pattern.test("hello"));  // 输出: true
console.log(pattern.test("why"));    // 输出: false

这个模式匹配任何元音字母。它在"hello"中找到匹配项,但在"why"中没有找到。

量词

量词指定必须存在多少个字符、组或字符类才能找到匹配项。

量词 描述
* 0或多次出现
+ 1或多次出现
? 0或1次出现
{n} 正好n次出现
{n,} n或多次出现
{n,m} 在n和m次出现之间

以下是一个有趣的例子:

let pattern = /ba+/;
console.log(pattern.test("b"));      // 输出: false
console.log(pattern.test("ba"));     // 输出: true
console.log(pattern.test("baaaa"));  // 输出: true

这个模式匹配"ba"后面跟着任意数量的"a"。就像羊的叫声:"baaaa"!

字面字符

RegEx中的字面字符就是它们本身——它们匹配自己。例如,/hello/匹配确切的字符序列"hello"。

let pattern = /hello world/;
console.log(pattern.test("hello world"));  // 输出: true
console.log(pattern.test("hello earth"));  // 输出: false

元字符

元字符在RegEx中有特殊含义:

元字符 描述
. 匹配任何单个字符
\d 匹配任何数字
\D 匹配任何非数字
\w 匹配任何单词字符
\W 匹配任何非单词字符
\s 匹配任何空白字符
\S 匹配任何非空白字符

以下是一些元字符的使用示例:

let pattern = /\d{3}-\d{3}-\d{4}/;
console.log(pattern.test("123-456-7890"));  // 输出: true
console.log(pattern.test("abc-def-ghij"));  // 输出: false

这个模式匹配典型的美国电话号码格式。

RegExp属性

RegExp对象有几个有用的属性:

属性 描述
global 是否设置了"g"标志
ignoreCase 是否设置了"i"标志
multiline 是否设置了"m"标志
source 模式的文本
lastIndex 下一个匹配的起始索引

以下是如何使用这些属性:

let pattern = /hello/gi;
console.log(pattern.global);      // 输出: true
console.log(pattern.ignoreCase);  // 输出: true
console.log(pattern.source);      // 输出: "hello"

RegExp方法

最后,让我们看看一些我们可以与RegExp对象一起使用的方法:

方法 描述
exec() 在字符串中执行搜索以找到匹配项
test() 在字符串中测试以找到匹配项
toString() 返回正则表达式的字符串表示

以下是一个使用exec()的例子:

let pattern = /\d+/g;
let text = "I have 2 apples and 3 oranges.";
let match;

while ((match = pattern.exec(text)) !== null) {
console.log(`Found ${match[0]} at index ${match.index}`);
}

// 输出:
// Found 2 at index 7
// Found 3 at index 23

这段代码找到文本中的所有数字并报告它们的位置。

就这样!我们已经覆盖了JavaScript中正则表达式的基础知识。记住,熟能生巧。尝试创建你自己的模式并测试它们。在你意识到之前,你将能够使用RegEx轻松解决各种字符串操作问题!

快乐编码,愿你的正则表达式总能找到匹配项!

Credits: Image by storyset