glob文件匹配规则

glob 是由普通字符和 /通配符 组成的字符串,用于 匹配文件路径。可以利用一个或多个 glob 在文件系统中定位文件。

它本身属于一种标准,并且各类语言都有其完整实现。本文将基于 node-glob 进行语法讲解。

glob

前言

文件匹配对于操作文件系统是很有必要的,他能帮助你方便,快捷的匹配到要找的目标文件,这对构建工具尤其有用,比如 gulpwebpack 等,它可以根据你书写的规则高效匹配文件资源,提升构建速度。

下面将介绍 glob 的匹配语法。

分隔符

字符串片段(segment)是指两个分隔符之间的所有字符组成的字符串。在 glob 中,分隔符永远是 / 字符。不区分操作系统,即便是在采用 \\ 作为分隔符的 Windows 操作系统中。

下面表示匹配 src 下的 a.js

1
'src/a.js'

注意:
glob 中,\\ 字符被保留作为转义符使用。

如下, * 被转义了,因此,* 将被作为一个普通字符使用,而不再是 通配符 了。

1
'glob_with_uncommon_\\*_character.js'

所以,以上规则表示,匹配当前目录下的 glob_with_uncommon_*_character.js 文件。

特殊字符

特殊字符用来限制文件的匹配规则,你也可以称之为 通配符

*(一个星号)

在一个字符串片段中匹配任意数量的字符,包括零个匹配。对于匹配单级目录下的文件很有用。

下面这个 glob 能够匹配类似 index.js 的文件,但是不能匹配类似 scripts/index.jsscripts/nested/index.js 的文件。

1
'*.js'

**(两个星号)

在多个字符串片段中匹配任意数量的字符,包括零个匹配。 对于匹配嵌套目录下的文件很有用。请确保适当地限制带有两个星号的 glob 的使用,以避免匹配大量不必要的目录。

下面这个 glob 被适当地限制在 scripts/ 目录下。它将匹配类似 scripts/index.js、scripts/nested/index.jsscripts/nested/twice/index.js 的文件。

1
'scripts/**/*.js'

在上面的示例中,如果没有 scripts/ 这个前缀做限制,node_modules 目录下的所有目录或其他目录也都将被匹配。

? 通配符

? 表示匹配 1 个字符。

1
'abc?.js'

以上表示匹配,类似 abc0.jsabc1.js 这样的文件。? 占据的位置可以是任何字符,但是你得存在。

?(pattern|pattern|pattern)

匹配满足 0 个 条件 或 1 个条件的文件

1
'test/dir/?(ab)c.js'

以上表示匹配,test/dir 文件夹下的 abc.jsc.js 文件。

!(pattern|pattern|pattern)

匹配不满足提供的条件的文件。

1
'test/dir/!(a|c)b.js'

以上会匹配在 test/dir 文件夹下,非 ac 开头的,以 b 结尾的文件。

+(pattern|pattern|pattern)

匹配满足 1 个及以上条件的文件。

1
'test/dir/+(ab)c.js'

以上模式会匹配到 test/dir 文件夹下的 ababc.jsabc.js 这样的文件。

*(pattern|pattern|pattern)

匹配满足 0 个及以上条件的文件。

1
'test/dir/*(a|b)b.js'

以上模式会匹配到 test/dir 文件夹下的 b.jsab.jsbb.js 文件。

@(pattern|pat*|pat?erN)

精确匹配提供条件之一的文件。

1
'test/dir/@(a|c)b.js'

以上表示精确匹配 test/dir 文件夹下的 ab.jscb.js 文件。

字符范围匹配

这个匹配规则类似于 RegExp 对象中的 [...]。可以用于表示一个字符的范围。

1
'test/dir/[a-z].js'

以上表示匹配 test/dir 文件夹下像 a.jsb.js 等等这样的文件。

1
'test/dir/[0-9].js'

以上表示匹配 test/dir 文件夹下像 0.js1.js 等等这样的文件。

你还可以像 RegExp 对象那样,使用 ^! 进行取反操作。

1
2
3
'test/dir/[^0-9].js'

// 'test/dir/[!0-9].js'

这样对匹配 test/dir 文件夹下,以非单个数字命名的文件。例如 1.js,就不会被匹配到。

扩展

gulp

gulp 中,其将 glob 进行了扩展,可以将多个 glob 进行组合,glob 匹配时按照每个 glob 在数组中的位置依次进行匹配操作。

下面是 gulp 中的一个取反匹配操作:

第一个 glob 匹配到一组匹配项,然后后面的取反 glob 删除这些匹配项中的一部分。

glob 数组中的取反 (negative)glob 必须跟在一个非取反 (non-negative)glob 后面。

1
['script/**/*.js', '!scripts/vendor/']

如果任何取反 (non-negative)glob 跟随着一个非取反 (negative)glob,任何匹配项都不会被删除。

1
['script/**/*.js', '!scripts/vendor/', 'scripts/vendor/react.js']

如上规则,由于第三个 glob 的原因,第二个 glob 配置并不会生效,所以该条规则会递归返回 script 文件夹下的所有 .js 文件。

取反 (negative) glob 可以作为对带有两个星号的 glob 的限制手段。

1
['**/*.js', '!node_modules/']

在上面的示例中,如果取反 (negative)glob!node_modules/**/*.js,那么各匹配项都必须与取反 glob 进行比较,这将导致执行速度极慢。

参考链接