共计 3985 个字符,预计需要花费 10 分钟才能阅读完成。
背景
Part1: 写在最前
使用 MySQL 或其他关系型数据库的朋友们都知道,使用模糊查询的用法类似于:
SELECT * FROM products WHERE sku like “%789”;
本文中介绍的 MongoDB 中的 regex 就是实现类似功能的,regex 为能使你在查询中使用正则表达式。本文会用简单的实例带您了解 MongoDB 中 regex 的用法~
Part2: 用法
使用 $regex 时,有以下几种用法:
{<field>: { $regex: /pattern/, $options: ‘<options>’} }
{<field>: { $regex: ‘pattern’, $options: ‘<options>’} }
{<field>: { $regex: /pattern/<options>} }
option 参数的含义:
选项 | 含义 | 使用要求 |
---|---|---|
i | 大小写不敏感 | |
m | 查询匹配中使用了锚,例如 ^(代表开头)和 $(代表结尾),以及匹配 \n 后的字符串 | |
x | 忽视所有空白字符 | 要求 $regex 与 $option 合用 |
s | 允许 点字符(.)匹配所有的字符,包括换行符。 | 要求 $regex 与 $option 合用 |
实战
Part1:$in 中的用法
要在 $in 查询中包含正则表达式,只能使用 JavaScript 正则表达式对象(即 / pattern /)。例如:
{name: { $in: [ /^acme/i, /^ack/] } }
Warning: 警告 $in 中不能使用 $ regex 运算符表达式。
Part2: 隐式 and 用法
要在逗号分隔的查询条件中包含正则表达式,请使用 $ regex 运算符。例如:
{name: { $regex: /acme.*corp/i, $nin: [ ‘acmeblahcorp’] } }
{name: { $regex: /acme.*corp/, $options: ‘i’, $nin: [ ‘acmeblahcorp’] } }
{name: { $regex: ‘acme.*corp’, $options: ‘i’, $nin: [ ‘acmeblahcorp’] } }
Part3:x 和 s 选项
要使用 x 选项或 s 选项,要求 $regex 与 $option 合用。例如,要指定 i 和 s 选项,必须使用 $ options 来执行以下操作:
{name: { $regex: /acme.*corp/, $options: “si”} }
{name: { $regex: ‘acme.*corp’, $options: “si”} }
Part4: 索引的使用
对于区分大小写的正则表达式查询,如果字段存在索引,则 MongoDB 将正则表达式与索引中的值进行匹配,这比全表扫描更快。如果正则表达式是“前缀表达式”,那么可以优化查询速度,且查询结果都会以相同的字符串开头。
正则表达式也要符合“最左前缀原则”,例如,正则表达式 /^abc.*/ 将通过仅匹配以 abc 开头的索引值来进行优化。
Warning: 警告
1. 虽然 /^a/,/^a.*/ 和 /^a.*$/ 匹配等效字符串,但它们的性能是不一样的。如果有对应的索引,所有这些表达式就都使用索引; 不过,/^a.*/ 和 /^a.*$/ 较慢。这是因为 /^a/ 可以在匹配前缀后停止扫描。
2. 不区分大小写的正则表达式查询通常不能使用索引,$regex 无法使用不区分大小写的索引。
Part5: 实例
一个商品的集合中,存了以下内容
{“_id” : 100, “sku” : “abc123”, “description” : “Single line description.”}
{“_id” : 101, “sku” : “abc789”, “description” : “First line\nSecond line”}
{“_id” : 102, “sku” : “xyz456”, “description” : “Many spaces before line”}
{“_id” : 103, “sku” : “xyz789”, “description” : “Multiple\nline description”}
如果想对该商品 products 集合执行一个查询,范围是 sku 列中的内容是 789 结尾的:
db.products.find({ sku: { $regex: /789$/} } )
结合 MySQL 理解的话,上述查询在 MySQL 中是这样的 SQL:
SELECT * FROM products WHERE sku like “%789”;
如果想查询 sku 是 abc、ABC 开头的,且匹配时忽略大小写,可以使用 i 选项:
db.products.find({ sku: { $regex: /^ABC/i} } )、
查询结果为:
{“_id” : 100, “sku” : “abc123”, “description” : “Single line description.”}
{“_id” : 101, “sku” : “abc789”, “description” : “First line\nSecond line”}
Part6:m 的使用
想查询描述中是包含 S 开头的,且要匹配 / n 后的 S 开头的,则需要加 m 选项
db.products.find({ description: { $regex: /^S/, $options: ‘m’} } )
返回的结果是:
{“_id” : 100, “sku” : “abc123”, “description” : “Single line description.”}
{“_id” : 101, “sku” : “abc789”, “description” : “First line\nSecond line”}
如果不加 m 选项的话,返回的结果是这样的:
{“_id” : 100, “sku” : “abc123”, “description” : “Single line description.”}
如果不使用 ^ 这类锚的话,那么会返回全部结果:
db.products.find({ description: { $regex: /S/} } )
{“_id” : 100, “sku” : “abc123”, “description” : “Single line description.”}
{“_id” : 101, “sku” : “abc789”, “description” : “First line\nSecond line”}
Part7:s 的使用
使用 s 选项来执行查询,则会让逗号. 匹配所有字符,包括换行符,下文查询了 description 列中 m 开头,且后面包含 line 字符串的结果:
db.products.find({ description: { $regex: /m.*line/, $options: ‘si’} } )
{“_id” : 102, “sku” : “xyz456”, “description” : “Many spaces before line”}
{“_id” : 103, “sku” : “xyz789”, “description” : “Multiple\nline description”}
如果不包含 s,则会返回:
{“_id” : 102, “sku” : “xyz456”, “description” : “Many spaces before line”}
Part8:x 的使用
以下示例使用 x 选项忽略空格和注释,用#表示注释,并以匹配模式中的 \ n 结尾:
var pattern = “abc #category code\n123 #item number”
db.products.find({ sku: { $regex: pattern, $options: “x”} } )
查询的结果是:
{“_id” : 100, “sku” : “abc123”, “description” : “Single line description.”}
可以看出,其忽略了 abc 与 #category 的空格以及#category 与 code 的空格,实际执行的查询是 sku 是 abc123 的结果。
——总结——
通过这几个案例,我们能够了解到 MongoDB 中的 regex 用法,以及其可选参数 $option 每个选项的含义和用法。
更多 MongoDB 相关教程见以下内容:
MongoDB 文档、集合、数据库简介 http://www.linuxidc.com/Linux/2016-12/138529.htm
MongoDB 3 分片部署及故障模拟验证 http://www.linuxidc.com/Linux/2016-12/138529.htm
Linux CentOS 6.5 yum 安装 MongoDB http://www.linuxidc.com/Linux/2016-12/137790.htm
CentOS 7 yum 方式快速安装 MongoDB http://www.linuxidc.com/Linux/2016-11/137679.htm
MongoDB 的查询操作 http://www.linuxidc.com/Linux/2016-10/136581.htm
在 Azure 虚拟机上快速搭建 MongoDB 集群 http://www.linuxidc.com/Linux/2017-09/146778.htm
MongoDB 复制集原理 http://www.linuxidc.com/Linux/2017-09/146670.htm
MongoDB 3.4 远程连接认证失败 http://www.linuxidc.com/Linux/2017-06/145070.htm
Ubuntu 16.04 中安装 MongoDB3.4 数据库系统 http://www.linuxidc.com/Linux/2017-07/145526.htm
MongoDB 权威指南第 2 版 PDF 完整带书签目录 下载见 http://www.linuxidc.com/Linux/2016-12/138253.htm
MongoDB 的详细介绍:请点这里
MongoDB 的下载地址:请点这里
本文永久更新链接地址:http://www.linuxidc.com/Linux/2018-02/150911.htm