MySQL LIKE 语句：基础语法与高级应用

2025-4-13

MySQL `LIKE` 语句：深入探索基础语法与高级应用

在关系型数据库管理系统 MySQL 中，数据检索是核心操作之一。当我们需要根据不完全精确的文本模式来查找数据时，SQL 提供的 LIKE 操作符就显得尤为重要。它允许我们使用通配符在字符串列中执行模式匹配，极大地增强了查询的灵活性。本文将深入探讨 MySQL 中 LIKE 语句的方方面面，从基础语法到高级应用技巧，并讨论其性能影响和替代方案。

一、`LIKE` 语句的基础

1. 基本语法

LIKE 操作符通常用在 SELECT, UPDATE, DELETE 语句的 WHERE 子句中，用于指定搜索模式（pattern）。其基本语法结构如下：

sql SELECT column1, column2, ... FROM table_name WHERE column_name LIKE pattern;

或者在 UPDATE 或 DELETE 语句中：

```sql
UPDATE table_name
SET column1 = value1, ...
WHERE column_name LIKE pattern;

DELETE FROM table_name
WHERE column_name LIKE pattern;
```

这里的关键在于 pattern，它是一个包含文本字符和特殊通配符的字符串。

2. 通配符（Wildcards）

LIKE 的强大之处在于其支持的通配符。MySQL 主要支持两种标准的 SQL 通配符：

百分号 (%): 代表零个、一个或多个任意字符。
- 'a%'：匹配以 "a" 开头的任何字符串（如 "apple", "art", "a"）。
- '%a'：匹配以 "a" 结尾的任何字符串（如 "banana", "java", "a"）。
- '%a%'：匹配包含 "a" 的任何字符串（如 "database", "manage", "a"）。
- 'a%b'：匹配以 "a" 开头、以 "b" 结尾的任何字符串（如 "ab", "absorb", "alibaba"）。
下划线 (_): 代表有且只有一个任意字符。
- 'h_t'：匹配以 "h" 开头、以 "t" 结尾，且中间只有一个字符的字符串（如 "hot", "hat", "hit"）。
- '_at'：匹配以 "at" 结尾，且前面只有一个字符的字符串（如 "cat", "bat", "hat"）。
- '__a%'：匹配第三个字符是 "a" 的任何字符串（如 "what", "database", "scala"）。

3. 结合使用通配符

% 和 _ 可以组合使用，以创建更复杂的匹配模式：

'a_%'：匹配以 "a" 开头，且至少有两个字符的字符串（如 "an", "apple"）。
'_a%b_'：匹配第二个字符是 "a"，倒数第二个字符是 "b"，且总长度至少为 4 个字符的字符串（如 "table", "payable"）。

4. `NOT LIKE` 操作符

与 LIKE 相对的是 NOT LIKE 操作符，它用于查找不匹配指定模式的行。语法与 LIKE 类似：

sql SELECT column1, column2, ... FROM table_name WHERE column_name NOT LIKE pattern;

例如，要查找用户名不以 "admin" 开头的用户：

sql SELECT username FROM users WHERE username NOT LIKE 'admin%';

二、`LIKE` 语句的进阶细节

1. 区分大小写（Case Sensitivity）

LIKE 操作符是否区分大小写取决于其操作的列所使用的字符集校对规则（Collation）。

大小写不敏感校对（Case-Insensitive, _ci）: 这是 MySQL 中许多默认校对规则（如 utf8mb4_general_ci, latin1_swedish_ci）的特性。在这种情况下，'a%' 会同时匹配 "Apple" 和 "apple"。
sql -- 假设 name 列使用 _ci 校对规则 SELECT name FROM products WHERE name LIKE 'apple%'; -- 会匹配 'Apple', 'apple', 'APPLE' 等
大小写敏感校对（Case-Sensitive, _cs）: 如果列的校对规则是大小写敏感的（如 utf8mb4_cs, latin1_general_cs），那么 LIKE 的匹配也会区分大小写。'a%' 只会匹配 "apple"，不会匹配 "Apple"。
二进制校对（Binary, _bin）: 使用二进制校对规则（如 utf8mb4_bin, latin1_bin）时，比较是基于字符的二进制字节值进行的，因此天然是大小写敏感的，并且对重音符号等也敏感。

强制区分大小写:
即使列的默认校对规则是大小写不敏感的，你也可以在查询时强制进行大小写敏感的 LIKE 比较，方法是使用 BINARY 关键字：

sql SELECT name FROM products WHERE name LIKE BINARY 'apple%'; -- 只会匹配以小写 'a' 开头的

强制不区分大小写:
虽然不常见（因为 _ci 校对规则通常是默认），但理论上如果列是 _cs 或 _bin，可以通过 COLLATE 子句临时改变校对规则来实现不区分大小写的匹配：

sql SELECT name FROM products WHERE name LIKE 'apple%' COLLATE utf8mb4_general_ci;

了解和控制大小写敏感性对于确保查询结果的准确性至关重要。可以通过 SHOW CREATE TABLE table_name; 查看表的默认字符集和校对规则，或通过 SHOW COLUMNS FROM table_name; 查看特定列的校对规则。

2. 转义特殊字符（Escaping Wildcards）

有时，我们需要搜索的文本本身就包含 % 或 _ 字符。例如，查找包含 "50%" 的产品描述。直接使用 LIKE '%50%%' 是错误的，因为第二个 % 会被解释为通配符。

为了匹配这些特殊字符本身，需要进行转义。MySQL 默认的转义字符是反斜杠 (\)。

要匹配 %，使用 \%。
要匹配 _，使用 \_。
要匹配 \ 本身，使用 \\。

示例：

```sql
-- 查找 description 列中包含 '50%' 的记录
SELECT product_name, description
FROM products
WHERE description LIKE '%50\%%';

-- 查找 code 列中包含下划线 '_' 的记录
SELECT id, code
FROM items
WHERE code LIKE '%_%';

-- 查找 path 列中包含反斜杠 '\' 的记录 (例如 Windows 路径)
SELECT id, path
FROM files
WHERE path LIKE '%\%';
```

自定义转义字符 (ESCAPE 子句):
如果数据中本身包含大量反斜杠，或者你想使用不同的转义字符，可以使用 ESCAPE 子句来指定。

```sql
-- 使用 '#' 作为转义字符，查找包含 '100%' 的字符串
SELECT comment
FROM reviews
WHERE comment LIKE '%100#%' ESCAPE '#';

-- 使用 '!' 作为转义字符，查找包含 '' 的用户名
SELECT username
FROM users
WHERE username LIKE '%!%' ESCAPE '!';
```

使用 ESCAPE 子句可以提高查询的可读性，并避免与数据中可能存在的默认转义符冲突。

三、`LIKE` 语句的性能考量

虽然 LIKE 非常灵活，但在处理大型数据集时，其性能可能成为瓶颈，尤其是在模式的开头使用通配符时。

1. 索引的使用情况

前导通配符 (%...): 当 LIKE 模式以 % 开头时（如 '%keyword' 或 '%keyword%'），数据库优化器通常无法有效利用该列上的标准 B-Tree 索引。因为索引是按值的开头排序的，如果开头未知，数据库就无法快速定位到可能的匹配项，往往需要进行全表扫描（Full Table Scan）或全索引扫描（Full Index Scan），这在数据量大时非常耗时。
后缀通配符 (keyword%): 当 LIKE 模式以固定字符开头，仅在末尾使用 % 时（如 'prefix%'），数据库优化器可以利用索引。它可以通过索引快速定位到所有以 "prefix" 开头的条目范围，然后在这个较小的范围内进行匹配。这通常比全表扫描快得多。
下划线 (_): _ 通配符的使用对索引的影响介于两者之间。如果 _ 不在模式的开头，索引可能在一定程度上被利用。例如，'a_c% 可能会比 'a%c% 更有效地使用索引，因为它限制了第二个字符。但如果模式以 _ 开头（如 '_bc%'），索引利用率同样会很低。

2. 性能优化建议

尽可能避免前导通配符: 如果业务逻辑允许，尽量设计查询，使 LIKE 模式的开头是确定的字符。例如，如果用户搜索 "apple"，与其使用 '%apple%'，不如考虑是否可以引导用户进行更精确的搜索，或者优先使用 'apple%'。
使用覆盖索引（Covering Index）: 如果查询只需要 LIKE 匹配列和索引中包含的其他列，创建覆盖索引可以避免回表查询（访问数据行），即使无法完全利用索引进行定位，也能减少 I/O 操作。
数据长度: LIKE 操作在较短的列上通常比在非常长的 TEXT 或 BLOB 列上更快。
考虑替代方案: 对于复杂的文本搜索需求或对性能要求极高的场景，应考虑使用 MySQL 的全文索引（Full-Text Search）或外部搜索引擎（如 Elasticsearch, Solr）。

四、`LIKE` 的高级应用与场景

1. 结合其他操作符

LIKE 可以与 AND, OR, NOT 等逻辑操作符结合，构建更复杂的查询条件：

```sql
-- 查找名字以 'J' 开头，并且 email 包含 '@example.com' 的用户
SELECT * FROM users
WHERE first_name LIKE 'J%' AND email LIKE '%@example.com';

-- 查找产品代码以 'SKU-' 开头，或者描述中包含 'limited edition' 的产品
SELECT * FROM products
WHERE product_code LIKE 'SKU-%' OR description LIKE '%limited edition%';
```

2. 数据清洗与校验

LIKE 可以用于识别不符合特定格式的数据：

```sql
-- 查找格式不正确的电话号码（假设标准格式是 (XXX) XXX-XXXX）
SELECT phone_number
FROM contacts
WHERE phone_number NOT LIKE '() -____'; -- 使用下划线精确匹配位数

-- 查找包含非数字字符的邮政编码（假设应为纯数字）
SELECT postal_code
FROM addresses
WHERE postal_code LIKE '%[^0-9]%'; -- 注意：这是 REGEXP 的语法，LIKE 不支持字符类。
-- 对于 LIKE，可能需要更复杂的 OR 组合或使用 REGEXP
-- 使用 LIKE 的近似方法（查找包含字母或特殊符号的）：
SELECT postal_code FROM addresses
WHERE postal_code LIKE '%A%' OR postal_code LIKE '%B%' OR ... -- (非常繁琐)
OR postal_code LIKE '%!%' OR postal_code LIKE '%@%' OR ... ;
-- 这种场景下，使用 REGEXP 通常更佳:
-- SELECT postal_code FROM addresses WHERE postal_code REGEXP '[^0-9]';
`` 上述例子说明，虽然LIKE可以做一些基本格式检查，但对于复杂的模式验证，正则表达式 (REGEXP或RLIKE`) 通常是更强大和简洁的选择。

3. 在 JSON 数据中使用 `LIKE`

MySQL 支持 JSON 数据类型。虽然有专门的 JSON 函数进行精确匹配和路径提取，但在某些情况下，你可能想对 JSON 字符串值的一部分进行模糊匹配。这通常需要先提取出字符串，然后应用 LIKE。

``sql -- 假设details` 列是 JSON 类型，包含 {"name": "...", "tags": ["..."]}
-- 查找 'details' JSON 中 'name' 字段包含 "Pro" 的记录
SELECT *
FROM products
WHERE JSON_EXTRACT(details, '$.name') LIKE '%Pro%';
-- 或者使用更简洁的 ->> 操作符（提取为文本）
SELECT *
FROM products
WHERE details ->> '$.name' LIKE '%Pro%';

-- 查找 'tags' 数组中包含以 'tech' 开头的标签的记录 (注意：这匹配的是整个数组的字符串表示)
-- 更准确的做法是先用 JSON 函数检查数组元素
SELECT *
FROM products
WHERE JSON_SEARCH(details, 'one', 'tech%', NULL, '$.tags[*]') IS NOT NULL;
-- 如果确实想对数组的字符串表示进行 LIKE (不推荐，但演示语法)
SELECT *
FROM products
WHERE JSON_EXTRACT(details, '$.tags') LIKE '%"tech%';
`` **注意**: 对 JSON 内部值使用LIKE` 通常效率不高，应优先使用 JSON 函数和索引（如多值索引或基于函数/生成列的索引）。

4. 动态构建 `LIKE` 查询

在应用程序代码中（如 PHP, Python, Java），经常需要根据用户输入动态构建 SQL 查询。LIKE 是实现搜索功能的常用方式。

```python

Python (使用 SQLAlchemy 示例)

from sqlalchemy import create_engine, text

search_term = input("Enter search term: ")

重要：使用参数绑定防止 SQL 注入！

pattern = f"%{search_term}%"

engine = create_engine("mysql+mysqlconnector://user:password@host/db_name")
with engine.connect() as connection:
query = text("SELECT * FROM articles WHERE title LIKE :pattern OR content LIKE :pattern")
result = connection.execute(query, {"pattern": pattern})
for row in result:
print(row)
`` **关键点**: 在动态构建含LIKE` 的查询时，必须使用参数化查询（Prepared Statements）来防止 SQL 注入攻击。永远不要直接将用户输入拼接到 SQL 字符串中。

五、`LIKE` 的替代方案

当 LIKE 无法满足需求或性能不佳时，可以考虑以下替代方法：

1. `REGEXP` / `RLIKE` (Regular Expressions)

MySQL 支持使用正则表达式进行更复杂的模式匹配。REGEXP (或其同义词 RLIKE) 操作符提供了比 LIKE 更强大的模式匹配能力，包括字符类、量词、分组、边界匹配等。

```sql
-- 查找以数字开头的产品代码
SELECT product_code FROM products WHERE product_code REGEXP '^[0-9]';

-- 查找 email 格式基本合法的用户 (简化示例)
SELECT email FROM users WHERE email REGEXP '^[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+.[A-Za-z]{2,}$';
`` **优点**: 模式表达能力极强。 **缺点**: * 通常比LIKE（尤其是有后缀通配符的LIKE）性能更差，因为它们一般无法有效利用标准索引。 * 语法相对复杂，学习曲线较陡。 * MySQL 8.0 之后对正则表达式引擎有所改进，并引入了REGEXP_LIKE(),REGEXP_REPLACE(),REGEXP_INSTR(),REGEXP_SUBSTR()` 等函数，功能更完善。

2. 全文索引（Full-Text Search）

对于在大型文本字段（如文章内容、产品描述）中进行自然语言搜索，MySQL 的全文索引 (FULLTEXT) 和 MATCH() ... AGAINST() 语法是更优的选择。

```sql
-- 首先，需要在相关列上创建 FULLTEXT 索引
ALTER TABLE articles ADD FULLTEXT INDEX ft_index (title, body);

-- 然后，使用 MATCH() AGAINST() 进行搜索
-- 自然语言模式 (默认)
SELECT * FROM articles
WHERE MATCH(title, body) AGAINST('database performance optimization' IN NATURAL LANGUAGE MODE);

-- 布尔模式 (支持 +, -, *, "" 等操作符)
SELECT * FROM articles
WHERE MATCH(title, body) AGAINST('+database -sql +performance' IN BOOLEAN MODE);
`` **优点**: * 专为文本搜索设计，考虑了词语、停用词、相关性排序等。 * 性能通常远超LIKE '%keyword%'或REGEXP进行的全文搜索。 * 支持更自然的查询语法和布尔逻辑。 **缺点**: * 需要额外创建和维护FULLTEXT索引，占用存储空间。 * 主要适用于单词或短语的匹配，对于精确的子串匹配（如LIKE的%substring%）可能不是最佳选择，尽管可以通过布尔模式部分模拟。 * 有最小词长（ft_min_word_len`）等配置限制。

六、总结与最佳实践

MySQL 的 LIKE 语句是 SQL 工具箱中一个基础且强大的工具，用于基于模式匹配的字符串搜索。掌握其基本语法、通配符用法、大小写敏感性、转义规则至关重要。

核心要点与最佳实践:

理解通配符: 熟练运用 % (零或多个字符) 和 _ (单个字符)。
注意性能: 尽量避免在前导位置使用 % 或 _，因为这通常会导致无法利用索引而进行全表扫描。优先使用后缀通配符 (keyword%)。
管理大小写: 了解列的校对规则如何影响 LIKE 的大小写敏感性，并知道如何使用 BINARY 关键字或 COLLATE 子句来强制所需行为。
正确转义: 当需要匹配 %, _, \ 字符本身时，使用默认的 \ 或通过 ESCAPE 子句指定的字符进行转义。
考虑替代方案: 对于复杂的模式匹配，使用 REGEXP 可能更简洁有效；对于大规模文本内容的搜索，优先考虑 FULLTEXT 索引和 MATCH() AGAINST() 以获得更好的性能和相关性。
安全第一: 在应用程序中动态构建 LIKE 查询时，务必使用参数化查询或预处理语句，防止 SQL 注入。
测试与监控: 对包含 LIKE 的查询进行性能测试，特别是在大数据量下，并监控其对数据库负载的影响。

通过深入理解 LIKE 的工作原理、潜在的性能陷阱以及何时选择更合适的替代方案，开发者和数据库管理员可以更有效地利用 MySQL 进行数据检索，构建出既功能强大又性能优良的应用程序。LIKE 虽然简单，但精通其细节与应用场景，是每一位 MySQL 使用者必备的技能。

作者：admin

链接：https://hostlocvps.com/2025/04/13/mysql-like-%e8%af%ad%e5%8f%a5%ef%bc%9a%e5%9f%ba%e7%a1%80%e8%af%ad%e6%b3%95%e4%b8%8e%e9%ab%98%e7%ba%a7%e5%ba%94%e7%94%a8/

文章版权归作者所有，未经允许请勿转载。

THE END

Project X：核心功能全方位介绍

<<上一篇

Python TensorFlow 教程：学习资源与简介

下一篇>>