2026-02-15发表2026-02-22更新lectureware16 分钟读完 (大约2470个字)
20260213search&string


---
marp: true
theme: default
math: mathjax
---

# 2026/02/13 搜索 & 字符串

---

# 1. 搜索

+ 剪枝

+ A*

+ 迭代加深

---

# 剪枝

(搜索的复杂度很高，因此很少作为正解出现，绝大多数情况下还是一种骗分的方法。我们要尽可能的优化，才能骗到更多的分)

常见经典剪枝方法：

+ a. 记忆化搜索

+ b. 最优性剪枝

+ c. 可行性剪枝

许多题目都需要同时用多种剪枝优化。

---

# a. 记忆化搜索

可以看做递归版的 DP

**例题：[P1434 [SHOI2002] 滑雪](https://www.luogu.com.cn/problem/P1434)**

---

# b. 最优性剪枝

最优性剪枝：当前已不可能优于已知最优解

if (当前价值 + 最优估计 <= 当前最优解) return;

---

# c. 可行性剪枝

if (剩余的资源在最优利用情况下仍不能满足条件) return;

**例题：[P2329 [SCOI2005] 栅栏](https://www.luogu.com.cn/problem/P2329)**

---

上述几种只是通用的套路，而往往最关键的优化是根据题目具体情境产生的。

**例题：[P1731 [NOI1999] 生日蛋糕](https://www.luogu.com.cn/problem/P1731)**

1. 搜索方向

2. 最优性剪枝（预估最优答案）

3. 可行性剪枝（剩余体积过多）

数据加强版还需要其他具体的优化。

---

# A*

A* 是一种在带权有向图上，找到从起点到终点最短路径的算法。

核心：$f(x) = g(x) + h(x)$

即假设我们要从点 $s$ 走到点 $t$，当前处于点 $x$。

$g_{s\rightarrow x}$ 是已知代价，而关键在于设置预估函数 $h_{x\rightarrow t}$

---

我们维护一个优先队列，每次取出 $f$ 最小的位置进行扩展。（详细演示）

若 $h\equiv h'$，即估计是完全精确的，那么我们就会严格按照最优路径行进。

若 $h\equiv 0$，那么就退化成了 $\text{Dijkstra}$ 算法。

若 $h\equiv 0$ 且边权为 $1$，那么就是 $\text{BFS}$

---

$h(x)$ 需要满足的两个基本条件：

+ 可采纳性：$h(x)\leq h'(x)$，即从 $x$ 出发的后续预估代价不超过从 $x$ 出发的实际最优后续代价。
    + 证明：汇点的处理。
    + 其可以推导出 $\Rightarrow f(x)=g(x)+h(x)\leq ans$（并非等价条件）

+ 一致性：$h(x)\leq h(y)+d(x,y)$
    + 这使得 $f$ 是非降的。

**例题：[P1379 八数码难题](https://www.luogu.com.cn/problem/P1379)**

---

**迭代加深$(\text{IDS})$**

应用场景：$\text{DFS}$ 可能会陷入错解，而 $\text{BFS}$ 空间过大。

即答案深度未知，相对来说时间充足但内存有限的情况。

重复的都是浅层路径，因此实际复杂度与 $\text{BFS}$ 相差不会过大

在一些用搜索骗分的情况下，$\text{IDS}$ 往往能搜索到较深的层级（多一层），增大找到正解的概率。

而在 $\text{IDS}$ 能保证正确性的题目中，$\text{BFS}$ 一般也可以。

**[例题：P10494 [USACO02FEB] Power Hungry Cows](https://www.luogu.com.cn/problem/P10494)**

---

+ $\text{IDA*}=\text{IDS}+\text{A*}$

**[例题：P2324 [SCOI2005] 骑士精神](https://www.luogu.com.cn/problem/P2324)**

---

# 2. 字符串

+ $\text{Hash}$

+ $\text{KMP}$

+ $\text{Trie}$

---

# Hash / 哈希

**（基础知识）**

字符串中，我们可以让每一个字符串对应一个值，将所有串映射到一个较小的值域中，从而可以便捷地进行比较操作。

考虑一个多位数字的组成，有进制和位数两个关键元素。类似的，我们也可以设置能包含所有字符的进制，每位即是一个字符。

但这样的数字通常不小，我们可以再添加一个模数，将哈希值限制在一个可以接受的区间内。

---

比如说一个小写字母的字符串，我们可以将 $a$ 到 $z$ 分别对应到 $1$ 至 $26$，进制为 $114$，模数为 $514$：

abcd -> (1 * 114^3 + 2 * 114^2 + 3 * 114^1 + 4 * 114^0) % 514

+ 以类似数的形式设置哈希值，可以让我们 $O(1)$ 直接计算字符串的结合 / 分割。

**（哈希冲突）**

显然，由于模的存在，存在两个字符串的哈希值相等的情况难以避免，我们将其称为哈希冲突。

好的进制 & 模数可以降低哈希冲突出现的概率：

+ 一般选取质数，因为如果存在公因子，可能出现规律的哈希冲突。

+ 模数要适当的增大，从而增大值域。

---

**（多哈希）**

更进一步，我们也可以设置多个映射函数。不同的字符串，对于两种映射方式，冲突的概率会大大降低。

**（哈希表）**

对于某个哈希值可能出现的冲突，我们可以直接将所有哈希值等于此的原串以链表的形式存储下来（当然，原串数量需要可接受），单次查询的复杂度接近 $O(1)$。

+ $\text{STL}$ unordered_map 便是基于此实现的。

[P3370 【模板】字符串哈希](https://www.luogu.com.cn/problem/P3370)

[U461211 字符串 Hash（数据加强）](https://www.luogu.com.cn/problem/U461211)

---

## T1. [CF1200E Compress Words](https://www.luogu.com.cn/problem/CF1200E)

---

## T2. [P4824 [USACO15FEB] Censoring S](https://www.luogu.com.cn/problem/P4824)

相似题

---

## T3. [P3498 [POI 2010] KOR-Beads](https://www.luogu.com.cn/problem/P3498)

---

## T4. [P4503 [CTSC2014] 企鹅 QQ](https://www.luogu.com.cn/problem/P4503)

+ 可错配问题

---

本题为一次错配，只需要逐一枚举可能的错配点判断即可。

对于 $k$ 次错配的问题，可以先选取两个要比较的字符串，二分从开始能匹配的最长距离，再暴力走错配点，复杂度 $O(m+kn\log m)$，其中 $n$ 为字符串数量，$m$ 为所有字符串总长。

---

# KMP

$\text{KMP}$ 算法可以通过线性预处理，解决字符串匹配的问题。

+ $\text{border}$：一个子串即是前缀也是后缀。

如 abc*!@&%~abc
abc 就是原串的一个 border。

（如果你想在目标串上对模式串尝试匹配，可以在目标串前加一模式串，这样能匹配的位置就是一个 $\text{border}$。

+ $\text{next}$ 数组：对于当前选定字符串 $s$，最长的既是真前缀也是真后缀的子串长度，即小于 $|s|$ 的最长的 $\text{border}$ 长。

$\text{KMP}$ 的最直接目的是在线性的时间下处理出 $\text{next}$ 数组：

---

重要性质：下一个 $\text{next}$ 数组的值最多增加 1。

+ 反证法：若 $\text{next}[i+1]-\text{next}[i]=a-b>1$，则在位置 $i+1$ 基础上两个 $\text{border}$ 同时在末端除去一个元素，可得 $i$ 处的一个 $\text{border}$ 长度为 $a-1(>b)$。

---

// s : 从 0 到 n - 1
for(int i = 1, j = 0; i < n; ++ i ){
    while(j && s[i] != s[j]) j = next[j];
    //通过不断失配尝试匹配。理解 next 数组的作用。
    if(s[i] == s[j]) ++j;
    //性质：下一个 next 数组值最多增加 1。
    next[i] = j;
}

// s : 从 1 到 n
for(int i = 2, j = 0; i <= n; ++ i ){
    while(j && s[i] != s[j + 1]) j = next[j];
    if(s[i] == s[j + 1]) ++j;
    next[i] = j;
}

补充：$\text{next}$ 数组与树的联系。

**[P3375 【模板】KMP](https://www.luogu.com.cn/problem/P3375)**

---

## T1. **[P4391 [BalticOI 2009] Radio Transmission 无线传输](https://www.luogu.com.cn/problem/P4391)**

---

## T2. **[P3435 [POI 2006] OKR-Periods of Words](https://www.luogu.com.cn/problem/P3435)**

+ 弄清题意与 $\text{border}$ 的确切关系。

（注意：周期的定义以题干为准）

---

答案求的是：每个位置结束的子串，总长减去最小的 $\text{border}$ 长度，所有位置的总和。（如果没有 $\text{border}$ 则没有贡献）

---

## T3. **[P4824 [USACO15FEB] Censoring S](https://www.luogu.com.cn/problem/P4824)**

+ 对于一个无序或任意的问题，可以先定序

+ KMP 是一个在线算法。

---

## T4. **[P2375 [NOI2014] 动物园](https://www.luogu.com.cn/problem/P2375)**

---

题意转化：对每个位置结束的子串 $s[1,k]$，对所有长度小于 $\lfloor\frac{|s|}{2}\rfloor$ 的 $\text{border}$ 计数。

但是直接将 $1/2$ 的限制放到 KMP 过程中是不可行的，为什么？

……

所以需要二次计数。

---

## 选做：

**[P3426 [POI 2005] SZA-Template](https://www.luogu.com.cn/problem/P3426)**

+ 最好不要盲目抄代码，可以尝试了解多个题解的思路。

---

# Trie / 字典树

Trie 可以用于维护字符串，进行匹配操作等。

**[P8306 【模板】字典树](https://www.luogu.com.cn/problem/P8306)**

---

## T1. **[P4407 [JSOI2009] 电子字典](https://www.luogu.com.cn/problem/P4407)**

---

虽然字符串总长 $N\times L=2e5$，但要考虑到每层只有 26 个分支，因而实际遍历的数量级要低一些。这样就可以放心暴力了……

---

Trie 也可以用来维护 01 串（广义上也算是字符串，但这部分与数学关联更多）：

## T2. **[P4551 最长异或路径](https://www.luogu.com.cn/problem/P4551)**

---

用 $v_{x,y}$ 代表 $x$ 与 $y$ 之间简单路径的异或和，那么对于任意节点 $a,b,c$，可知有 $v_{a,b}=v_{a,c}\space \text{xor}\space v_{b,c}$。

那么不妨选中一个节点作为根，逐一查询最大异或和后插入 Trie 树中（在线）。

---

## T3. **[CF1416C XOR Inverse](https://www.luogu.com.cn/problem/CF1416C)**

---

每一位的计算都是独立的。

一个数从高到低插入，对于某一个分岔点来说，每个数异或 $x$ 的可能影响是交换两个 Trie 树的子节点。如果 $x$ 的当前位选择了 $1$，那么本层所有节点都要转换，所有要按层整体计算答案。
https://newamnesia.github.io/2026/02/15/20260213search&string/
发布于

2026-02-15
更新于

2026-02-22
许可协议

#oi
20260213search&string

发布于

更新于

许可协议

评论

链接

分类

最新文章

归档

标签