Trie树数据结构的实现原理和题目实践-电子发烧友网

作者：labuladong

公众号：labuladong

读完本文，可以去力扣解决如下题目：

208. 实现 Trie (前缀树)（Medium）

1804. 实现 Trie （前缀树） II（Medium）

648. 单词替换（Medium）

211. 添加与搜索单词（Medium）

677. 键值映射（Medium）

Trie 树又叫字典树、前缀树、单词查找树，是一种二叉树衍生出来的高级数据结构，主要应用场景是处理字符串前缀相关的操作。

后台有挺多读者说今年的面试笔试题涉及到这种数据结构了，所以请我讲一讲。

几年前我在《算法 4》第一次学到这种数据结构，不过个人认为讲解不是特别通俗易懂，所以本文按照我的逻辑帮大家重新梳理一遍 Trie 树的原理，并基于《算法 4》的代码实现一套更通用易懂的代码模板，用于处理力扣上一系列字符串前缀问题。

阅读本文之前希望你读过我旧文讲过的回溯算法代码模板和手把手刷二叉树（总结篇）。

本文主要分三部分：

1、讲解 Trie 树的工作原理。

2、给出一套TrieMap和TrieSet的代码模板，实现几个常用 API。

3、实践环节，直接套代码模板秒杀 5 道算法题。本来可以秒杀七八道题，篇幅考虑，剩下的我集成到刷题插件中。

关于Map和Set，是两个抽象数据结构（接口），Map存储一个键值对集合，其中键不重复，Set存储一个不重复的元素集合。

常见的Map和Set的底层实现原理有哈希表和二叉搜索树两种，比如 Java 的 HashMap/HashSet 和 C++ 的 unorderd_map/unordered_set 底层就是用哈希表实现，而 Java 的 TreeMap/TreeSet 和 C++ 的 map/set 底层使用红黑树这种自平衡 BST 实现的。

而本文实现的 TrieSet/TrieMap 底层则用 Trie 树这种结构来实现。

了解数据结构的读者应该知道，本质上Set可以视为一种特殊的Map，Set其实就是Map中的键。

所以本文先实现TrieMap，然后在TrieMap的基础上封装出TrieSet。

PS：为了模板通用性的考虑，后文会用到 Java 的泛型，也就是用尖括号<>指定的类型变量。这些类型变量的作用是指定我们实现的容器中存储的数据类型，类比 Java 标准库的那些容器的用法应该不难理解。

前文学习数据结构的框架思维说过，各种乱七八糟的结构都是为了在「特定场景」下尽可能高效地进行增删查改。

你比如HashMap的优势是能够在 O(1) 时间通过键查找对应的值，但要求键的类型K必须是「可哈希」的；而TreeMap的特点是方便根据键的大小进行操作，但要求键的类型K必须是「可比较」的。

本文要实现的TrieMap也是类似的，由于 Trie 树原理，我们要求TrieMap的键必须是字符串类型，值的类型V可以随意。

接下来我们了解一下 Trie 树的原理，看看为什么这种数据结构能够高效操作字符串。

Trie 树原理

Trie 树本质上就是一棵从二叉树衍生出来的多叉树。

二叉树节点的代码实现是这样：

/*基本的二叉树节点*/
classTreeNode{
intval;
TreeNodeleft,right;
}

其中left, right存储左右子节点的指针，所以二叉树的结构是这样：

多叉树节点的代码实现是这样：

/*基本的多叉树节点*/
classTreeNode{
intval;
TreeNode[]children;
}

其中children数组中存储指向孩子节点的指针，所以多叉树的结构是这样：

而TrieMap中的树节点TrieNode的代码实现是这样：

/*Trie树节点实现*/
classTrieNode<V>{
Vval=null;
TrieNode[]children=newTrieNode[256];
}

这个val字段存储键对应的值，children数组存储指向子节点的指针。

但是和之前的普通多叉树节点不同，TrieNode中children数组的索引是有意义的，代表键中的一个字符。

比如说children[97]如果非空，说明这里存储了一个字符'a'，因为'a'的 ASCII 码为 97。

我们的模板只考虑处理 ASCII 字符，所以children数组的大小设置为 256。不过这个可以根据具体问题修改，比如改成更小的数组或者HashMap都是一样的效果。

有了以上铺垫，Trie 树的结构是这样的：

一个节点有 256 个子节点指针，但大多数时候都是空的，可以省略掉不画，所以一般你看到的 Trie 树长这样：

这是在TrieMap中插入一些键值对后的样子，白色节点代表val字段为空，橙色节点代表val字段非空。

这里要特别注意，TrieNode节点本身只存储val字段，并没有一个字段来存储字符，字符是通过子节点在父节点的children数组中的索引确定的。

形象理解就是，Trie 树用「树枝」存储字符串（键），用「节点」存储字符串（键）对应的数据（值）。所以我在图中把字符标在树枝，键对应的值val标在节点上：

明白这一点很重要，有助于之后你理解代码实现。

PS：《算法 4》以及网上讲 Trie 树的很多文章中都是把字符标在节点上，我认为这样很容易让初学者产生误解，所以建议大家按照我的这种理解来记忆 Trie 树结构。

现在你应该知道为啥 Trie 树也叫前缀树了，因为其中的字符串共享前缀，相同前缀的字符串集中在 Trie 树中的一个子树上，给字符串的处理带来很大的便利。

TrieMap/TrieSet API 及实现

首先我们看一下本文实现的TrieMap的 API，为了举例 API 的功能，假设 TrieMap 中已经存储了如下键值对：

//底层用Trie树实现的键值映射
//键为String类型，值为类型VclassTrieMap<V>{

/*****增/改*****/

//在Map中添加key
publicvoidput(Stringkey,Vval);

/*****删*****/

//删除键key以及对应的值
publicvoidremove(Stringkey);

/*****查*****/

//搜索key对应的值，不存在则返回null
//get("the")->4
//get("tha")->null
publicVget(Stringkey);

//判断key是否存在在Map中
//containsKey("tea")->false
//containsKey("team")->true
publicbooleancontainsKey(Stringkey);

//在Map的所有键中搜索query的最短前缀
//shortestPrefixOf("themxyz")->"the"
publicStringshortestPrefixOf(Stringquery);

//在Map的所有键中搜索query的最长前缀
//longestPrefixOf("themxyz")->"them"
publicStringlongestPrefixOf(Stringquery);

//搜索所有前缀为prefix的键
//keysWithPrefix("th")->["that","the","them"]
publicListkeysWithPrefix(Stringprefix);

//判断是和否存在前缀为prefix的键
//hasKeyWithPrefix("tha")->true
//hasKeyWithPrefix("apple")->false
publicbooleanhasKeyWithPrefix(Stringprefix);

//通配符.匹配任意字符，搜索所有匹配的键
//keysWithPattern("t.a.")->["team","that"]
publicListkeysWithPattern(Stringpattern);

//通配符.匹配任意字符，判断是否存在匹配的键
//hasKeyWithPattern(".ip")->true
//hasKeyWithPattern(".i")->false
publicbooleanhasKeyWithPattern(Stringpattern);

//返回Map中键值对的数量
publicintsize();
}

至于TrieSet的 API 大同小异，所以这里不重复列举，后文直接给出实现。

接下来是重头戏，我们一个一个实现TrieMap的上述 API 函数。

首先，TrieMap类中一定需要记录 Trie 的根节点root，以及 Trie 树中的所有节点数量用于实现size()方法：

classTrieMap<V>{
//ASCII码个数
privatestaticfinalintR=256;
//当前存在Map中的键值对个数
privateintsize=0;

privatestaticclassTrieNode<V>{
Vval=null;
TrieNode[]children=newTrieNode[R];
}

//Trie树的根节点
privateTrieNoderoot=null;

/*其他API的实现...*/

publicintsize(){
returnsize;
}
}

另外，我们再实现一个工具函数getNode：

//从节点node开始搜索key，如果存在返回对应节点，否则返回null
privateTrieNodegetNode(TrieNodenode,Stringkey){
TrieNodep=node;
//从节点node开始搜索key
for(inti=0;i< key.length(); i++) {
        if(p==null){
//无法向下搜索
returnnull;
}
//向下搜索
charc=key.charAt(i);
p=p.children[c];
}
returnp;
}

有了这个getNode函数，就能实现containsKey方法和get方法了：

//搜索key对应的值，不存在则返回null
publicVget(Stringkey){
//从root开始搜索key
TrieNodex=getNode(root,key);
if(x==null||x.val==null){
//x为空或x的val字段为空都说明key没有对应的值
returnnull;
}
returnx.val;
}

//判断key是否存在在Map中
publicbooleancontainsKey(Stringkey){
returnget(key)!=null;
}

这里需要注意，就算getNode(key)的返回值x非空，也只能说字符串key是一个「前缀」；除非x.val同时非空，才能判断键key存在。

不过，这个特性恰好能够帮我们实现hasKeyWithPrefix方法：

//判断是和否存在前缀为prefix的键
publicbooleanhasKeyWithPrefix(Stringprefix){
//只要能找到 prefix 对应的节点，就是存在前缀
returngetNode(root,prefix)!=null;
}

类似getNode方法的逻辑，我们可以实现shortestPrefixOf方法，只要在第一次遇到存有val的节点的时候返回就行了：

//在所有键中寻找query的最短前缀
publicStringshortestPrefixOf(Stringquery){
TrieNodep=root;
//从节点node开始搜索key
for(inti=0;i< query.length(); i++) {
        if(p==null){
//无法向下搜索
return"";
}
if(p.val!=null){
//找到一个键是query的前缀
returnquery.substring(0,i);
}
//向下搜索
charc=query.charAt(i);
p=p.children[c];
}

if(p!=null&&p.val!=null){
//如果query本身就是一个键
returnquery;
}
return"";
}

这里需要注意的是 for 循环结束之后我们还需要额外检查一下。

因为之前说了 Trie 树中「树枝」存储字符串，「节点」存储字符串对应的值，for 循环相当于只遍历了「树枝」，但漏掉了最后一个「节点」，即query本身就是TrieMap中的一个键的情况。

如果你理解了shortestPrefixOf的实现，那么longestPrefixOf也是非常类似的：

//在所有键中寻找query的最长前缀
publicStringlongestPrefixOf(Stringquery){
TrieNodep=root;
//记录前缀的最大长度
intmax_len=0;

//从节点node开始搜索key
for(inti=0;i< query.length(); i++) {
        if(p==null){
//无法向下搜索
break;
}
if(p.val!=null){
//找到一个键是query的前缀，更新前缀的最大长度
max_len=i;
}
//向下搜索
charc=query.charAt(i);
p=p.children[c];
}

if(p!=null&&p.val!=null){
//如果query本身就是一个键
returnquery;
}
returnquery.substring(0,max_len);
}

每次遇到p.val非空的时候说明找到一个键，但是我们不急着返回，而是更新max_len变量，记录最长前缀的长度。

同样的，在 for 循环结束时还是要特殊判断一下，处理query本身就是键的情况。

接下来，我们来实现keysWithPrefix方法，得到所有前缀为prefix的键。

看过前文手把手刷二叉树（总结篇）的读者应该可以想到，先利用getNode函数在 Trie 树中找到prefix对应的节点x，然施展多叉树的遍历算法，遍历以x为根的这棵 Trie 树，找到所有键值对：

代码实现如下：

//搜索前缀为prefix的所有键
publicListkeysWithPrefix(Stringprefix){
Listres=newLinkedList<>();
//找到匹配prefix在Trie树中的那个节点
TrieNodex=getNode(root,prefix);
if(x==null){
returnres;
}
//DFS遍历以x为根的这棵Trie树
traverse(x,newStringBuilder(prefix),res);
returnres;
}

//遍历以node节点为根的Trie树，找到所有键
privatevoidtraverse(TrieNodenode,StringBuilderpath,Listres){
if(node==null){
//到达Trie树底部叶子结点
return;
}

if(node.val!=null){
//找到一个key，添加到结果列表中
res.add(path.toString());
}

//回溯算法遍历框架
for(charc=0;c< R; c++) {
        //做选择
path.append(c);
traverse(node.children[c],path,res);
//撤销选择
path.deleteCharAt(path.length()-1);
}
}

这段代码中traverse函数你可能看起来特别熟悉，就是回溯算法核心套路中讲的回溯算法代码框架。

关于回溯算法框架和标准多叉树框架的区别我在图论算法基础中探讨过，关键在于遍历「节点」和遍历「树枝」的区别。由于 Trie 树将字符存储在「树枝」上，traverse函数是在遍历树枝上的字符，所以采用的是回溯算法框架。

另外，再注意一下这段逻辑：

//回溯算法遍历框架
for(charc=0;c< R; c++) {
    //做选择
path.append(c);
traverse(node.children[c],path,res);
//撤销选择
path.deleteCharAt(path.length()-1);
}

回顾一下我们 Trie 树的图：

你是否会有疑问：代码中 for 循环会执行 256 次，但是图中的一个节点只有几个子节点，也就是说每个节点的children数组中大部分都是空指针，这不会有问题吗？

是不是应该把代码改成这样：

//回溯算法遍历框架
for(charc=0;c< R; c++) {
    //做选择
path.append(c);
if(node.children[c]!=null){
traverse(node.children[c],path,res);
}
//撤销选择
path.deleteCharAt(path.length()-1);
}

答案是，改不改都行，这两种写法从逻辑上讲完全相同，因为traverse函数开始的时候如果发现node == null也会直接返回。

我为了保持框架的一致性，就没有在 for 循环中判断子节点是否为空，而是依赖递归函数的 base case。当然你完全可以按照自己的喜好来实现。

下面来实现keysWithPattern方法，使用通配符来匹配多个键，其关键就在于通配符.可以匹配所有字符。

在代码实现上，用path变量记录匹配键的路径，遇到通配符时使用类似回溯算法的框架就行了：

//通配符.匹配任意字符
publicListkeysWithPattern(Stringpattern){
Listres=newLinkedList<>();
traverse(root,newStringBuilder(),pattern,0,res);
returnres;
}

//遍历函数，尝试在「以node为根的Trie树中」匹配pattern[i..]
privatevoidtraverse(TrieNodenode,StringBuilderpath,Stringpattern,inti,Listres){
if(node==null){
//树枝不存在，即匹配失败
return;
}
if(i==pattern.length()){
//pattern匹配完成
if(node.val!=null){
//如果这个节点存储着val，则找到一个匹配的键
res.add(path.toString());
}
return;
}
charc=pattern.charAt(i);
if(c=='.'){
//pattern[i]是通配符，可以变化成任意字符
//多叉树（回溯算法）遍历框架
for(charj=0;j< R; j++) {
            path.append(j);
            traverse(node.children[j], path, pattern, i + 1,res);
path.deleteCharAt(path.length()-1);
}
}else{
//pattern[i]是普通字符c
path.append(c);
traverse(node.children[c],path,pattern,i+1,res);
path.deleteCharAt(path.length()-1);
}
}

下面这个 GIF 画了匹配"t.a."的过程，应该就容易理解上述代码的逻辑了：

可以看到，keysWithPattern和keysWithPrefix的实现是有些类似的，而且这两个函数还有一个潜在的特性：它们返回的结果列表一定是符合「字典序」的。

原因应该不难理解，每一个节点的children数组都是从左到右进行遍历，即按照 ASCII 码从小到大的顺序递归遍历，得到的结果自然是符合字典序的。

好，现在我们实现了keysWithPattern方法得到模式串匹配的所有键，那你是否可以实现hasKeyWithPattern方法，仅仅判断是否存在键匹配模式串？

//一个偷懒的实现
publicbooleanhasKeyWithPattern(Stringpattern){
return!keysWithPattern(pattern).isEmpty();
}

这是一个偷懒的实现，因为它的复杂度比较高。我们的目的仅仅是判断是否存在匹配模式串的键，你却把所有匹配的键都算出来了，这显然是没有必要的。

我们只需稍微改写一下keysWithPattern方法就可以高效实现hasKeyWithPattern方法：

//判断是和否存在前缀为prefix的键
publicbooleanhasKeyWithPattern(Stringpattern){
//从root节点开始匹配pattern[0..]
returnhasKeyWithPattern(root,pattern,0);
}

//函数定义：从 node 节点开始匹配 pattern[i..]，返回是否成功匹配
privatebooleanhasKeyWithPattern(TrieNodenode,Stringpattern,inti){
if(node==null){
//树枝不存在，即匹配失败
returnfalse;
}
if(i==pattern.length()){
//模式串走到头了，看看匹配到的是否是一个键
returnnode.val!=null;
}
charc=pattern.charAt(i);
//没有遇到通配符
if(c!='.'){
//从node.children[c]节点开始匹配pattern[i+1..]
returnhasKeyWithPattern(node.children[c],pattern,i+1);
}
//遇到通配符
for(intj=0;j< R; j++) {
        //pattern[i]可以变化成任意字符，尝试所有可能，只要遇到一个匹配成功就返回
if(hasKeyWithPattern(node.children[j],pattern,i+1)){
returntrue;
}
}
//都没有匹配
returnfalse;
}

有之前的铺垫，这个实现应该是不难理解的，类似于回溯算法解数独游戏中找到一个可行解就提前结束递归的做法。

到这里，TrieMap的所有和前缀相关的方法都实现完了，还剩下put和remove这两个基本方法了，其实它们的难度不大，就是递归修改数据结构的那一套，如果不熟悉的话可以参见二叉搜索树基本操作。

先说put方法的实现吧，直接看代码：

//在map中添加或修改键值对
publicvoidput(Stringkey,Vval){
if(!containsKey(key)){
//新增键值对
size++;
}
//需要一个额外的辅助函数，并接收其返回值
root=put(root,key,val,0);
}

//定义：向以 node 为根的 Trie 树中插入 key[i..]，返回插入完成后的根节点
privateTrieNodeput(TrieNodenode,Stringkey,Vval,inti){
if(node==null){
//如果树枝不存在，新建
node=newTrieNode<>();
}
if(i==key.length()){
//key的路径已插入完成，将值val存入节点
node.val=val;
returnnode;
}
charc=key.charAt(i);
//递归插入子节点，并接收返回值
node.children[c]=put(node.children[c],key,val,i+1);
returnnode;
}

因为是递归修改数据结构，所以我们必须额外创建一个返回类型为TrieNode的辅助函数，并且在递归调用的时候接收其返回值，拼接到父节点上。

前文说了，Trie 树中的键就是「树枝」，值就是「节点」，所以插入的逻辑就是沿路新建「树枝」，把key的整条「树枝」构建出来之后，在树枝末端的「节点」中存储val：

最后，我们说一下remove函数，似乎所有数据结构的删除操作相对其他操作都会更复杂一些。

比如说下图这个场景，如果你想删除键"team"，那么需要删掉"eam"这条树枝才是符合逻辑的：

删多了肯定不行，但删少了也不行，否则前文实现的hasKeyWithPrefix就会出错。

那么如何控制算法来正确地进行删除呢？

首先，递归修改数据结构的时候，如果一个节点想删掉自己，直接返回空指针就行了。

其次，一个节点如何知道自己是否需要被删除呢？主要看自己的val字段是否为空以及自己的children数组是否全都是空指针。

这里就要利用前文手把手刷二叉树（总结篇）中说到的后序位置的特点了：

一个节点要先递归处理子树，然后在后序位置检查自己的val字段和children列表，判断自己是否需要被删除。

如果自己的val字段为空，说明自己没有存储值，如果同时自己的children数组全是空指针，说明自己下面也没有接树枝，即不是任何一个键的前缀。这种情况下这个节点就没有存在的意义了，应该删掉自己。

直接看代码：

//在Map中删除key
publicvoidremove(Stringkey){
if(!containsKey(key)){
return;
}
//递归修改数据结构要接收函数的返回值
root=remove(root,key,0);
size--;
}

//定义：在以 node 为根的 Trie 树中删除 key[i..]，返回删除后的根节点
privateTrieNoderemove(TrieNodenode,Stringkey,inti){
if(node==null){
returnnull;
}
if(i==key.length()){
//找到了key对应的TrieNode，删除val
node.val=null;
}else{
charc=key.charAt(i);
//递归去子树进行删除
node.children[c]=remove(node.children[c],key,i+1);
}
//后序位置，递归路径上的节点可能需要被清理
if(node.val!=null){
//如果该TireNode存储着val，不需要被清理
returnnode;
}
//检查该TrieNode是否还有后缀
for(intc=0;c< R; c++) {
        if(node.children[c]!=null){
//只要存在一个子节点（后缀树枝），就不需要被清理
returnnode;
}
}
//既没有存储val，也没有后缀树枝，则该节点需要被清理
returnnull;
}

到这里，TrieMap的所有 API 就实现完了，完整代码如下：

classTrieMap<V>{
//ASCII码个数
privatestaticfinalintR=256;
//当前存在Map中的键值对个数
privateintsize=0;
//Trie树的根节点
privateTrieNoderoot=null;

privatestaticclassTrieNode<V>{
Vval=null;
TrieNode[]children=newTrieNode[R];
}

/*****增/改*****/

//在map中添加或修改键值对
publicvoidput(Stringkey,Vval){
if(!containsKey(key)){
//新增键值对
size++;
}
//需要一个额外的辅助函数，并接收其返回值
root=put(root,key,val,0);
}

//定义：向以 node 为根的 Trie 树中插入 key[i..]，返回插入完成后的根节点
privateTrieNodeput(TrieNodenode,Stringkey,Vval,inti){
if(node==null){
//如果树枝不存在，新建
node=newTrieNode<>();
}
if(i==key.length()){
//key的路径已插入完成，将值val存入节点
node.val=val;
returnnode;
}
charc=key.charAt(i);
//递归插入子节点，并接收返回值
node.children[c]=put(node.children[c],key,val,i+1);
returnnode;
}

/*****删*****/

//在Map中删除key
publicvoidremove(Stringkey){
if(!containsKey(key)){
return;
}
//递归修改数据结构要接收函数的返回值
root=remove(root,key,0);
size--;
}

//定义：在以 node 为根的 Trie 树中删除 key[i..]，返回删除后的根节点
privateTrieNoderemove(TrieNodenode,Stringkey,inti){
if(node==null){
returnnull;
}
if(i==key.length()){
//找到了key对应的TrieNode，删除val
node.val=null;
}else{
charc=key.charAt(i);
//递归去子树进行删除
node.children[c]=remove(node.children[c],key,i+1);
}
//后序位置，递归路径上的节点可能需要被清理
if(node.val!=null){
//如果该TireNode存储着val，不需要被清理
returnnode;
}
//检查该TrieNode是否还有后缀
for(intc=0;c< R; c++) {
            if(node.children[c]!=null){
//只要存在一个子节点（后缀树枝），就不需要被清理
returnnode;
}
}
//既没有存储val，也没有后缀树枝，则该节点需要被清理
returnnull;
}

/*****查*****/

//搜索key对应的值，不存在则返回null
publicVget(Stringkey){
//从root开始搜索key
TrieNodex=getNode(root,key);
if(x==null||x.val==null){
//x为空或x的val字段为空都说明key没有对应的值
returnnull;
}
returnx.val;
}

//判断key是否存在在Map中
publicbooleancontainsKey(Stringkey){
returnget(key)!=null;
}

//判断是和否存在前缀为prefix的键
publicbooleanhasKeyWithPrefix(Stringprefix){
//只要能找到一个节点，就是存在前缀
returngetNode(root,prefix)!=null;
}

//在所有键中寻找query的最短前缀
publicStringshortestPrefixOf(Stringquery){
TrieNodep=root;
//从节点node开始搜索key
for(inti=0;i< query.length(); i++) {
            if(p==null){
//无法向下搜索
return"";
}
if(p.val!=null){
//找到一个键是query的前缀
returnquery.substring(0,i);
}
//向下搜索
charc=query.charAt(i);
p=p.children[c];
}

if(p!=null&&p.val!=null){
//如果query本身就是一个键
returnquery;
}
return"";
}

//在所有键中寻找query的最长前缀
publicStringlongestPrefixOf(Stringquery){
TrieNodep=root;
//记录前缀的最大长度
intmax_len=0;

//从节点node开始搜索key
for(inti=0;i< query.length(); i++) {
            if(p==null){
//无法向下搜索
break;
}
if(p.val!=null){
//找到一个键是query的前缀，更新前缀的最大长度
max_len=i;
}
//向下搜索
charc=query.charAt(i);
p=p.children[c];
}

if(p!=null&&p.val!=null){
//如果query本身就是一个键
returnquery;
}
returnquery.substring(0,max_len);
}

//搜索前缀为prefix的所有键
publicListkeysWithPrefix(Stringprefix){
Listres=newLinkedList<>();
//找到匹配prefix在Trie树中的那个节点
TrieNodex=getNode(root,prefix);
if(x==null){
returnres;
}
//DFS遍历以x为根的这棵Trie树
traverse(x,newStringBuilder(prefix),res);
returnres;
}

//遍历以node节点为根的Trie树，找到所有键
privatevoidtraverse(TrieNodenode,StringBuilderpath,Listres){
if(node==null){
//到达Trie树底部叶子结点
return;
}

if(node.val!=null){
//找到一个key，添加到结果列表中
res.add(path.toString());
}

//回溯算法遍历框架
for(charc=0;c< R; c++) {
            //做选择
path.append(c);
traverse(node.children[c],path,res);
//撤销选择
path.deleteCharAt(path.length()-1);
}
}

//通配符.匹配任意字符
publicListkeysWithPattern(Stringpattern){
Listres=newLinkedList<>();
traverse(root,newStringBuilder(),pattern,0,res);
returnres;
}

//遍历函数，尝试在「以node为根的Trie树中」匹配pattern[i..]
privatevoidtraverse(TrieNodenode,StringBuilderpath,Stringpattern,inti,Listres){
if(node==null){
//树枝不存在，即匹配失败
return;
}
if(i==pattern.length()){
//pattern匹配完成
if(node.val!=null){
//如果这个节点存储着val，则找到一个匹配的键
res.add(path.toString());
}
return;
}
charc=pattern.charAt(i);
if(c=='.'){
//pattern[i]是通配符，可以变化成任意字符
//多叉树（回溯算法）遍历框架
for(charj=0;j< R; j++) {
                path.append(j);
                traverse(node.children[j], path, pattern, i + 1,res);
path.deleteCharAt(path.length()-1);
}
}else{
//pattern[i]是普通字符c
path.append(c);
traverse(node.children[c],path,pattern,i+1,res);
path.deleteCharAt(path.length()-1);
}
}

//判断是和否存在前缀为prefix的键
publicbooleanhasKeyWithPattern(Stringpattern){
//从root节点开始匹配pattern[0..]
returnhasKeyWithPattern(root,pattern,0);
}

//函数定义：从 node 节点开始匹配 pattern[i..]，返回是否成功匹配
privatebooleanhasKeyWithPattern(TrieNodenode,Stringpattern,inti){
if(node==null){
//树枝不存在，即匹配失败
returnfalse;
}
if(i==pattern.length()){
//模式串走到头了，看看匹配到的是否是一个键
returnnode.val!=null;
}
charc=pattern.charAt(i);
//没有遇到通配符
if(c!='.'){
//从node.children[c]节点开始匹配pattern[i+1..]
returnhasKeyWithPattern(node.children[c],pattern,i+1);
}
//遇到通配符
for(intj=0;j< R; j++) {
            //pattern[i]可以变化成任意字符，尝试所有可能，只要遇到一个匹配成功就返回
if(hasKeyWithPattern(node.children[j],pattern,i+1)){
returntrue;
}
}
//都没有匹配
returnfalse;
}

//从节点node开始搜索key，如果存在返回对应节点，否则返回null
privateTrieNodegetNode(TrieNodenode,Stringkey){
TrieNodep=node;
//从节点node开始搜索key
for(inti=0;i< key.length(); i++) {
            if(p==null){
//无法向下搜索
returnnull;
}
//向下搜索
charc=key.charAt(i);
p=p.children[c];
}
returnp;
}

publicintsize(){
returnsize;
}
}

接下来我们只要对TrieMap做简单的封装，即可实现TrieSet：

classTrieSet{
//底层用一个TrieMap，键就是TrieSet，值仅仅起到占位的作用
//值的类型可以随便设置，我参考Java标准库设置成Object
privatefinalTrieMap

搜索历史

Trie树数据结构的实现原理和题目实践

Trie 树原理

TrieMap/TrieSet API 及实现

秒杀题目

评论

GPIB命令的数据结构

收藏 | 程序员面试，你必须知道的8大数据结构

常见的数据结构

GPIB命令的数据结构

GPIB命令的数据结构

java数据结构学习

关于二叉树一些数据结构和算法相关的题目

什么是数据结构?为什么要学习数据结构？数据结构的应用实例分析

Linux 内核里的数据结构关键：基数树

Linux内核数据结构：Radix 树

新数据结构“树”的详细介绍

数据结构字典树的实现

数据结构与算法分析中的二叉树与堆有关知识汇总

C语言数据结构：什么是二叉树？

redis数据结构的底层实现