字典树 今天药忘吃喽~ 2022-06-16 08:21 212阅读 0赞 **一、引入** **[点击打开链接][Link 1]** 字典是干啥的?查找字的。 字典树自然也是起查找作用的。查找的是啥?单词。 看以下几个题: 1、给出n个单词和m个询问,每次询问一个单词,回答这个单词是否在单词表中出现过。 答:简单!map,短小精悍。 好。下一个 2、给出n个单词和m个询问,每次询问一个前缀,回答询问是多少个单词的前缀。 答:map,把每个单词拆开。 judge:n<=200000,TLE! 这就需要一种高级数据结构——Trie树(字典树) **二、原理** 在本篇文章中,假设**所有单词都只由小写字母**构成 对cat,cash,app,apple,aply,ok 建一颗字典树,建成之后如下图所示 ![1056834-20170116165146942-530965331.jpg][] 由此可以看出: 1、字典树用边表示字母 2、有相同前缀的单词公用前缀节点,那我们可以的得出每个节点最多有26个子节点(在单词只包含小写字母的情况下) 3、整棵树的根节点是空的。为什么呢?便于插入和查找,这将会在后面解释。 4、每个单词结束的时候用一个特殊字符表示,图中用的‘ ′ ,那么从根节点到任意一个‘ ′,那么从根节点到任意一个‘’所经过的边的所有字母表示一个单词。 **三、基本操作** **A、insert,插入一个单词** 1.思路 从图中可以直观看出,从左到右扫这个单词,如果字母在相应根节点下没有出现过,就插入这个字母;否则沿着字典树往下走,看单词的下一个字母。 这就产生一个问题:往哪儿插?计算机不会自己选择位置插,我们需要给它指定一个位置,那就需要给每个字母编号。 我们设数组trie\[i\]\[j\]=k,表示**编号为i**的节点的**第j个**孩子是**编号为k**的节点。 什么意思呢? 这里有2种编号,一种是i,k表示节点的位置编号,这是相对整棵树而言的;另一种是j,表示节点i的第j的孩子,这是相对节点i而言的。 不理解?看图 还是单词cat,cash,app,apple,aply,ok 我们就按输入顺序对其编第一种号,**红色**表示编号结果。因为先输入的cat,所以c,a,t分别是1,2,3,然后输入的是cash,因为c,a是公共前缀,所以从s开始编,s是4,以此类推。 注意这里**相同字母的编号可能不同** ![1056834-20170116171556739-1211786828.jpg][] 第二种编号,相对节点的编号,**紫色**表示编号结果。 因为每个节点最多有26个子节点,我们可以按他们的字典序从0——25编号,也就是他们的ASCLL码-a的ASCLL码。 注意这里**相同字母的编号相同** ![1056834-20170116172136067-1561845947.jpg][] 实际上每个节点的子节点都应该从0编到——25,但这样会发现许多事根本用不到的。比如上图的根节点应该分出26个叉。节约空间,用到哪个分哪个。 这样编号有什么用呢? 回到数组trie\[i\]\[j\]=k。 数组trie\[i\]\[j\]=k,表示编号为i的节点的第j个孩子是编号为k的节点。 那么第二种编号即为j,第一种编号即为i,k 2、代码 ![复制代码][copycode.gif] void insert()//插入单词s { len=strlen(s);//单词s的长度 root=0;//根节点编号为0 for(int i=0;i<len;i++) { int id=s[i]-'a';//第二种编号 if(!trie[root][id])//如果之前没有从root到id的前缀 trie[root][id]=++tot;//插入,tot即为第一种编号 root=trie[root][id];//顺着字典树往下走 } } ![复制代码][copycode.gif] **B、search,查找** 查找有很多种,可以查找某一个前缀,也可以查找整个单词。 再次我们以查找一个**前缀是否出现过**为例讲解 1、思路 从左往右以此扫描每个字母,顺着字典树往下找,能找到这个字母,往下走,否则结束查找,即没有这个前缀;前缀扫完了,表示有这个前缀。 2、代码 bool find() { len=strlen(s); root=0;//从根结点开始找 for(int i=0;s[i];i++) { int x=s[i]-'a';// if(trie[root][x]==0) return false;//以root为头结点的x字母不存在,返回0 root=trie[root][x];//为查询下个字母做准备,往下走 } return true;//找到了 } 3、如果是**查询某个单词**的话,我们用bool变量 v\[i\]表示节点i是否是单词结束的标志。 那么最后return的是v\[root\],所以在插入操作中插入完每个单词是,要对单词最后一个字母的v\[i\]置为true,其他的都是false 4、如果是查询**前缀出现的次**数的话,那就在开一个sum\[\],表示位置i被访问过的次数, 那么最后return的是sum\[root\],插入操作中每访问一个节点,都要让他的sum++ 这里前缀的次数是标记在前缀的最后一个字母所在位置的后一个位置上。 比如:前缀abc出现的次数标记在c所在位置的后一个位置上, ![1056834-20170116180035427-2064043799.jpg][] **四、完整代码** 1、查询是否出现(数组模拟) /\* trie tree的储存方式:将字母储存在边上,边的节点连接与它相连的字母 trie\[rt\]\[x\]=tot:rt是上个节点编号,x是字母,tot是下个节点编号 \*/ \#include<cstdio> \#include<iostream> \#include<algorithm> \#include<cstring> \#define maxn 2000010 using namespace std; int tot=1,n; int trie\[maxn\]\[26\]; //bool isw\[maxn\];查询整个单词用 void insert(char \*s,int rt) \{ for(int i=0;s\[i\];i++) \{ int x=s\[i\]-'a'; if(trie\[rt\]\[x\]==0)//现在插入的字母在之前同一节点处未出现过 \{ trie\[rt\]\[x\]=++tot;//字母插入一个新的位置,否则不做处理 \} rt=trie\[rt\]\[x\];//为下个字母的插入做准备 \} /\*isw\[rt\]=true;标志该单词末位字母的尾结点,在查询整个单词时用到\*/ \} bool find(char \*s,int rt) \{ for(int i=0;s\[i\];i++) \{ int x=s\[i\]-'a'; if(trie\[rt\]\[x\]==0)return false;//以rt为头结点的x字母不存在,返回0 rt=trie\[rt\]\[x\];//为查询下个字母做准备 \} return true; //查询整个单词时,应该return isw\[rt\] \} char s\[22\]; int main() \{ tot=0; int rt=1; scanf("%d",&n); for(int i=1;i<=n;i++) \{ cin>>s; insert(s,rt); \} scanf("%d",&n); for(int i=1;i<=n;i++) \{ cin>>s; if(find(s,rt))printf("YES\\n"); else printf("NO\\n"); \} return 0; \} 2、查询前缀出现次数(数组模拟) \#include<iostream> \#include<cstring> \#include<cstdio> \#include<algorithm> using namespace std; int trie\[400001\]\[26\],len,root,tot,sum\[400001\]; bool p; int n,m; char s\[11\]; void insert() \{ len=strlen(s); root=0; for(int i=0;i<len;i++) \{ int id=s\[i\]-'a'; if(!trie\[root\]\[id\]) trie\[root\]\[id\]=++tot; sum\[trie\[root\]\[id\]\]++;//前缀后移一个位置保存 root=trie\[root\]\[id\]; \} \} int search() \{ root=0; len=strlen(s); for(int i=0;i<len;i++) \{ int id=s\[i\]-'a'; if(!trie\[root\]\[id\]) return 0; root=trie\[root\]\[id\]; \}//root经过此循环后变成前缀最后一个字母所在位置的后一个位置 return sum\[root\];//因为前缀后移了一个保存,所以此时的sum\[root\]就是要求的前缀出现的次数 \} int main() \{ scanf("%d",&n); for(int i=1;i<=n;i++) \{ cin>>s; insert(); \} scanf("%d",&m); for(int i=1;i<=m;i++) \{ cin>s; printf("%d\\n",search()); \} \} [Link 1]: http://www.cnblogs.com/TheRoadToTheGold/p/6290732.html [1056834-20170116165146942-530965331.jpg]: /images/20220616/4a6a4f89c7f14182a5ad724b09eeb0c5.png [1056834-20170116171556739-1211786828.jpg]: /images/20220616/daef79b81871431aa167e6ce9d857469.png [1056834-20170116172136067-1561845947.jpg]: /images/20220616/9cdec6ef9fe341ebaf5187d9e203f050.png [copycode.gif]: /images/20220616/4a59f31eb953446fb7e6b393c9d06e2a.png [1056834-20170116180035427-2064043799.jpg]: /images/20220616/4c05516addc64185b04d647e4c73d90c.png
相关 字典树 字典树 Time Limit: 1000ms Memory limit: 65536K 有疑问?点这里^\_^ 题目描述 遇到单词不认识怎么办? 查字 ゞ 浴缸里的玫瑰/ 2022年08月18日 02:28/ 0 赞/ 168 阅读
相关 字典树 字典树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它 你的名字/ 2022年08月02日 14:59/ 0 赞/ 157 阅读
相关 字典树 Trie,又称字典树,前缀树(prefix tree),是一种树形结构,用于保存大量的字符串。 它的优点是:利用字符串的公共前缀来节约存储空间。查找、插入复杂度为O(n),n 电玩女神/ 2022年08月01日 00:08/ 0 赞/ 153 阅读
相关 字典树 Problem H: 位运算的游戏 Time Limit: 2 Sec Memory Limit: 128 MB Submit: 4 Solved: 2 电玩女神/ 2022年07月15日 10:16/ 0 赞/ 148 阅读
相关 字典树 Problem Description 遇到单词不认识怎么办? 查字典啊,已知字典中有n个单词,假设单词都是由小写字母组成。现有m个不认识的单词,询问这m个单词是否出现在 不念不忘少年蓝@/ 2022年07月12日 05:51/ 0 赞/ 192 阅读
相关 字典树 一、引入 [点击打开链接][Link 1] 字典是干啥的?查找字的。 字典树自然也是起查找作用的。查找的是啥?单词。 看以下几个题: 1、给出n个单词和m个询问 今天药忘吃喽~/ 2022年06月16日 08:21/ 0 赞/ 212 阅读
相关 字典树 题目链接:[点击打开链接][Link 1] 代码: include<iostream> include<cstring> using namespa 不念不忘少年蓝@/ 2022年05月30日 05:46/ 0 赞/ 176 阅读
相关 字典树 1 定义 键树又称数字查找树,它是一棵度大于2的树,树中的每个节点值含有组成关键字的符号。例如,若关键字是数值,则节点中只包含一个数位。若关键字是单词,则节点中只包含一个 r囧r小猫/ 2022年04月10日 01:47/ 0 赞/ 245 阅读
相关 字典树 字典树是一种以树这种结构为基础建立的算法 ,那么字典树到底有哪些典型的应用呢? 1.字典树在串的快速检索中的应用。 给出N个单词组成的熟词表,以及一篇全用小写英文 绝地灬酷狼/ 2022年03月19日 04:20/ 0 赞/ 238 阅读
相关 字典树 字典树 前言 利用指针实现 用数组实现 前言 介绍 字典树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用 男娘i/ 2021年11月09日 15:52/ 0 赞/ 281 阅读
还没有评论,来说两句吧...