多毛视频最多的网站,777奇米视频一区二区三区

什么是字典樹(shù)字典樹(shù)，是一種空間換時(shí)間的數(shù)據(jù)結(jié)構(gòu)，又稱Trie樹(shù)、前綴樹(shù)，是一種樹(shù)形結(jié)構(gòu)（字典樹(shù)是一種數(shù)據(jù)結(jié)構(gòu)），典型用于統(tǒng)計(jì)、排序、和保存大量字符串。所以經(jīng)常被搜索引擎系統(tǒng)用于文本詞頻統(tǒng)計(jì)。它的優(yōu)點(diǎn)是：利用字符串的公共前綴來(lái)減少查詢時(shí)間，最大限度地減少無(wú)謂的字符串比較，查詢效率比哈希樹(shù)高。

可能大部分情況你很難直觀或者有接觸的體驗(yàn)，可能對(duì)前綴這個(gè)玩意沒(méi)啥概念，可能做題遇到前綴問(wèn)題也是暴力匹配蒙混過(guò)關(guān)，如果字符串比較少使用哈希表等結(jié)構(gòu)可能也能蒙混過(guò)關(guān)，但如果字符串比較長(zhǎng)、相同前綴較多那么使用字典樹(shù)可以大大減少內(nèi)存的使用和效率。一個(gè)字典樹(shù)的應(yīng)用場(chǎng)景：在搜索框輸入部分單詞下面會(huì)有一些神關(guān)聯(lián)的搜索內(nèi)容，你有時(shí)候都很神奇是怎么做到的，這其實(shí)就是字典樹(shù)的一個(gè)思想。

對(duì)于字典樹(shù)，有三個(gè)重要性質(zhì)：

1：根節(jié)點(diǎn)不包含字符，除了根節(jié)點(diǎn)每個(gè)節(jié)點(diǎn)都只包含一個(gè)字符。root節(jié)點(diǎn)不含字符這樣做的目的是為了能夠包括所有字符串。

2：從根節(jié)點(diǎn)到某一個(gè)節(jié)點(diǎn)，路過(guò)字符串起來(lái)就是該節(jié)點(diǎn)對(duì)應(yīng)的字符串。

3：每個(gè)節(jié)點(diǎn)的子節(jié)點(diǎn)字符不同，也就是找到對(duì)應(yīng)單詞、字符是唯一的。

一個(gè)字典樹(shù)

設(shè)計(jì)實(shí)現(xiàn)字典樹(shù)上面已經(jīng)介紹了什么是字典樹(shù)，那么我們開(kāi)始設(shè)計(jì)一個(gè)字典樹(shù)吧！

對(duì)于字典樹(shù)，可能不同的場(chǎng)景或者需求設(shè)計(jì)上有一些細(xì)致的區(qū)別，但整體來(lái)說(shuō)一般的字典樹(shù)有插入、查詢（指定字符串）、查詢（前綴）。

我們首先來(lái)分析一下簡(jiǎn)單情況吧，就是字符串中全部是26個(gè)小寫(xiě)字母，剛好力扣208實(shí)現(xiàn)Trie樹(shù)可以作為一個(gè)實(shí)現(xiàn)的模板。

實(shí)現(xiàn) Trie 類(lèi)：

Trie（）初始化前綴樹(shù)對(duì)象。

void insert（String word）向前綴樹(shù)中插入字符串 word 。

boolean search（String word）如果字符串 word 在前綴樹(shù)中，返回 true（即，在檢索之前已經(jīng)插入）；否則，返回 false 。

boolean startsWith（String prefix）如果之前已經(jīng)插入的字符串 word 的前綴之一為 prefix ，返回 true ；否則，返回 false 。怎么設(shè)計(jì)這個(gè)字典樹(shù)呢？

對(duì)于一個(gè)字典樹(shù)Trie類(lèi)，肯定是要有一個(gè)根節(jié)點(diǎn)root的，而這個(gè)節(jié)點(diǎn)類(lèi)型TrieNode也有很多設(shè)計(jì)方式，在這里我們?yōu)榱撕?jiǎn)單放一個(gè)26個(gè)大小的TrieNode類(lèi)型數(shù)組，分別對(duì)應(yīng)‘a(chǎn)’-‘z’的字符，同時(shí)用一個(gè)boolean類(lèi)型變量isEnd表示是否為字符串末尾結(jié)束（如果為true說(shuō)明）。

class TrieNode {

TrieNode son［］;

boolean isEnd;//結(jié)束標(biāo)志

public TrieNode（）//初始化

{

son=new TrieNode［26］;

}

用數(shù)組的話如果字符比較多的話可能會(huì)消耗一些內(nèi)存空間，但是這里26個(gè)連續(xù)字符還好的，如果向一個(gè)字典樹(shù)中添加big，bit，bz 那么它其實(shí)是這樣的：

那么再分析一下具體操作：

插入操作：遍歷字符串，同時(shí)從字典樹(shù)root節(jié)點(diǎn)開(kāi)始遍歷，找到每個(gè)字符對(duì)應(yīng)的位置首先判斷是否為空，如果為空需要?jiǎng)?chuàng)建一個(gè)新的Trie。比如插入big的枚舉第一個(gè)b時(shí)候創(chuàng)建TrieNode，后面也是同理。不過(guò)重要的是要在停止的那個(gè)TrieNode將isEnd設(shè)為true表明這個(gè)節(jié)點(diǎn)是構(gòu)成字符串的末尾節(jié)點(diǎn)。

這部分對(duì)應(yīng)的關(guān)鍵代碼為：

TrieNode root;

/** 初始化 */

public Trie（） {

root=new TrieNode（）;

}

/** Inserts a word into the trie. */

public void insert（String word） {

TrieNode node=root;//臨時(shí)節(jié)點(diǎn)用來(lái)枚舉

for（int i=0;i《word.length（）;i++）//枚舉字符串

{

int index=word.charAt（i）-‘a(chǎn)’;//找到26個(gè)對(duì)應(yīng)位置

if（node.son［index］==null）//如果為空需要?jiǎng)?chuàng)建

{

node.son［index］=new TrieNode（）;

}

node=node.son［index］;

}

node.isEnd=true;//最后一個(gè)節(jié)點(diǎn)

}

查詢操作：查詢是建立在字典樹(shù)已經(jīng)建好的情況下，這個(gè)過(guò)程和查詢有些類(lèi)似但不需要?jiǎng)?chuàng)建TrieNode，如果枚舉的過(guò)程一旦發(fā)現(xiàn)該TrieNode未被初始化（即為空）則返回false，如果順利到最后看看該節(jié)點(diǎn)的isEnd是否為true（是否已插入已改字符結(jié)尾的字符串），如果為true則返回true。

這里用一個(gè)例子可能更好懂。插入big串，如果查找ba會(huì)因?yàn)榈诙蝍對(duì)應(yīng)TrieNode為null為為空。如果查找bi也會(huì)返回失敗，因?yàn)橹安迦氲腷ig只在g字符對(duì)應(yīng)TrieNode標(biāo)識(shí)isEnd=true，但i字符下面的isEnd為false，即不存在bi字符串。

該部分對(duì)應(yīng)的核心代碼為：

public boolean search（String word） {

TrieNode node=root;

for（int i=0;i《word.length（）;i++）

{

int index=word.charAt（i）-‘a(chǎn)’;

if（node.son［index］==null）//為null直接返回false

{

return false;

}

node=node.son［index］;

}

return node.isEnd==true;

}

前綴查找：和查詢很相似但是有點(diǎn)區(qū)別，查找失敗的話返回false，但是如果能進(jìn)行到最后一步那么返回true。上面例子插入big查找bi同樣返回true，因?yàn)榇嬖谝运鼮榍熬Y的字符串。

該對(duì)應(yīng)對(duì)應(yīng)的核心代碼為：

public boolean startsWith（String prefix） {

TrieNode node=root;

for（int i=0;i《prefix.length（）;i++）

{

int index=prefix.charAt（i）-‘a(chǎn)’;

if（node.son［index］==null）

{

return false;

}

node=node.son［index］;

}

//能執(zhí)行到最后即返回true

return true;

}

上面代碼合在一起就是完整的字典樹(shù)了，最基礎(chǔ)的版本。完整版為：

代碼

字典樹(shù)小思考字典樹(shù)基礎(chǔ)班很容易，但很可能會(huì)出現(xiàn)一些延伸。

對(duì)于上面是26個(gè)字符的，我們很容易用ASCII找到對(duì)應(yīng)索引，如果字符可能性比較多，用數(shù)組可能浪費(fèi)的空間比較大，那我們也可以用HashMap或者List來(lái)存儲(chǔ)元素啊，用List的話就需要順序枚舉，用HashMap就可以直接查詢，這里就講解一個(gè)使用HashMap（）實(shí)現(xiàn)的字典樹(shù)。

使用HashMap替代數(shù)組（不過(guò)使用哈希就不自帶排序功能了），其實(shí)邏輯是一樣的，只需要判斷時(shí)候用HashMap判斷是否存在對(duì)應(yīng)的key即可，HashMap的類(lèi)型為：

Map《Charac ter，TrieNode》 sonMap;

使用HashMap實(shí)現(xiàn)的字典樹(shù)完整代碼為：

import java.util.HashMap;

import java.util.Map;

public class Trie{

class TrieNode{

Map《Character，TrieNode》 sonMap;

boolean idEnd;

public TrieNode（）

{

sonMap=new HashMap《》（）;

}

TrieNode root;

public Trie（）

{

root=new TrieNode（）;

}

public void insert（String word） {

TrieNode node=root;

for（int i=0;i《word.length（）;i++）

{

char ch=word.charAt（i）;

if（！node.sonMap.containsKey（ch））//不存在插入

{

node.sonMap.put（ch，new TrieNode（））;

}

node=node.sonMap.get（ch）;

}

node.idEnd=true;

}

public boolean search（String word） {

TrieNode node=root;

for（int i=0;i《word.length（）;i++）

{

char ch=word.charAt（i）;

if（！node.sonMap.containsKey（ch））

{

return false;

}

node=node.sonMap.get（ch）;

}

return node.idEnd==true;//必須標(biāo)記為true證明有該字符串

}

public boolean startsWith（String prefix） {

TrieNode node=root;

for（int i=0;i《prefix.length（）;i++）

{

char ch=prefix.charAt（i）;

if（！node.sonMap.containsKey（ch））

{

return false;

}

node=node.sonMap.get（ch）;

}

return true;//執(zhí)行到最后一步即可

}

前面講了，字典樹(shù)用于大量字符的統(tǒng)計(jì)、排序、儲(chǔ)存，其實(shí)排序就是和采用數(shù)組的方式可以進(jìn)行排序，因?yàn)樽址腁SCII有序，在讀取時(shí)候可以按照這個(gè)規(guī)則讀取，這個(gè)思想就和基數(shù)排序有點(diǎn)像了。

而統(tǒng)計(jì)的話可能會(huì)面臨數(shù)量上統(tǒng)計(jì)，可能是出現(xiàn)過(guò)次數(shù)或者前綴單詞數(shù)量統(tǒng)計(jì)，如果每次都枚舉可能有點(diǎn)浪費(fèi)時(shí)間，但你可以TrieNode中添加一個(gè)變量，每次插入的時(shí)候可以統(tǒng)計(jì)次數(shù)。如果字符串有重復(fù)那可以直接添加，如果字符串要去重那可以確定插入成功再給路徑上前綴單詞總數(shù)分別自增。這個(gè)的話就要具體問(wèn)題具體分析了。

此外，字典樹(shù)還有一個(gè)在ACM中用于解決求異或最值的問(wèn)題，我們稱之為：01字典樹(shù)，大家感興趣也可以自行了解（后面可能會(huì)介紹）。

總結(jié)通過(guò)本文，想必你對(duì)字典樹(shù)有了一個(gè)較好的認(rèn)識(shí)，本篇的話目的還是在于讓讀者能夠認(rèn)識(shí)和學(xué)會(huì)基礎(chǔ)的字典樹(shù)，對(duì)其它變形優(yōu)化能有個(gè)初步的認(rèn)識(shí)。

字典樹(shù)可以最大限度地減少無(wú)謂的字符串比較，用于詞頻統(tǒng)計(jì)和大量字符串排序。自帶排序功能，使用中序遍歷序列即可得到排序序列。但是如果字符很多相同前綴很少的話那字典樹(shù)就沒(méi)啥效率優(yōu)勢(shì)的（因?yàn)橐粋€(gè)一個(gè)訪問(wèn)節(jié)點(diǎn)）。

字典樹(shù)的真實(shí)應(yīng)用有很多，例如字符串檢索、文本預(yù)測(cè)、自動(dòng)完成，see also，拼寫(xiě)檢查、詞頻統(tǒng)計(jì)、排序、字符串最長(zhǎng)公共前綴、字符串搜索的前綴匹配、作為其他數(shù)據(jù)結(jié)構(gòu)和算法的輔助結(jié)構(gòu)等等，這里就不再介紹啦。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
6760

瀏覽量
88619
內(nèi)存

內(nèi)存

+關(guān)注

關(guān)注
8

文章
2947

瀏覽量
73730
字符串

字符串

+關(guān)注

關(guān)注
1

文章
567

瀏覽量
20435

原文標(biāo)題：字典樹(shù)，不就有點(diǎn)不一樣的一顆樹(shù)

文章出處：【微信號(hào)：TheAlgorithm，微信公眾號(hào)：算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

嵌入式常用數(shù)據(jù)結(jié)構(gòu)有哪些

在嵌入式編程中，數(shù)據(jù)結(jié)構(gòu)的選擇和使用對(duì)于程序的性能、內(nèi)存管理以及開(kāi)發(fā)效率都具有重要影響。嵌入式系統(tǒng)由于資源受限（如處理器速度、內(nèi)存大小等），因此對(duì)數(shù)據(jù)結(jié)構(gòu)的選擇和使用尤為關(guān)鍵。以下是嵌入式編程中常用的幾種數(shù)據(jù)結(jié)構(gòu)，結(jié)合具體特點(diǎn)和

發(fā)表于 09-02 15:25 ?309次閱讀

探索編程世界的七大數(shù)據(jù)結(jié)構(gòu)

樹(shù)結(jié)構(gòu)就像是一顆倒掛的小樹(shù)，有根、有枝、有葉。它是一種非線性的數(shù)據(jù)結(jié)構(gòu)，以層級(jí)的方式存儲(chǔ)數(shù)據(jù)，頂部是根節(jié)點(diǎn)，底部是葉節(jié)點(diǎn)。

發(fā)表于 04-16 12:04 ?316次閱讀

矢量與柵格數(shù)據(jù)結(jié)構(gòu)各有什么特征

矢量數(shù)據(jù)結(jié)構(gòu)和柵格數(shù)據(jù)結(jié)構(gòu)是地理信息系統(tǒng)（GIS）中最常用的兩種數(shù)據(jù)結(jié)構(gòu)。它們?cè)诖鎯?chǔ)和表示地理要素上有著不同的方法和特征。在接下來(lái)的文章中，我們將詳細(xì)介紹這兩種數(shù)據(jù)結(jié)構(gòu)并比較它們的特點(diǎn)

發(fā)表于 02-25 15:06 ?2024次閱讀

C語(yǔ)言數(shù)據(jù)結(jié)構(gòu)之跳表詳解

大家好，今天分享一篇C語(yǔ)言數(shù)據(jù)結(jié)構(gòu)相關(guān)的文章--跳表。

發(fā)表于 12-29 09:32 ?764次閱讀

C語(yǔ)言<b class='flag-5'>數(shù)據(jù)結(jié)構(gòu)</b>之跳表詳解

redis數(shù)據(jù)結(jié)構(gòu)的底層實(shí)現(xiàn)

Redis是一種內(nèi)存鍵值數(shù)據(jù)庫(kù)，常用于緩存、消息隊(duì)列、實(shí)時(shí)數(shù)據(jù)分析等場(chǎng)景。它的高性能得益于其精心設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)和底層實(shí)現(xiàn)。本文將詳細(xì)介紹Redis常用的

發(fā)表于 12-05 10:14 ?555次閱讀

不同數(shù)據(jù)結(jié)構(gòu)的定義代碼

數(shù)據(jù)結(jié)構(gòu)是相互之間存在一種或多種特定關(guān)系的數(shù)據(jù)元素的集合。

發(fā)表于 11-29 14:13 ?584次閱讀

樹(shù)與二叉樹(shù)的定義

樹(shù)型結(jié)構(gòu) 是一類(lèi)重要的非線性數(shù)據(jù)結(jié)構(gòu) ，其中以樹(shù)和二叉樹(shù)最為常用，直觀來(lái)看，樹(shù)是以分支關(guān)系定義

發(fā)表于 11-24 15:57 ?1156次閱讀

<b class='flag-5'>樹(shù)</b>與二叉<b class='flag-5'>樹(shù)</b>的定義

redis的數(shù)據(jù)結(jié)構(gòu)一般分為哪幾種?

緩存、計(jì)數(shù)器、分布式鎖等。字符串類(lèi)型支持很多操作，如設(shè)置、獲取、刪除、追加等。哈希表（Hashes）：哈希表是 Redis 提供的一個(gè)鍵值對(duì)的數(shù)據(jù)結(jié)構(gòu)，它類(lèi)似于一個(gè)字典，可以存儲(chǔ)多個(gè)字段和值的映射關(guān)系。哈希表適用于存儲(chǔ)對(duì)象，每個(gè)字段代表對(duì)象的一個(gè)屬性，而值則存

發(fā)表于 11-16 11:19 ?390次閱讀

redis的五種數(shù)據(jù)類(lèi)型底層數(shù)據(jù)結(jié)構(gòu)

Redis是一種內(nèi)存數(shù)據(jù)存儲(chǔ)系統(tǒng)，支持多種數(shù)據(jù)結(jié)構(gòu)。這些數(shù)據(jù)結(jié)構(gòu)不僅可以滿足常見(jiàn)的存儲(chǔ)需求，還能夠通過(guò)其底層數(shù)據(jù)結(jié)構(gòu)提供高效的操作和查詢。以下是Redis中常用的五種

發(fā)表于 11-16 11:18 ?647次閱讀

無(wú)鎖CAS如何實(shí)現(xiàn)各種無(wú)鎖的數(shù)據(jù)結(jié)構(gòu)

，可用于在多線程編程中實(shí)現(xiàn)不被打斷的數(shù)據(jù)交換操作，從而避免多線程同時(shí)改寫(xiě)某?數(shù)據(jù)時(shí)由于執(zhí)行順序不確定性以及中斷的不可預(yù)知性產(chǎn)?的數(shù)據(jù)不一致問(wèn)題有了CAS，我們就可以用它來(lái)

發(fā)表于 11-13 15:38 ?687次閱讀

無(wú)鎖CAS如何<b class='flag-5'>實(shí)現(xiàn)</b>各種無(wú)鎖的<b class='flag-5'>數(shù)據(jù)結(jié)構(gòu)</b>

定時(shí)器的實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)選擇

在后端的開(kāi)發(fā)中，定時(shí)器有很廣泛的應(yīng)用。比如：心跳檢測(cè) 倒計(jì)時(shí) 游戲開(kāi)發(fā)的技能冷卻 redis的鍵值的有效期等等，都會(huì)使用到定時(shí)器。定時(shí)器的實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)選擇紅黑樹(shù) 對(duì)于增刪查，時(shí)間復(fù)雜度為O

發(fā)表于 11-13 14:22 ?464次閱讀

定時(shí)器的<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>數(shù)據(jù)結(jié)構(gòu)</b>選擇

ringbuffer數(shù)據(jù)結(jié)構(gòu)介紹

最近在研究srsLTE的代碼,其中就發(fā)現(xiàn)一個(gè)有意思的數(shù)據(jù)結(jié)構(gòu)------ringbuffer。雖然，這是一個(gè)很基本的數(shù)據(jù)結(jié)構(gòu)，但時(shí)，它在LTE這種通信協(xié)議棧系統(tǒng)中卻大行其道，也是很容易被協(xié)議

發(fā)表于 11-13 10:44 ?1432次閱讀

ringbuffer<b class='flag-5'>數(shù)據(jù)結(jié)構(gòu)</b>介紹

epoll的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)

一、epoll的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu) 在開(kāi)始研究源代碼之前，我們先看一下 epoll 中使用的數(shù)據(jù)結(jié)構(gòu)，分別是 eventpoll、epitem 和 eppoll_entry。 1、eventpoll 我們

發(fā)表于 11-10 10:20 ?707次閱讀

epoll的基礎(chǔ)<b class='flag-5'>數(shù)據(jù)結(jié)構(gòu)</b>

Linux內(nèi)核中使用的數(shù)據(jù)結(jié)構(gòu)

Linux內(nèi)核代碼中廣泛使用了數(shù)據(jù)結(jié)構(gòu)和算法，其中最常用的兩個(gè)是鏈表和紅黑樹(shù)。鏈表 Linux內(nèi)核代碼大量使用了鏈表這種數(shù)據(jù)結(jié)構(gòu)。鏈表是在解決數(shù)組不能動(dòng)態(tài)擴(kuò)展這個(gè)缺陷而產(chǎn)生的一種數(shù)據(jù)結(jié)構(gòu)

發(fā)表于 11-09 14:24 ?413次閱讀

關(guān)于替換原生字典munch的使用全解

字典是 Python 中基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)之一，字典的使用，可以說(shuō)是非常的簡(jiǎn)單粗暴，但即便是這樣一個(gè)與世無(wú)爭(zhēng)的數(shù)據(jù)結(jié)構(gòu)，仍然有很多人 "看不慣它" 。也許你并不覺(jué)得，但我相信，你看了這篇

發(fā)表于 10-31 14:12 ?385次閱讀

搜索歷史

數(shù)據(jù)結(jié)構(gòu)字典樹(shù)的實(shí)現(xiàn)

評(píng)論

嵌入式常用數(shù)據(jù)結(jié)構(gòu)有哪些

探索編程世界的七大數(shù)據(jù)結(jié)構(gòu)

矢量與柵格數(shù)據(jù)結(jié)構(gòu)各有什么特征

C語(yǔ)言數(shù)據(jù)結(jié)構(gòu)之跳表詳解

redis數(shù)據(jù)結(jié)構(gòu)的底層實(shí)現(xiàn)

不同數(shù)據(jù)結(jié)構(gòu)的定義代碼

樹(shù)與二叉樹(shù)的定義

redis的數(shù)據(jù)結(jié)構(gòu)一般分為哪幾種?

redis的五種數(shù)據(jù)類(lèi)型底層數(shù)據(jù)結(jié)構(gòu)

無(wú)鎖CAS如何實(shí)現(xiàn)各種無(wú)鎖的數(shù)據(jù)結(jié)構(gòu)

定時(shí)器的實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)選擇

ringbuffer數(shù)據(jù)結(jié)構(gòu)介紹

epoll的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)

Linux內(nèi)核中使用的數(shù)據(jù)結(jié)構(gòu)

關(guān)于替換原生字典munch的使用全解