什麼是二元搜尋樹？一篇深入淺出的完整指南

不知道你是不是也有過這樣的經驗？當我們在電腦裡儲存了大量的資料，像是聯絡人、文件，甚至是線上商店裡的商品清單，要是想快速找到某個特定項目，該怎麼辦？這時候，「什麼是二元搜尋樹」這個概念，可就非常重要了！簡單來說，二元搜尋樹（Binary Search Tree, BST）是一種電腦科學中用來組織和儲存資料的結構，它的厲害之處在於，能夠非常有效率地進行搜尋、插入和刪除操作。這篇文章，就是為了讓你徹底搞懂這個實用的資料結構，而且保證用最淺顯易懂的方式，帶你一步一步深入了解！

Table of Contents

二元搜尋樹的基礎概念

首先，我們來看看二元搜尋樹的基本長什麼樣子。想像一下，它就像一個由點點（我們稱之為「節點」）連接起來的樹狀結構。每個節點裡都儲存著一個值，可能是數字、文字，或是其他任何可以比較的資料。而「二元」這個名字，來自於每個節點最多只能有兩個「子節點」：一個是左邊的子節點，另一個是右邊的子節點。

那它跟一般的樹有什麼不一樣呢？關鍵就在於它的「搜尋」特性！二元搜尋樹遵循一個非常重要的規則：

對於樹中的任意一個節點，它的左子樹（也就是所有在它左邊的節點及其子節點）中的所有值，都必須小於該節點的值。
同理，它的右子樹中的所有值，都必須大於該節點的值。

這個規則，真的是太精妙了！正是因為這個特性，我們才能夠以極高的效率找到我們想要的資料。就好像在圖書館裡找書一樣，如果書架按照筆畫或字母順序排列，你就能很快地縮小搜尋範圍，對吧？二元搜尋樹就是這個道理，而且還更加有系統！

在二元搜尋樹裡，最上面那個沒有父節點的節點，我們稱之為「根節點」（Root Node）。而那些沒有子節點的節點，我們就叫做「葉節點」（Leaf Node）。

為什麼要用二元搜尋樹？它的優勢在哪裡？

大家可能會好奇，市面上已經有很多方法可以儲存資料了，像是簡單的陣列（Array）或鏈結串列（Linked List），為什麼還要特別學習二元搜尋樹呢？原因就在於它的效能！

1. 快速搜尋：

想像一下，如果你有一個包含一萬筆資料的列表，想找到其中一個特定的資料。如果用最傳統的方法，你可能得一個一個比對，最慘的情況下，得比對完一萬次！但如果資料是儲存在一個平衡的二元搜尋樹裡，搜尋的速度會快非常多。為什麼呢？因為每次比較，我們都能夠直接排除掉一半的資料。就好像你在玩「猜數字」的遊戲，如果我告訴你數字在1到100之間，你猜50，我告訴你太大了，那你就知道接下來只要猜50以下的數字，是不是就效率很多了？二元搜尋樹的搜尋過程，就是這樣不斷縮小範圍的。

2. 有序性：

二元搜尋樹有個很棒的特性，就是它能夠很自然地以排序的方式取出所有節點的值。透過一種叫做「中序走訪」（In-order Traversal）的方式，我們可以依照從小到大的順序，依序讀取樹裡的所有值。這對於需要處理排序資料的應用來說，非常方便。

3. 彈性插入與刪除：

與陣列相比，二元搜尋樹在插入新資料或刪除現有資料時，通常更有效率。雖然還是需要一些調整，但整體來說，它提供了比陣列更好的動態性。

二元搜尋樹的運作方式：實際操作

理論講了這麼多，我們還是來看看實際操作是怎麼進行的吧！

搜尋（Search）

假設我們要找一個值 `x`，我們從根節點開始：

如果目前節點的值等於 `x`，我們就找到了！
如果 `x` 小於目前節點的值，我們就往左子節點找。
如果 `x` 大於目前節點的值，我們就往右子節點找。
如果我們到達了一個不存在的節點（也就是空值），那就代表 `x` 並不存在於這棵樹裡。

是不是很直覺呢？

插入（Insertion）

要插入一個新值 `v`，步驟和搜尋很類似：

從根節點開始。
如果 `v` 小於目前節點的值，就往左子節點移動。如果左子節點是空的，就把 `v` 插入到這裡。
如果 `v` 大於目前節點的值，就往右子節點移動。如果右子節點是空的，就把 `v` 插入到這裡。
如果 `v` 等於目前節點的值，我們通常會選擇不插入（或者根據需求決定如何處理重複的值）。

刪除（Deletion）

刪除節點是二元搜尋樹裡比較複雜的部分，因為我們必須確保刪除後，樹的結構仍然符合二元搜尋樹的規則。主要有三種情況：

刪除葉節點： 這個最簡單，直接把它移除就好。
刪除只有一個子節點的節點： 我們把這個節點直接換成它的子節點。
刪除有兩個子節點的節點： 這時候，我們需要找一個「替代者」。通常我們會找它「右子樹中最小的節點」，或者「左子樹中最大的節點」。為什麼呢？因為這些節點的值，剛好可以填補被刪除節點的位置，並且維持樹的有序性。找到替代者後，我們就用替代者的值來替換被刪除節點的值，然後再把那個替代者節點刪除（這時候它就會變成前面兩種情況之一，比較好處理了）。

二元搜尋樹的效能分析

談到效能，我們通常會用「時間複雜度」來衡量。對於一個二元搜尋樹，在最理想的「平衡」情況下：

搜尋、插入、刪除的操作，時間複雜度都是 O(log n)。其中 ‘n’ 是樹中的節點數量。

「O(log n)」是什麼意思呢？想像一下，如果你的資料量從1000筆變成100萬筆，搜尋時間不會變成1000倍，而是只增加幾個步驟。這就是 log n 的威力，效率非常驚人！

然而，事情總有「但是」。如果我們插入的資料順序非常特殊，例如，我們不斷插入一個已經排序好的數列（例如 1, 2, 3, 4, 5…），那麼這棵二元搜尋樹就會變得非常「歪斜」，看起來就像一條鏈結串列。這種情況下，搜尋、插入、刪除的最壞時間複雜度就會退化到 O(n)，就跟一般的鏈結串列一樣，失去了二元搜尋樹的優勢。

如何解決樹的歪斜問題？

為了克服這種「歪斜」的問題，電腦科學家們發展出了更進階的二元搜尋樹，它們能夠在插入或刪除節點時，自動進行「自我平衡」的操作，讓樹保持盡量矮胖，而不是細長。最常見的例子有：

AVL 樹 (AVL Tree)： 這是最早的自我平衡二元搜尋樹之一，它透過在插入和刪除後，檢查每個節點的「平衡因子」（左右子樹的高度差），並在必要時進行旋轉（Rotation）操作來維持平衡。
紅黑樹 (Red-Black Tree)： 這是目前應用最廣泛的自我平衡二元搜尋樹之一。它為每個節點加上一個「顏色」（紅色或黑色），並遵循一系列規則，確保樹的任何路徑的黑色節點數量大致相同，從而達到平衡。紅黑樹在許多程式語言的標準函式庫中都有應用，像是 C++ STL 的 `map` 和 `set`，以及 Java 的 `TreeMap` 和 `TreeSet`。
B 樹 (B-Tree) 及 B+ 樹 (B+ Tree)： 這些樹結構通常用在檔案系統或資料庫索引中，它們允許多個鍵值儲存在同一個節點，因此「階數」可以非常高，樹的高度可以非常低，非常適合處理大量外部儲存的資料。

這些進階的樹結構，雖然原理更為複雜，但它們確保了二元搜尋樹在各種情況下都能維持高效能，這也是為什麼它們在現代軟體開發中如此重要的原因。

二元搜尋樹的實際應用

二元搜尋樹及其變種，在我們的日常生活中其實無所不在！

資料庫索引： 這是最常見的應用之一。資料庫為了能夠快速查詢，會在經常被搜尋的欄位建立索引，很多時候就是基於 B 樹或 B+ 樹的結構。
集合（Set）和映射（Map）的實現： 很多程式語言提供的集合（例如儲存不重複元素的容器）和映射（例如儲存鍵值對的容器），底層的實現常常使用紅黑樹，因為它們能夠提供 O(log n) 的搜尋、插入和刪除效能，並且保持元素的有序性。
路由表： 網路路由器在決定封包該往哪個方向傳送時，也可能使用類似二元搜尋樹的結構來快速查找路由資訊。
搜尋引擎： 搜尋引擎在建立和管理網頁索引時，也會用到高效的資料結構，二元搜尋樹的變種是其中可能的一種。

常見相關問題與詳細解答

相信大家在了解二元搜尋樹的過程中，可能還是會有些疑問，以下我們就來一一解答。

Q1：二元搜尋樹一定能保證搜尋速度是 O(log n) 嗎？

A1： 嚴格來說，並不是一定。如前面提到的，如果二元搜尋樹變得非常「歪斜」，例如插入了一系列已經排序好的數值，那麼它的搜尋、插入和刪除操作的最壞時間複雜度會退化到 O(n)。就像一條非常長的直線，找東西就得從頭走到尾。為了克服這個問題，我們才需要使用「自我平衡」的二元搜尋樹，例如 AVL 樹或紅黑樹。這些進階的結構，透過在插入和刪除時進行額外的調整（像是旋轉），能夠確保樹的高度大致保持在 log n 的範圍內，從而保證了 O(log n) 的平均和最壞時間複雜度。

Q2：什麼是「中序走訪」（In-order Traversal）？它跟二元搜尋樹有什麼關係？

A2： 「中序走訪」是遍歷（traverse）一個二元搜尋樹的節點的一種方式。它的順序是：先走訪左子樹，然後處理當前節點，最後走訪右子樹。對於一個二元搜尋樹來說，中序走訪有一個非常棒的特性：它會按照節點值從小到大的順序，依序讀取所有的節點。這意味著，只要對二元搜尋樹執行一次中序走訪，我們就能得到一個排序好的數列。這在需要處理已排序資料的場景下，就顯得非常方便了。例如，當我們需要將樹中的所有元素以遞增順序顯示出來時，中序走訪就是首選的方法。

Q3：什麼時候我應該考慮使用二元搜尋樹，而不是簡單的陣列或雜湊表（Hash Table）？

A3： 這是一個非常實際的問題，選擇合適的資料結構，對程式的效能至關重要。簡單來說，你可以這樣考慮：

陣列 (Array)： 如果你的資料量不大，且很少需要插入或刪除元素，搜尋的頻率不高，那麼簡單的陣列可能是最直接的選擇。它的記憶體配置是連續的，存取速度快，但插入和刪除效率較低。
雜湊表 (Hash Table)： 如果你主要的需求是快速地「查找」某個鍵值對應的值，並且不需要關心元素的順序，那麼雜湊表通常是最佳選擇，因為它的平均搜尋、插入、刪除時間複雜度接近 O(1)。但是，雜湊表在處理「範圍查詢」（例如找出所有大於某個值的元素）或需要有序的輸出時，就不如二元搜尋樹了。
二元搜尋樹 (Binary Search Tree, BST)： 當你需要一個能夠同時兼顧快速搜尋、插入、刪除，又需要保持資料有序性的時候，二元搜尋樹（尤其是自我平衡的變種）就非常適合。例如，你需要實現一個可以快速查找、新增、刪除，同時又能隨時以排序方式取出所有元素的「字典」或「集合」。

所以，如果你關心元素的順序，並且需要頻繁地在搜尋、插入、刪除之間做權衡，那麼二元搜尋樹就是一個非常值得考慮的資料結構。

希望這篇文章能讓你對「什麼是二元搜尋樹」有一個全面且深入的了解！這是一個在電腦科學中極為基礎卻又極為重要的概念，掌握了它，相信你會對如何更有效地組織和處理資料有全新的認識。

什麼是二元搜尋數