如何新增 Power Query:新手入門到進階應用全攻略

您是否曾經遇到過這樣的困擾:面對堆積如山的數據,手動整理、清理、合併,耗費了無數寶貴的時間,卻總是出錯?別擔心!今天這篇文章就是要手把手教您,如何新增 Power Query,並且帶您從零開始,一路進階到能夠獨立運用這項強大工具,大幅提升您的數據處理效率。

Power Query 到底是什麼?為何它如此重要?

在深入探討「如何新增 Power Query」之前,我們先來聊聊它究竟是什麼,以及為什麼它在現代數據分析領域佔有舉足輕重的地位。

簡單來說,Power Query 是一個內建於 Excel(自 2016 版本起)、Power BI Desktop 以及獨立的 Power Query 應用程式中的數據連接、轉換和準備工具。它的核心功能在於「自動化」和「可重複性」。想像一下,您需要每天或每週從不同的 Excel 檔案、資料庫、網頁,甚至是雲端服務中提取數據,然後進行一番標準化、篩選、合併、計算等操作,才能得到您想要的分析結果。如果每次都要重複這些步驟,不僅耗時,也很容易因為一時疏忽而產生錯誤,導致分析結果失準。

Power Query 的出現,徹底改變了這種狀況。透過 Power Query,您可以:

  • 輕鬆連接各式各樣的數據源: 無論是本地的 Excel 檔案、CSV、資料庫(SQL Server、Access 等),還是網路上的網頁、SharePoint 清單,甚至是來自 Azure、Salesforce 等雲端服務的數據,Power Query 都能夠輕鬆駕馭。
  • 視覺化介面引導操作: 大部分的數據轉換操作,都可以透過點擊、選擇來完成,不需要寫複雜的程式碼。
  • 記錄所有操作步驟: Power Query 會自動記錄您對數據進行的每一個轉換步驟。這意味著,當您的原始數據更新時,您只需要重新整理(Refresh)一下 Power Query,它就會依照您預設好的步驟,自動重新處理所有數據,輸出最新的結果。這就是所謂的「可重複性」,大大節省了人工處理的時間。
  • 強大的數據清洗和轉換能力: 它可以處理缺失值、重複值、資料類型轉換、欄位合併與拆分、資料表合併與追加、建立自訂欄位等等,幾乎涵蓋了數據準備的所有常見需求。

據 Microsoft 官方的統計顯示,數據分析師平均會花費 80% 的時間在數據的準備和清洗上,僅有 20% 的時間用於真正的分析和洞察。Power Query 的主要目的,就是將這 80% 的時間大幅縮短,讓您能更專注於分析本身,發掘數據背後的價值。

如何新增 Power Query:步驟詳解

您可能心裡已經開始躍躍欲試了,那麼,如何新增 Power Query 呢?其實,對於大多數使用者來說,Power Query 已經是 Excel 的一部分,您不需要特別「新增」它,而是找到並啟用它。接下來,我就一步一步帶您來操作:

步驟一:開啟您的 Excel 工作簿

首先,請開啟您想要處理數據的 Excel 工作簿。無論是全新的空白檔案,還是已經有數據的檔案,都可以。

步驟二:切換到「資料」索引標籤

在 Excel 的上方功能列中,找到並點擊「資料」這個索引標籤。在這裡,您會看到與數據獲取和處理相關的所有工具。

Excel 資料索引標籤

(示意圖:Excel 的「資料」索引標籤)

步驟三:選擇「取得資料」選項

在「資料」索引標籤下,您會看到一個名為「取得資料」的按鈕(在較舊版本的 Excel 中,可能顯示為「從其他來源」、「從檔案」、「從資料庫」等,但核心功能都是連接數據源)。點擊這個按鈕,一個下拉選單會出現,列出各式各樣的數據源。

Excel 取得資料選項

(示意圖:點擊「取得資料」後出現的選項)

步驟四:選擇您的數據源類型

根據您的數據存放位置和格式,選擇適合的選項。常見的選項包括:

  • 從檔案: 適用於 Excel 工作簿、CSV、XML、JSON 等。
  • 從資料庫: 適用於 SQL Server、Access、MySQL 等。
  • 從線上服務: 適用於 SharePoint 清單、Dynamics 365、Facebook 等。
  • 從其他來源: 包含網頁、ODBC、空白查詢等。

舉個例子,如果您要從另一個 Excel 檔案讀取數據,就可以選擇「從檔案」>「從 Excel 工作簿」。

步驟五:瀏覽並選取您的數據檔案

選擇好數據源類型後,Excel 會彈出一個檔案瀏覽器或連接對話框,讓您選擇要連接的數據檔案或輸入連接資訊。選取完畢後,點擊「開啟」或「確定」。

步驟六:進入 Power Query 編輯器

在您選取數據源後,Power Query 會嘗試載入數據。接下來,您會看到一個「預覽」視窗,顯示從您的數據源讀取的數據。在這個視窗中,您可以選擇要匯入的表格或工作表。最關鍵的一步是,點擊右下角的「轉換資料」按鈕(有些版本可能是「編輯」)。點擊這個按鈕,您就正式進入了 Power Query 編輯器!

Power Query 編輯器預覽視窗

(示意圖:Power Query 編輯器預覽視窗,點擊「轉換資料」進入編輯器)

從此,您就可以在 Power Query 編輯器中,開始您的數據清洗和轉換之旅了!

Power Query 編輯器的基本操作與介面介紹

初次進入 Power Query 編輯器,可能會覺得有點複雜,但別擔心,它的設計非常直觀。我們來快速認識一下它的幾個主要區域:

  • 「查詢」窗格 (Queries Pane): 位於左側,顯示您當前工作簿中所有已建立的 Power Query。您可以新增、複製、刪除或重新命名查詢。
  • 「欄位」窗格 (Fields Pane): 位於右側,當您選取某個查詢時,這裡會顯示該查詢可用的所有欄位(欄名)。
  • 「預覽」窗格 (Preview Pane): 位於中間最大的區域,顯示您當前正在操作的數據預覽。
  • 「套用步驟」窗格 (Applied Steps Pane): 位於左側,緊鄰「查詢」窗格。這是 Power Query 最神奇的地方!您在這裡可以看到所有已經應用到數據上的轉換步驟。您可以點擊某個步驟來查看該步驟的數據狀態,也可以重新命名、刪除或編輯某個步驟。
  • 「功能區」 (Ribbon): 位於上方,包含了各式各樣的數據轉換和設定工具,例如「常用」、「轉換」、「新增欄位」、「檢視」等索引標籤。

我的經驗談:

剛開始接觸 Power Query 時,我最大的困惑就是「套用步驟」到底是什麼意思。後來我才領悟到,它就像是一份詳細的「操作日誌」。您做的任何一個動作,都會被記錄下來,並且可以隨時回溯、修改。這比我以前用 VLOOKUP、IF 函數組合來處理數據,效率和準確性都高出太多了!

常見的 Power Query 數據轉換操作

進入 Power Query 編輯器後,您就可以開始進行各種數據轉換了。這裡列出一些最常用、最基本的操作,讓您快速上手:

1. 移除不需要的欄位

如果您的數據源有很多欄位,但您只需要其中幾欄,可以直接選取不需要的欄位(按住 Ctrl 或 Shift 可選取多個),然後右鍵點擊,選擇「移除欄位」。

2. 篩選資料

和 Excel 的篩選功能類似,您可以點擊欄位標題旁的下拉箭頭,選擇條件來篩選數據。例如,篩選出特定地區的銷售記錄,或是排除特定類型的項目。

3. 變更資料類型

Power Query 會嘗試自動偵測資料類型,但有時會出錯(例如將數字辨識為文字)。您可以選取該欄位,然後在「轉換」索引標籤下,選擇「資料類型」來手動修正,例如改成「整數」、「小數」、「文字」、「日期」等。

4. 移除重複項

在「常用」或「首頁」索引標籤下,您可以找到「移除重複項」的功能。選取您認為需要去重的欄位(通常是 ID 或鍵值欄位),Power Query 就會自動幫您找出並移除重複的列。

5. 篩選錯誤值

在進行數據轉換時,偶爾會產生錯誤值(例如除以零)。您可以點擊欄位標題旁的下拉箭頭,選擇「移除錯誤」。

6. 合併資料表 (Merge Queries)

這是一個非常強大的功能,類似於 Excel 中的 VLOOKUP。如果您有兩個資料表,其中一個有產品 ID,另一個有產品名稱和價格,您可以將這兩個表合併,讓每個產品 ID 都帶上對應的名稱和價格。操作時,需要選取兩個表,並指定作為連接鍵的欄位。

7. 追加資料表 (Append Queries)

如果您有幾個結構相似的資料表(例如,不同月份的銷售報表),您可以使用「追加」功能將它們合併成一個大的資料表。這非常適合處理日積月累的數據。

8. 新增自訂欄位

有時候,您需要根據現有欄位計算出新的值。例如,根據「數量」和「單價」計算出「總價」。在「新增欄位」索引標籤下,選擇「自訂欄位」,然後輸入您的公式。Power Query 的公式語言叫做 M 語言,但對於常見的計算,您可以直接在介面完成。

9. 取消資料列的篩選

在「套用步驟」窗格中,您可以找到像「篩選的資料列」這樣的步驟。點擊該步驟旁邊的 X 圖示,就可以取消該篩選操作。

進階應用:M 語言與參數化查詢

雖然 Power Query 的視覺化介面已經非常強大,但對於更複雜的邏輯,您可能需要了解一點 M 語言。M 語言是 Power Query 用來定義數據轉換步驟的語言。您可以在「新增欄位」>「自訂欄位」或「進階編輯器」中看到和編輯 M 程式碼。

參數化查詢 則是另一項進階技巧。您可以設定參數,例如一個日期範圍或檔案路徑。當您需要變更這些參數時,只需要修改參數值,所有相關的查詢就會自動更新,而不需要逐一修改查詢步驟。這對於需要頻繁切換不同條件進行分析的場景非常有幫助。

Power Query 的優勢總結

為什麼我這麼推崇 Power Query?除了前面提到的自動化和可重複性之外,還有以下幾點是我個人認為非常寶貴的:

  • 減少人工錯誤: 許多人在手動整理數據時,最容易犯的錯誤就是複製貼上時的疏忽、公式寫錯等。Power Query 記錄步驟的特性,大幅降低了這些風險。
  • 提升效率: 一個原本需要數小時甚至數天的人工數據處理流程,透過 Power Query,可能只需要幾分鐘的設定,之後每一次更新數據都只需點擊一下按鈕。
  • 可追溯性強: 由於每個轉換步驟都被清晰記錄,當別人(或未來的您)拿到這個 Excel 檔案時,可以清楚地了解數據是如何被處理的,便於理解和維護。
  • 賦予非程式設計師力量: 傳統上,複雜的數據處理往往需要寫程式腳本,這對許多非 IT 背景的使用者來說是一大門檻。Power Query 的視覺化介面,讓更多人能夠掌握數據處理的藝術。

我個人的親身經歷是,自從開始使用 Power Query 後,我處理 Excel 報表的效率至少提高了 5 倍以上,而且再也不用擔心因為數據更新而重新開始一遍繁瑣的清理工作。這真是省下了我寶貴的加班時間!

常見問題與解答

在使用 Power Query 的過程中,您可能會遇到一些常見的問題。這裡我整理了一些,並提供詳細的解答:

Q1:為什麼我在 Excel 中找不到 Power Query?

A1:Power Query 在 Excel 2016 及之後的版本中是內建的,通常位於「資料」索引標籤下。如果您使用的 Excel 版本較舊(例如 Excel 2010 或 2013),您可能需要從 Microsoft 官方網站下載並安裝 Power Query 的獨立增益集 (Add-in)。請搜尋「Power Query for Excel」來獲取下載連結。安裝後,它也會出現在「資料」索引標籤下。

Q2:我從網頁匯入數據,但 Power Query 抓取的表格不對,怎麼辦?

A2:這是網頁結構變動時常見的問題。當您透過「從網頁」取得資料時,Power Query 會嘗試偵測頁面上的表格。有時候,它可能誤判或抓取到不想要的表格。

在 Power Query 編輯器的預覽視窗中,您會看到一個列表,顯示頁面上偵測到的所有表格。請仔細檢查這個列表,並選取您真正需要的表格。如果列表中的表格都不對,您可能需要檢查一下您輸入的網頁 URL 是否正確,或者嘗試使用「從 Web」功能中的「進階」選項,來指定更精確的 URL 或 HTML 內容,甚至手動輸入 M 程式碼來精確抓取。

Q3:我匯入的數據中有很多空行或不必要的文字,如何一次性刪除?

A3:這也是數據清理的常見需求。您可以透過以下步驟來處理:

首先,您可以在 Power Query 編輯器中,選取您想要清理的欄位,然後點擊欄位標題旁的篩選箭頭。

在篩選選單中,您可以先將「(空白)」或「null」選項取消勾選,這樣就可以移除所有空白列。接著,如果還有不必要的文字,您可以嘗試在「文字篩選」選項中,選擇「等於」、「不等於」、「開頭是」、「結尾是」、「包含」等條件來篩選掉或移除您不需要的內容。

此外,您也可以考慮使用「篩選值」功能,手動輸入您想要保留或移除的特定值。更進一步,如果您要處理的特定文字格式很複雜,則可以考慮使用「自訂欄位」功能,搭配 M 語言中的文字處理函數(例如 `Text.Replace`、`Text.Contains` 等)來進行更精密的清理。

Q4:Power Query 的「合併查詢」和「追加查詢」有什麼區別?

A4:這是兩個功能上非常重要但概念不同的操作:

  • 合併查詢 (Merge Queries): 想像您有一個「訂單」表格,裡面有「客戶 ID」,但沒有「客戶姓名」。您還有一個「客戶」表格,裡面有「客戶 ID」和「客戶姓名」。您可以使用「合併查詢」,以「客戶 ID」為連接鍵,將「客戶姓名」從「客戶」表格「合併」到「訂單」表格中,讓每一筆訂單都帶上對應的客戶姓名。這就像 Excel 的 VLOOKUP,是根據某個鍵值將兩個表格的欄位「横向」連接起來。
  • 追加查詢 (Append Queries): 想像您有兩個「銷售紀錄」表格,一個是「一月份銷售」,另一個是「二月份銷售」。這兩個表格的欄位結構(欄名和資料類型)都應該是相同的。您可以使用「追加查詢」,將「二月份銷售」的紀錄「追加」到「一月份銷售」的紀錄下方,形成一個包含兩個月所有銷售紀錄的單一大表格。這就像是將多個表格的資料「縱向」堆疊在一起。

Q5:我的原始 Excel 檔案位置改變了,Power Query 連接失敗怎麼辦?

A5:這是 Power Query 在處理本地檔案時最常見的問題之一。當您移動、重新命名或刪除原始數據檔案時,Power Query 就找不到數據源了。

解決方法很簡單:

  1. 開啟您的 Excel 工作簿,進入 Power Query 編輯器。
  2. 在「查詢」窗格中,選取那個連接失敗的查詢。
  3. 在「套用步驟」窗格中,您可能會看到一個步驟類似「來源」(Source)。
  4. 右鍵點擊這個「來源」步驟,選擇「編輯設定」(Edit Settings)。
  5. 這會再次開啟連接對話框。您需要重新瀏覽並選取新的檔案位置,或者修改 URL(如果是網頁連結)。
  6. 點擊「確定」或「開啟」,Power Query 就會重新建立連接,並按照您設定好的步驟重新整理數據。

我的建議是: 盡量將您的原始數據檔案存放在一個固定、穩定的位置,避免頻繁移動。如果必須移動,記得及時更新 Power Query 的連接設定。

希望這些詳細的問答能幫助您更好地理解和運用 Power Query。這是一個非常值得投入時間學習的工具!

結語

掌握「如何新增 Power Query」以及如何有效運用它,無疑是現代數據工作者必備的技能之一。它不僅能為您節省大量的時間和精力,更能幫助您減少錯誤,提升數據分析的準確性和效率。從連接數據到進行複雜的轉換,Power Query 提供了一個強大且相對易學的平台。現在,就鼓起勇氣,親手開啟 Power Query 編輯器,開始您的數據優化之旅吧!您會發現,數據處理不再是令人頭痛的苦差事,而是一件充滿樂趣且富有成就感的工作。

如何新增PowerQuery

發佈留言