Skip to content

安裝資料探勘、機器學習工具 Weka 筆記

Last Updated on 2021-08-31 by Clay

過去我幾乎沒有使用 Weka 的經驗,但在因緣際會下,我有緣接觸了 Weka 這項適用於資料探勘機器學習領域的工具,於是便簡單地紀錄在這裡。

本文分成兩個小節,第一節是如何安裝 Weka 這個工具、第二節則是測試我所安裝的 Weka 是否能正常地運作。

那麼首先,我先簡單介紹一下 Weka 這項工具。


Weka 是什麼?

正如上方所述, Weka 是一項囊括了資料探勘、機器學習等領域功能的軟體,是由紐西蘭的 Waikato 大學使用 Java 所開發的工具,Weka 這四個字也正是『Waikato 智慧分析環境』(Waikato Environment for Knowledge Analysis)的縮寫。

聽說,Weka 同時也是那隻 Icon 上的鳥名 XDDD

跟大多數應用在資料探勘、機器學習領域的工具比起來,Weka 有著圖形化界面,使用者可以在不寫程式的情況下選擇自己想要的資料進行處理(比方說進行分類),這一點可說是相當方便。


下載 Weka

Weka 是 Open Source 的軟體,可以運行在各大平台 Windows、MacOS、Linux 上,所以,只要前往下在頁面並選擇自己的作業系統,便能很輕易地下載:https://waikato.github.io/weka-wiki/downloading_weka/

在這裡,我下載了 Linux 系統的版本,解壓縮後確實地執行了:

cd weka-3-8-4/
sh weka.sh

然後,便會看到 Weka 工具正常地開啟。


使用決策樹進行分類

為了確定所下載的 Weka 能正常運作,可以選擇載入 Weka 內建的天氣資料使用決策樹進行簡單的分類,試試看 Weka 是否能成功分類。


Step 1. 打開 Explorer


Step 2. 載入資料

選擇 Open file ... => 選擇 weka-3-8-4/data/weather.nominal.arff => Open,載入天氣資料。

會看到這樣的資料被載入:

選擇 Edit 鍵可以查看原始資料:


Step 3. 分類

切換到 Classify,選擇 Choose 按鈕選擇分類器。

這裡可以選擇 J48,這是一個二元分類決策樹。

然後按下 Start 鍵,應該會看到 Cross-validation(10 folds) 之後的結果。

如果有正常顯示出資料,那即代表 Weka 工具能正常運作。


References


Read More

Leave a Reply