本書介紹的各種文字探勘方法,是透過 python 語言進行。各章的學習包都是用python 語言撰寫,因此,閱讀本章各章節內容之前,必須先熟悉 python 的基本語法。附錄一有兩個學習包,第一個介紹python的各種變數,以及變數間的轉換,這是學習 python 的第一步;第二個介紹 dataframe 的常用語法,它是整理資料不可或缺的工具,看懂這兩個學習包,就可進入本章各章的內容了。
進入學習包的聯結後,要按上方的「使用 google colaboratory 開啟」,進入 colab 畫面。按 Ctrl-Enter 鍵,依序執行方塊(cells) 裏的程式碼,執行的結果會立即顯示在方塊下方,大家可以比對程式碼與執行結果間的關係。每段程式都有文字說明,幫助大家瞭解指令的作用。
現在就請大家進入 colab。值得注意的是,執行 colab 必須要有google 帳號,若須存取檔案,則要與 google drive 聯結,在學習包中已有聯結的程式碼,大家只要執行程式碼,即會出現對話框,點選自己的帳號,並按「允許」,就可以在google drive 中讀取或儲存檔案。
看完了第一個學習包,請再接再勵,到第二個學習包:
接著到第三個學習包,程序控制: