好書介紹:Data Manipulation with R

Spector, Phil (2008), Data Manipulation with R, Springer.

 

        許多人都被資料分析/資料探勘中複雜的模型所吸引,殊不知資料分析師費時最多的工作卻是各式資料的前處理(data preprocessing)作業。證諸資料分析競賽中的優勝作品,資料探勘專案的關鍵成功因素是從正確的資料中繪製圖形,或建立適切的資料模型,而非一味地醉心於高階或奇特模型的配適工作。因此,做好資料前處理的工作,方能提升資料品質,加大專案成功的機率。否則,再先進的模型,都會淪為垃圾進垃圾出(garbage in garbage out)的不好結果。

 

         美國加州大學柏克萊分校統計系的軟體顧問 Spector 先生所著的這本經典書籍,介紹了 R 中整理與組織資料的各種技術,從 R 中資料物件的種類、R 如何儲存資料、資料的讀取與寫出方式、日期和時間資料的比較與處理、因子(又稱類別或次序變數)的處理與轉換、運用索引(尤其是邏輯索引)方式存取或修改向量/矩陣/陣列/串列等資料、字符資料的處理、以及 R 中最常用的資料框(data frame)物件的彙總/轉換/變形等處理。全書範例實用,敘述簡單明瞭,實為欲精通 R 資料分析技術者必修的基本馬步。

 

撰文者:國立台北商業技術學院資訊與決策科學所教授、中華 R 軟體學會理事長 鄒慶士 博士