2013年4月21日 星期日

RapidMiner課程101


運用海量資料(Big data)分析資料建立商業決策日益重要,另外,目前市面上商業與開放源碼(Opensource)的工具很多,但是各有不同的特點,因此,我特別規劃了這一個部落格來介紹Datamining一個好用的工具--RapidMiner,但由於RapidMiner在台灣使用者並不多,因此,未來我也希望透過資料的收集,可以將RapidMiner的知識推廣給其他的使用者。


  • RapidMiner的介紹 (Wiki)
由於RapidMiner屬開放源碼的工具,因此,在官網上除了Rapidminer主程式外,這家德國的公司也推出許多相關的軟體及訓練課程,也有使用者社群供使用者詢問和討論,另外,如果有特殊的應用程式需求,也可以到社群上找付費的程式。
  • RapidMiner的官方網站 (Rapid-i)
另外,關於RapidMiner的操作與應用,有兩個使用者網站相當熱心,提供YouTube影片和範例教導如何使用這套軟體。這兩個網站分別是:

而我個人則將使用Datamining for the Masses這本書的內容做為教學的參考資料,但由於此書在台灣並無人翻譯,因此,請先參考Amazon上的介紹。這本書有幾個特點:
  • 書中的內容敘述偏向口語,因此,很容易理解。
  • 有Step-by-Step的操作,只要按照步驟操作即可。
  • 提供範例檔下載(Google docs)。
Dataming的主程式可以從官網下載,還有其他的擴充套件(例如Text processing),但很可惜的目前只支援windows系統,Mac使用者就沒辦法用,先介紹到此,後續會有更多的教學內容和教學資源,敬請期待。

沒有留言:

張貼留言