2013年5月30日 星期四

集群分析(K-Means Clustering)

    想說很久沒有發文了,再不發文可能就會一直拖下去,看來寫部落格應該也是培養一種習慣吧!! 上週在找教學範例檔的時候,無意發現了這個網站「Analytics and Visualization of Big Data」,裏面有cover一些資料探勘的內容,如:如何用RapidMiner做集群分析(K-Means Clustering)的教學(Tutorial),雖然沒有影片,但是有Step-by-Step的操作畫面,所以,有興趣的同學可以去參考一下。

網址在此

    另外,想到之前上課一直沒有講到的地方,就是RapidMiner本身就有教學的範例,如果你想要多練習、多觀摩,可以使用軟體本身的例子,範例檔的位置就在一開啟Rapidminer資料庫(Repository)的時候,一般我們會在DB下面建立我們自己的資料庫,在樹狀資料的最上方有個Sample,展開後就會發現有Data和Process兩個目錄匣,可以在裏面找到教科書中有涵蓋和沒有涵蓋的程序,例如SVM、Validation等,可以學習到進階的資料分析方式。至於Data,則可以配合YouTube上的Tutorial或是利用學過的分析方法(例如相關性分析、關連法、迴歸等)則加以分析,各位同學可以先將資料拉進RapidMiner看看資料的內容,再決定選擇那一種分析方式即可。

使用Rapidminer操作SVM的教學影片如下:

使用Rapidminer操作Cross-validation的教學影片如下:


沒有留言:

張貼留言