資料分析社群: 集群分析(K-Means Clustering)

2013年5月30日星期四

集群分析(K-Means Clustering)

想說很久沒有發文了，再不發文可能就會一直拖下去，看來寫部落格應該也是培養一種習慣吧!! 上週在找教學範例檔的時候，無意發現了這個網站「Analytics and Visualization of Big Data」，裏面有cover一些資料探勘的內容，如：如何用RapidMiner做集群分析(K-Means Clustering)的教學(Tutorial)，雖然沒有影片，但是有Step-by-Step的操作畫面，所以，有興趣的同學可以去參考一下。

網址在此

另外，想到之前上課一直沒有講到的地方，就是RapidMiner本身就有教學的範例，如果你想要多練習、多觀摩，可以使用軟體本身的例子，範例檔的位置就在一開啟Rapidminer資料庫(Repository)的時候，一般我們會在DB下面建立我們自己的資料庫，在樹狀資料的最上方有個Sample，展開後就會發現有Data和Process兩個目錄匣，可以在裏面找到教科書中有涵蓋和沒有涵蓋的程序，例如SVM、Validation等，可以學習到進階的資料分析方式。至於Data，則可以配合YouTube上的Tutorial或是利用學過的分析方法(例如相關性分析、關連法、迴歸等)則加以分析，各位同學可以先將資料拉進RapidMiner看看資料的內容，再決定選擇那一種分析方式即可。

使用Rapidminer操作SVM的教學影片如下：

使用Rapidminer操作Cross-validation的教學影片如下：

資料分析社群

2013年5月30日星期四

集群分析(K-Means Clustering)

沒有留言:

張貼留言

網誌存檔

2013年5月30日 星期四

集群分析(K-Means Clustering)

沒有留言:

張貼留言

2013年5月30日星期四