2013年5月21日 星期二

資料探勘與資料庫行銷專題

使用軟體:RapidMiner 5.0版

軟體優點:不需要瞭解複雜的演算法、資料結構與撰寫程式的能力

下載位置:Rapid-i.com網站(需註冊後下載) Dropbox載點

教材檔案


教科書:Data Mining for the Masses

Amazon的介紹

課程進度

第一週  軟體安裝、操作介面介紹、資料準備、相關性分析(Correlation)

第二週  關連分析(Association Rules)、集群分析(K-Means Clustering)、區別分析(Discriminant Analysis)

第三週  線性迴歸分析(Linear Regression)、羅吉斯分析(Logistic Regression)

第四週  決策樹(Decision Trees)、社群網絡分析(SNA)

第五週  類神經網路 (Neural Network)

第六週  文字探勘(Text Mining)、網頁探勘(Web Mining)

章節導讀

Step 1. 個案內容
Step 2. 瞭解資料類型與資料分析的目的(ex. 解決問題或輔助決策)
Step 3. 資料準備 (ex. 檢視資料是否完整或遺漏值)
Step 4. 建立資料分析模型 (ex. 分類、預測還是兩者都有) 
Step 5. 結果評估 (ex. 統計結果、因果邏輯、交叉驗證)
Step 6. 成果報告 (ex. 簡報結果、與客戶交換意見與資料儲存)

上課注意事項
  • 因為課程時間很短,儘量每週都能出席。
  • 範例檔或操作結果請儲存在隨身碟或雲端,以便每次上課時使用。
  • 鼓勵帶自己的資料來分析,在每堂課結束前可留半小時提問。
  • 可多利用網路資源(ex. YouTube或社群討論),輔助學習。
個人心得分享:
網路資料無窮無盡、免費且方便取得,分析工具眾多,電腦運算能力強大,在Big Data海量資料分析的時代,只有懂得問對問題的人才能挖到真正的金礦。

沒有留言:

張貼留言