第一部分:考試內容及要求
一. 數據挖掘概述
【考試內容】
數據挖掘的概念;知識發現過程;數據挖掘數據類型;數據挖掘功能和模式;數據挖掘可利用的技術;數據挖掘應用;數據挖掘的主要問題。
【考試要求】
1.了解數據庫系統技術的演變過程;理解數據挖掘的概念;掌握知識發現過程的7個步驟。
2.掌握數據挖掘的數據類型;掌握數據挖掘功能和模式;理解數據挖掘與統計學、機器學習的聯系和區別;了解數據挖掘的應用領域;了解數據挖掘的主要問題。
二. 數據預處理
【考試內容】
數據屬性;數據基本描述統計;數據預處理概述;數據質量;數據預處理的主要步驟;數據清理;數據集成;數據變換;數據規約;數據離散化。
【考試要求】
1.了解數據對象與屬性類型。
2.理解數據的基本統計描述,掌握均值、中位數、眾數、極差、四分位數、方差、標準差和四分位數極差的概念和計算方法;了解數據基本統計描述的圖形顯示;了解度量數據的相似性和相異性。
3.了解進行數據預處理的原因及其重要性;了解數據質量涉及的因素;掌握數據預處理的主要步驟。
4.了解數據清理的概念;了解處理數據缺失值的方法;了解處理噪音數據的方法。
由于篇幅有限,無法為同學全面展示,想要了解更多,請點擊下面附件進行下載。
您填的信息已提交,老師會在24小時之內與您聯系
如果還有其他疑問請撥打以下電話