2023CUMT《数据挖掘》考题

简答题 10*4题

数据属性类型有哪四种?离散和连续类型的数据邻近性度量方法有?

模型误差有哪两种类型?过拟合的概念,如何解决过拟合?

聚类的定义?分为哪些类型的方法(写出至少三种)?简述它们的代表性算法和优缺点。

k近邻算法与聚类算法的主要区别?k近邻算法与一般分类方法的主要区别?

计算题 15*4题

利用Apriori算法产生频繁项集,最大频繁项集是?

聚类算法计算。

image-20240110150033744

利用贝叶斯分类器计算概率,计算信息增益、信息增益率。

最小二乘法计算。

 

卷面91。时间刚够,聚类算法计算这道题没复习到,应该扣分在这。