2023CUMT《数据挖掘》考题
- CUMT课程笔记
- 2024-01-08
- 32热度
- 0评论
简答题 10*4题
一
数据属性类型有哪四种?离散和连续类型的数据邻近性度量方法有?二
模型误差有哪两种类型?过拟合的概念,如何解决过拟合?三
聚类的定义?分为哪些类型的方法(写出至少三种)?简述它们的代表性算法和优缺点。四
k近邻算法与聚类算法的主要区别?k近邻算法与一般分类方法的主要区别?计算题 15*4题
一
利用Apriori算法产生频繁项集,最大频繁项集是?二
聚类算法计算。三
利用贝叶斯分类器计算概率,计算信息增益、信息增益率。四
最小二乘法计算。
卷面91。时间刚够,聚类算法计算这道题没复习到,应该扣分在这。