第一章测试
1
【单选题】(20分)
什么是KDD?
A.
C.文档知识发现
B.
A.数据挖掘与知识发现
C.
D.动态知识发现
D.
B.领域知识发现
2
【判断题】(20分)
数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。
A.
错
B.
对
3
【多选题】(20分)
数据挖掘的预测建模任务主要包括哪几大类问题?
A.
分类
B.
模式匹配
C.
模式发现
D.
回归
4
【多选题】(20分)
以下哪些学科和数据挖掘有密切联系?
A.
人工智能
B.
计算机组成原理
C.
矿产挖掘
D.
统计
5
【判断题】(20分)
离群点可以是合法的数据对象或者值。
A.
错
B.
对
第二章测试
1
【单选题】(20分)
下面哪个属于定量的属性类型:
A.
区间
B.
序数
C.
标称
D.
相异
2
【单选题】(20分)
只有非零值才重要的二元属性被称作:
A.
非对称的二元属性
B.
离散属性
C.
对称属性
D.
计数属性
3
【判断题】(20分)
定量属性可以是整数值或者是连续值。
A.
对
B.
错
4
【单选题】(20分)
中心趋势度量模(mode)是指
A.
数据集中出现频率最高的值
B.
算术平均值
C.
最大值
D.
最小值
5
【多选题】(20分)
以下哪些是属于中心趋势的度量
A.
标准差
B.
中位数
C.
五数概括
D.
平均值
第三章测试
1
【单选题】(20分)
数据清洗的方法不包括
A.
一致性检查
B.
缺失值处理
C.
噪声数据清除
D.
重复数据记录处理
2
【单选题】(20分)
对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?
A.
分类和预测
B.
噪声检测
C.
频繁模式挖掘
D.
数据预处理
3
【单选题】(20分)
以下哪项不属于数据规约的方法?
A.
数据压缩
B.
维规约
C.
数值规约
D.
数据迁移
4
【单选题】(20分)
大数据预处理的方法不包含以下哪个选项?
A.
数据变换
B.
数据清洗
C.
数据采集
D.
数据规约
5
【判断题】(20分)
在噪声数据中,波动数据比离群点数据偏离整体水平更大。
A.
对
B.
错
第四章测试
1
【单选题】(20分)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?
A.
关联规则发现
B.
自然语言处理
C.
聚类
D.
分类
2
【判断题】(20分)
关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
A.
错
B.
对
3
【判断题】(20分)
具有较高的支持度的项集具有较高的置信度。
A.
错
B.
对
4
【判断题】(20分)
给定关联规则A→B,意味着:若A发生,B也会发生。
A.
对
B.
错
5
【判断题】(20分)
啤酒与尿布的故事是聚类分析的典型实例。
A.
对
B.
错
第五章测试
1
【判断题】(25分)
分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。
A.
对
B.
错
2
【判断题】(25分)
决策树方法通常用于关联规则挖掘。
A.
对
B.
错
3
【判断题】(25分)
在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
A.
错
B.
对
4
【判断题】(25分)
对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。
A.
对
B.
错
5
【单选题】(10分)
下面哪种分类方法是属于统计学的分类方法?
A.
贝叶斯分类
B.
判定树归纳
C.
基于案例的推理
D.
后向传播分类
第六章测试
1
【判断题】(20分)
基于划分方法的聚类都是基于距离来判断数据对象相似度的
A.
对
B.
错
2
【判断题】(20分)
K-Means聚类过程中计算出的“质心”点是虚拟的。
A.
错
B.
对
3
【判断题】(20分)
DBSCAN聚类和K-Medians聚类都需要预先指定聚类的簇的数目
A.
对
B.
错
4
【多选题】(20分)
下列属于层次聚类方法的是
A.
K-Means
B.
DBSCAN
C.
AGNES
D.
DIANA
5
【单选题】(20分)
衡量离群点的离群因子,计算的是
A.
簇间距离的加权平均值
B.
平均绝对偏差
C.
簇间距离
D.
轮廓系数
第七章测试
1
【单选题】(20分)
神经元节点计算什么()
A.
神经元节点先计算线性函数(z=Wx+b),再计算激活
B.
神经元节点先计算激活函数,再计算线性函数(z=Wx+b)
C.
神经元节点计算函数g,函数g计算(Wx+b)
D.
在将输出应用于激活函数之前,神经元节点计算所有特征的平均值
2
【单选题】(20分)
在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如果以某种方法知道了神经元准确的权重和偏差,你就可以近似任何函数。实现这个最佳的办法是什么?
A.
赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重
B.
随机赋值,祈祷它们是正确的
C.
都不正确
D.
搜索所有权重和偏差的组合,直到得到最佳值
3
【单选题】(20分)
梯度下降算法的正确步骤是什么?
1.计算预测值和真实值之间的误差
2.迭代跟新,直到找到最佳权重
3.把输入传入网络,得到输出值
4.初始化随机权重和偏差
5.对每一个产生误差的神经元,改变相应的(权重)值以减小误差
A.
3,2,1,5,4
B.
1,2,3,4,5
C.
4,3,1,5,2
D.
5,4,3,2,1
4
【单选题】(20分)
以下什么情况下神经网络模型被称为深度学习模型?
A.
当这是一个图形识别的问题时
B.
都不正确
C.
加入更多层,使神经网络的深度增加
D.
有维度更高的数据
5
【判断题】(20分)
卷积神经网络可以对一个输入完成不同种类的变换(旋转或缩放),这个表述正确吗?
A.
错
B.
对