当前位置：文档库 › 智慧树知道网课《数据挖掘》课后章节测试满分答案

智慧树知道网课《数据挖掘》课后章节测试满分答案

第一章测试

【单选题】(20分)

什么是KDD？

C.文档知识发现

A.数据挖掘与知识发现

D.动态知识发现

B.领域知识发现

【判断题】(20分)

数据挖掘的主要任务是从数据中发现潜在的规则，从而能更好的完成描述数据、预测数据等任务。

错

对

【多选题】(20分)

数据挖掘的预测建模任务主要包括哪几大类问题？

分类

模式匹配

模式发现

回归

【多选题】(20分)

以下哪些学科和数据挖掘有密切联系？

人工智能

计算机组成原理

矿产挖掘

统计

【判断题】(20分)

离群点可以是合法的数据对象或者值。

错

对

第二章测试

【单选题】(20分)

下面哪个属于定量的属性类型：

区间

序数

标称

相异

【单选题】(20分)

只有非零值才重要的二元属性被称作：

非对称的二元属性

离散属性

对称属性

计数属性

【判断题】(20分)

定量属性可以是整数值或者是连续值。

对

错

【单选题】(20分)

中心趋势度量模（mode）是指

数据集中出现频率最高的值

算术平均值

最大值

最小值

【多选题】(20分)

以下哪些是属于中心趋势的度量

标准差

中位数

五数概括

平均值

第三章测试

【单选题】(20分)

数据清洗的方法不包括

一致性检查

缺失值处理

噪声数据清除

重复数据记录处理

【单选题】(20分)

对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务？

分类和预测

噪声检测

频繁模式挖掘

数据预处理

【单选题】(20分)

以下哪项不属于数据规约的方法?

数据压缩

维规约

数值规约

数据迁移

【单选题】(20分)

大数据预处理的方法不包含以下哪个选项?

数据变换

数据清洗

数据采集

数据规约

【判断题】(20分)

在噪声数据中，波动数据比离群点数据偏离整体水平更大。

对

错

第四章测试

【单选题】(20分)

某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？

关联规则发现

自然语言处理

聚类

分类

【判断题】(20分)

关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。

错

对

【判断题】(20分)

具有较高的支持度的项集具有较高的置信度。

错

对

【判断题】(20分)

给定关联规则A→B，意味着：若A发生，B也会发生。

对

错

【判断题】(20分)

啤酒与尿布的故事是聚类分析的典型实例。

对

错

第五章测试

【判断题】(25分)

分类和回归都可用于预测，分类的输出是离散的类别值，而回归的输出是连续数值。

对

错

【判断题】(25分)

决策树方法通常用于关联规则挖掘。

对

错

【判断题】(25分)

在决策树中，随着树中结点数变得太大，即使模型的训练误差还在继续减低，但是检验误差开始增大，这是出现了模型拟合不足的问题。

错

对

【判断题】(25分)

对于SVM分类算法，待分样本集中的大部分样本不是支持向量，移去或者减少这些样本对分类结果没有影响。

对

错

【单选题】(10分)

下面哪种分类方法是属于统计学的分类方法？

贝叶斯分类

判定树归纳

基于案例的推理

后向传播分类

第六章测试

【判断题】(20分)

基于划分方法的聚类都是基于距离来判断数据对象相似度的

对

错

【判断题】(20分)

K-Means聚类过程中计算出的“质心”点是虚拟的。

错

对

【判断题】(20分)

DBSCAN聚类和K-Medians聚类都需要预先指定聚类的簇的数目

对

错

【多选题】(20分)

下列属于层次聚类方法的是

K-Means

DBSCAN

AGNES

DIANA

【单选题】(20分)

衡量离群点的离群因子，计算的是

簇间距离的加权平均值

平均绝对偏差

簇间距离

轮廓系数

第七章测试

【单选题】(20分)

神经元节点计算什么（）

神经元节点先计算线性函数（z=Wx+b），再计算激活

神经元节点先计算激活函数，再计算线性函数(z=Wx+b)

神经元节点计算函数g，函数g计算(Wx+b)

在将输出应用于激活函数之前，神经元节点计算所有特征的平均值

【单选题】(20分)

在一个神经网络里，知道每一个神经元的权重和偏差是最重要的一步。如果以某种方法知道了神经元准确的权重和偏差，你就可以近似任何函数。实现这个最佳的办法是什么？

赋予一个初始值，通过检查跟最佳值的差值，然后迭代更新权重

随机赋值，祈祷它们是正确的

都不正确

搜索所有权重和偏差的组合，直到得到最佳值

【单选题】(20分)

梯度下降算法的正确步骤是什么？

1.计算预测值和真实值之间的误差

2.迭代跟新，直到找到最佳权重

3.把输入传入网络，得到输出值

4.初始化随机权重和偏差

5.对每一个产生误差的神经元，改变相应的（权重）值以减小误差

3,2,1,5,4

1,2,3,4,5

4,3,1,5,2

5,4,3,2,1

【单选题】(20分)

以下什么情况下神经网络模型被称为深度学习模型？

当这是一个图形识别的问题时

都不正确

加入更多层，使神经网络的深度增加

有维度更高的数据

【判断题】(20分)

卷积神经网络可以对一个输入完成不同种类的变换（旋转或缩放），这个表述正确吗？

错

对