文档库 最新最全的文档下载
当前位置:文档库 › (完整版)大数据技术原理与应用林子雨版课后习题答案

(完整版)大数据技术原理与应用林子雨版课后习题答案

(完整版)大数据技术原理与应用林子雨版课后习题答案
(完整版)大数据技术原理与应用林子雨版课后习题答案

第一章

1.试述信息技术发展史上的3次信息化浪潮及具体内容。

2.试述数据产生方式经历的几个阶段

答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。

3.试述大数据的4个基本特征

答:数据量大、数据类型繁多、处理速度快和价值密度低。

4.试述大数据时代的“数据爆炸”的特性

答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。

5.数据研究经历了哪4个阶段?

答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。

6.试述大数据对思维方式的重要影响

答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。

7.大数据决策与传统的基于数据仓库的决策有什么区别

答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。

大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。

8.举例说明大数据的基本应用

答:

9.举例说明大数据的关键技术

答:批处理计算,流计算,图计算,查询分析计算

10.大数据产业包含哪些关键技术。

答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。

11.定义并解释以下术语:云计算、物联网

答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。

物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。

12.详细阐述大数据、云计算和物联网三者之间的区别与联系。

第二章

1.试述hadoop和谷歌的mapreduce、gfs等技术之间的关系

答:Hadoop的核心是分布式文件系统HDFS和MapReduce,HDFS是谷歌文件系统GFS的开源实现,MapReduces是针对谷歌MapReduce的开源实现。

2.试述Hadoop具有哪些特性。

答:高可靠性,高效性,高可扩展性,高容错性,成本低,运行在Linux平台,支持多种编程语言

3.试述Hadoop在各个领域的应用情况。

答:2007年,雅虎在Sunnyvale总部建立了M45——一个包含了4000个处理器和1.5PB容量的Hadooop集群系统;

Facebook主要将Hadoop平台用于日志处理,推荐系统和数据仓库等方面;

百度主要使用Hadoop于日志的存储和统计、网页数据的分析和挖掘、商业分析、在线数据反馈、网页聚类等。

4.试述Hadoop的项目结构以及每个部分的具体功能。

答:

Commeon是为Hadoop其他子项目提供支持的常用工具,主要包括文件系统、RPC 和串行化库

Avro是为Hadoop的子项目,用于数据序列化的系统,提供了丰富的数据结构类型、快速可压缩的二进制数据格式、存储持续性数据的文件集、远程调用的功能和简单的动态语言集成功能。

HDFS是Hadoop项目的两个核心之一,它是针对谷歌文件系统的开源实现。

HBase是一个提高可靠性、高性能、可伸缩、实时读写、分布式的列式数据库,一般采用HDFS作为其底层数据存储。

MapReduce是针对谷歌MapReduce的开源实现,用于大规模数据集的并行运算。

Zoookepper是针对谷歌Chubby的一个开源实现,是高效和可靠的协同工作系统,提供分布式锁之类的基本服务,用于构建分布式应用,减轻分布式应用程序所承担的协调任务。

Hive是一个基于Hadoop的数据仓库工具,可以用于对Hadoop文件中的数据集进行数据整理、特殊查询和分布存储。

Pig是一种数据流语言和运行环境,适合于使用Hadoop和MapReducce平台上查询大型半结构化数据集。

Sqoop可以改进数据的互操作性,主要用来在H大哦哦哦配合关系数据库之间交

换数据。

Chukwa是一个开源的、用于监控大型分布式系统的数据收集系统,可以将各种类型的数据收集成适合Hadoop处理的文件,并保存在HDFS中供Hadoop进行各种 MapReduce操作。

第三章

1.试述分布式文件系统设计的需求。

2.分布式文件系统是如何实现较高水平扩展的?

分布式文件系统在物理结构上是由计算机集群中的多个节点构成的,这些节点分为两类,一类叫“主节点”(Master Node)或者也被称为“名称结点”(NameNode),另一类叫“从节点”(Slave Node)或者也被称为“数据节点”(DataNode)

3.试述HDFS中的块和普通文件系统中的块的区别。

答:在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位,恶如不是以字节为单位。

HDFS中的块,默认一个块大小为64MB,而HDFS中的文件会被拆分成多个块,每个块作为独立的单元进行存储。HDFS在块的大小的设计上明显要大于普通文件系统。

4.试述HDFS中的名称节点和数据节点的具体功能。

答:名称节点负责管理分布式文件系统系统的命名空间,记录分布式文件系统中的每个文件中各个块所在的数据节点的位置信息;

数据节点是分布式文件系统HDFS的工作节点,负责数据的存储和读取,会根据客户端或者是名称节点的调度来进行数据的存储和检索,并向名称节点定期发送自己所存储的块的列表。

hadoop fs -ls 显示指定的文件的详细信息

hadoop fs -cat 指定的文件的内容输出到标准输出

hadoop fs -mkdir 创建指定的文件夹

hadoop fs -get [-ignorecrc] [-crc] 复制指定的文件到本地文件系统指定的文件或文件夹。-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。

hadoop fs -put 从本地文件系统中复制指定的单个或多个源文件到指定的目标文件系统中。也支持从标准输入(stdin)中读取输入写入目标文件系统。

hadoop fs -rmr 删除指定的文件夹及其的所有文件

第四章

1.试述在Hadoop体系架构中HBase与其他组成部分的相互关系。

答:HBase利用Hadoop MapReduce来处理HBase中的海量数据,实现高性能计算;利用Zookeeper作为协同服务,实现稳定服务和失败恢复;使用HDFS作为高可靠的底层存储,利用廉价集群提供海量数据存储能力; Sqoop为HBase的底层数据导入功能,Pig和Hive为HBase提供了高层语言支持,HBase

是BigTable的开源实现。

2.请阐述HBase和BigTable的底层技术的对应关系答:

3.请阐述HBase和传统关系数据库的区别

答:

4.HBase有哪些类型的访问接口?

答:HBase提供了Native Java API , HBase Shell , Thrift Gateway , REST GateWay , Pig , Hive 等访问接口。

5.请以实例说明HBase数据模型。

6.分别解释HBase中行键、列键和时间戳的概念

(1)行键是唯一的,在一个表里只出现一次,否则就是在更新同一行,行键可以是任意的字节数组。

(2)列族需要在创建表的时候就定义好,数量也不宜过多。列族名必须由可打印字符组成,创建表的时候不需要定义好列。

(3)时间戳,默认由系统指定,用户也可以显示设置。使用不同的时间戳来区分不同的版本。

7.请举个实例来阐述HBase的概念视图和物理视图的不同

HBase数据概念视图

HBase数据物理视图

在HBase的概念视图中,一个表可以视为一个稀疏、多维的映射关系。

在物理视图中,一个表会按照属于同一列族的数据保存在一起

8.试述HBase各功能组建及其作用

(1)库函数:链接到每个客户端;

(2)一个Master主服务器:主服务器Master主要负责表和Region的管理工作;

(3)许多个Region服务器:Region服务器是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求

9.请阐述HBase的数据分区机制。

答:HBase采用分区存储,一个大的表会被分拆许多个Region,这些Region 会被分发到不同的服务器上实现分布式存储。

10.HBase中的分区是如何定位的。

通过构建的映射表的每个条目包含两项内容,一个是Regionde 标识符,另一个是Region服务器标识,这个条目就标识Region和Region服务器之间的对应关系,从而就可以知道某个Region被保存在哪个Region服务器中。

11.试述HBase的三层结构中各层次的名称和作用。

12.请阐述HBase的三层结构下,客户端是如何访问到数据的。

答:首先访问Zookeeper,获取-ROOT表的位置信息,然后访问-Root-表,获得.MATA.表的信息,接着访问.MATA.表,找到所需的Region具体位于哪个Region服务器,最后才会到该Region服务器读取数据。

13.试述HBase系统基本架构以及每个组成部分的作用。

(1)客户端

客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的Region 位置信息,用来加快后续数据访问过程

(2)Zookeeper服务器

Zookeeper可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行,这就避免了Master的“单点失效”问题(3)Master

主服务器Master主要负责表和Region的管理工作:管理用户对表的增加、删除、修改、查询等操作;实现不同Region服务器之间的负载均衡;在Region 分裂或合并后,负责重新调整Region的分布;对发生故障失效的Region服务器上的Region进行迁移

(4)Region服务器

Region服务器是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求

14.请阐述Region服务器向HDFS文件系统中读写数据的基本原理

Region服务器内部管理一系列Region对象和一个HLog文件,其中,HLog 是磁盘上面的记录文件,它记录着所有的更新操作。每个Region对象又是由多个Store组成的,每个Store对象了表中的一个列族的存储。每个Store又包含了MemStore和若干个StoreFile,其中,MemStore是在内存中的缓存。

15.试述HStore的工作原理

每个Store对应了表中的一个列族的存储。每个Store包括一个MenStore缓存和若干个StoreFile文件。MenStore是排序的内存缓冲区,当用户写入数据时,系统首先把数据放入MenStore缓存,当MemStore缓存满时,就会刷新到磁盘中的一个StoreFile文件中,当单个StoreFile文件大小超过一定阈值时,就会触发文件分裂操作。

16.试述HLog的工作原理

答:HBase系统为每个Region服务器配置了一个HLog文件,它是一种预写式日志(Write Ahead Log),用户更新数据必须首先写入日志后,才能写入MemStore缓存,并且,直到MemStore缓存内容对应的日志已经写入磁盘,该缓存内容才能被刷写到磁盘。

17.在HBase中,每个Region服务器维护一个HLog,而不是为每个Region 都单独维护一个HLog。请说明这种做法的优缺点。

优点:多个Region对象的更新操作所发生的日志修改,只需要不断把日志记录追加到单个日志文件中,不需要同时打开、写入到多个日志文件中。

缺点:如果一个Region服务器发生故障,为了恢复其上次的Region对象,需要将Region服务器上的对象,需要将Region服务器上的HLog按照其所属的Region对象进行拆分,然后分发到其他Region服务器上执行恢复操作。

18.当一台Region服务器意外终止时,Master如何发现这种意外终止情况?为了恢复这台发生意外的Region服务器上的Region,Master应该做出哪些处理(包括如何使用HLog进行恢复)?

Zookeeper会实时监测每个Region服务器的状态,当某个Region服务器发生故障时,Zookeeper会通知Master。

Master首先会处理该故障Region服务器上面遗留的HLog文件,这个遗留的HLog文件中包含了来自多个Region对象的日志记录。

系统会根据每条日志记录所属的Region对象对HLog数据进行拆分,分别放到相应Region对象的目录下,然后,再将失效的Region重新分配到可用的Region服务器中,并把与该Region对象相关的HLog日志记录也发送给相应的Region服务器。

Region服务器领取到分配给自己的Region对象以及与之相关的HLog日志记录以后,会重新做一遍日志记录中的各种操作,把日志记录中的数据写入到MemStore缓存中,然后,刷新到磁盘的StoreFile文件中,完成数据恢复。

第五章

1.如何准确理解NoSQL的含义?

NoSQL是一种不同于关系数据库的数据库管理系统设计方式,是对非关系型数据库的一类统称,它采用的数据模型并非传统关系数据库的关系模型,而是类似键/值、列族、文档等非关系模型。

2.试述关系数据库在哪些方面无法满族Web2.0应用的需求。

关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面:

(1)无法满足海量数据的管理需求

(2)无法满足数据高并发的需求

(3)无法满足高可扩展性和高可用性的需求

3.请比较NoSQL数据库和关系数据库的优缺点。

2019继续教育公需科目大数据技术及应用试题答案

2019年度大数据技术及应用试题 单选题: 1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。 A互联网经济 B信息经济 C数码消费 D电子商务 2、法律大数据演示的结果表明,针对“酒驾”这一查询,相关刑罚中主要的是(A) A以上都是 B拘役 C罚金 D有期徒刑 3、根据本课程,取得成功的关键是要从(A)出发 A数据 B技术 C设备 D问题 4、1965年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度每18个月左右可以翻一番,这被称为(摩尔定律) 5、21世纪初,关于查询结果排序我们找到了一种新的方法。(大数据方法:用户的点击数据) 6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。 7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。 8、根据本课程,交通数据采集的来源不包括(A) A通讯信号 B视频监控 C微波采集 D车载RFID 9、根据本课程,(实时分析)希望能够全面突破搜索引擎框架所蕴含的3个假设,使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高阶知识,满足用户的信息需求。 10、六度分割理论认为,世界上任何两个人通过最多(六)个人就可以相互认识。 11、新经验主义是用经验数据解决问题,但是这些经验是(群体性的经验)。 12、根据本课程,科学家们认为,2013年全世界储存的大数据容量是(1.2ZB) 13、本课程提到,当前(云计算)服务的逐渐成熟,为大数据发展提供了有利的基础设施支撑。 14、(RFID)是一种标签,可以把一个物体身上的各种特征和信息都收集起来。

继续教育公需科目大数据技术及应用习题答案

精心整理 2019年度大数据技术及应用试题 单选题: 1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。A互联网经济 B信息经济数码消费电子商务D A这一查询相关刑罚中主要的是(2法律大数据演示的结果表明针酒以上都拘罚金有期徒刑)出、根据本课程,取得成功的关键是要从A数据A B技术C设备D问题年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理19654、摩这被称为(18器的性能,比如容量、计算速度和复杂程度每个月左右可以翻一番,)尔定律大数据方法:用户的(215、世纪初,关于查询结果排序我们找到了一种新的方法。精心整理. 精心整理 点击数据) 6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。 7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。 8、根据本课程,交通数据采集的来源不包括(A) A通讯信号

视频监控微波采RFID 车个假设)希望能够全面突破搜索引擎框架所蕴含3、根据本课程实时分使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高知识,满足用户的信息需求。)个人就可以相互认识。 1、六度分割理论认为,世界上任何两个人通过最多六、新经验主义是用经验数据解决问题,但是这些经验是群体性的经)111.2Z年全世界储存的大数据容量是()1、根据本课程,科学家们认为2013)服务的逐渐成熟,为大数据发展提供了有利的基、本课程提到,当前(云计算13 础设施支撑。)是一种标签,可以把一个物体身上的各种特征和信息都收集起来。、(RFID14、本课程提出,搜索引擎是一个搜索框,输一些关键词,然后出来一些页面的列15 A)表,需要用户点开看,这种架构蕴含的基本假设不包括(这些文档彼此不是独立的A B这些文档是静态的假设用户找一个文档,而不是找一个答案C 精心整理. 精心整理 D这些文档是独立的 16、根据本课程,以下哪项不属于智慧城市的特点(C) A更广泛的互联互通 B更深入的智慧化 C更传统的方式 D更透彻的感知 17十二期间,我国数据总量年均增长率达到了50

林子雨大数据技术原理及应用第四章课后作业答案

大数据技术原理与应用第四章课后作业 黎狸 1.试述在Hadoop体系架构中HBase与其他组成部分的相互关系。 HBase利用Hadoop MapReduce来处理HBase中的海量数据,实现高性能计算;利用Zookeeper作为协同服务,实现稳定服务和失败恢复;使用HDFS作为高可靠的底层存储,利用廉价集群提供海量数据存储能力; Sqoop为HBase的底层数据导入功能,Pig 和Hive为HBase提供了高层语言支持,HBase是BigTable的开源实现。 2.请阐述HBase和BigTable的底层技术的对应关系。 3.请阐述HBase和传统关系数据库的区别。 4.HBase有哪些类型的访问接口? HBase提供了Native Java API , HBase Shell , Thrift Gateway , REST GateWay , Pig , Hive 等访问接口。 5.请以实例说明HBase数据模型。

6.分别解释HBase中行键、列键和时间戳的概念。 ①行键标识行。行键可以是任意字符串,行键保存为字节数组。 ②列族。HBase的基本的访问控制单元,需在表创建时就定义好。 ③时间戳。每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索 引。 7.请举个实例来阐述HBase的概念视图和物理视图的不同。 8.试述HBase各功能组件及其作用。 ①库函数:链接到每个客户端; ②一个Master主服务器:主服务器Master主要负责表和Region的管理工作; ③③许多个Region服务器:Region服务器是HBase中最核心的模块,负责存储和 维护分配给自己的Region,并响应用户的读写请求

大数据技术原理与应用-林子雨版-课后习题答案复习进程

大数据技术原理与应用-林子雨版-课后习 题答案

第一章 1.试述信息技术发展史上的3次信息化浪潮及具体内容。 2.试述数据产生方式经历的几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。 3.试述大数据的4个基本特征 答:数据量大、数据类型繁多、处理速度快和价值密度低。 4.试述大数据时代的“数据爆炸”的特性 答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。 5.数据研究经历了哪4个阶段? 答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。 6.试述大数据对思维方式的重要影响 答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。 7.大数据决策与传统的基于数据仓库的决策有什么区别 答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。 大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。

8.举例说明大数据的基本应用 9.举例说明大数据的关键技术 答:批处理计算,流计算,图计算,查询分析计算 10.大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。 11.定义并解释以下术语:云计算、物联网 答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。

大数据技术及应用题库

大数据技术及应用题库 单选题: 1从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库 2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3数据仓库的最终目的是(D)。 a. . 收集业务需求 b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析 d. . 为用户和业务部门提供决策支持 4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。

a. . 处理速度快(秒级定律) b. . 算法种类更多 c. . 精度更高 d. . 更加智能化 5大数据的起源是(C)。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理 6大数据不是要教机器像人一样思考。相反,它是(A)。 a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚 7人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

8数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查 d. . 重复数据记录处理 9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据 11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态

数据库原理与应用综合题

1、现有如下关系模式:R(A,B,C,D,E) ,R上的函数依赖集F={AB→E,B→C,C→D }。 1.该关系模式最高满足第几范式并说明原因。 2.如果将关系模式R分解为R1(A,B,E)和R2(B,C,D),指 出关系模式R2的码,并说明该关系模式最高满足第几范式?。 3.判断2中的分解是否具有无损连接性。 4.将关系模式R分解成具有无损连接性的BCNF。 答:1. 该关系模式的候选键为AB。因为B→C,所以非键属性C部分依赖于候选键AB,所以该关系模式不是2NF,最高是1NF。(3分) 2. F在R2上的投影为{B→C,C→D},候选键是B。不存在非键属性对候选键的部分依赖,但是有B→C,C→D,且C B,因此非键属性D传递依赖于键B,因此R2不是3NF,最高满足2NF。(3分) 3. 设U1和U2分别是R1和R2的属性集合。U1?U2=B,U1-U2=AE,B→AE 不属于F+,U2-U1=CD,B→CD属于F+,所以有U1?U2→U2-U1,所以分解具有无损连接性。(3分) 4. 因为B→C,决定因素B不是键,因此把R分解成R1(BC)和R2(ABDE)。其中R1上的函数依赖集合F1={B→C},候选键是B,因此是BCNF。R2上的函数依赖集合F2={AB→E},候选键为ABD,非BCNF,进一步分解为R21(ABE)和R22(ABD)。R21上的函数依赖集合F21={ AB→E },候选键是AB,是BCNF。R22的候选键是全键,函数依赖依赖集合为空集,也是BCNF。因此原关系模式R分解成R1、R21、R22。(3分,此题的分解方法不唯一) 2、一个图书借阅数据库系统要求提供下述服务:可随时查询书库中现有书籍的名称、品种、数量与存放位置,所有各类书籍均可由书号唯一标识;可随时查询书籍借还情况。包括借书人单位、姓名、借书证号、借书日期和还书日期。约定:任何人可借多种书,任何一种书可为多个人所借,借书证号具有唯一性;当需要时,可通过数据库中保存的出版社电报编号、电话、邮编及地址等信息向有关书籍的出版社增购有关书籍。约定:一个出版社可出版多种书籍,同一本书仅为一个出版社出版,出版社名具有唯一性。 1.根据上述语义画出ER图,要求在图中画出属性并注明联系的类型。(6分,其中实体2分、联系2分、属性2分) 2.将ER模型转换成关系模型,并指出每个关系模式的主键和外键。(共4分,每个完整的关系模式1分,若关系模式的属性描述正确但主键或外键有错误时适当给分)

大数据技术原理与应用 林子雨版 课后习题答案(精编文档).doc

【最新整理,下载后即可编辑】 第一章 1.试述信息技术发展史上的3次信息化浪潮及具体内容。 2.试述数据产生方式经历的几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。

3.试述大数据的4个基本特征 答:数据量大、数据类型繁多、处理速度快和价值密度低。 4.试述大数据时代的“数据爆炸”的特性 答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。 5.数据研究经历了哪4个阶段? 答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。 6.试述大数据对思维方式的重要影响 答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。 7.大数据决策与传统的基于数据仓库的决策有什么区别 答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。 大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。

8.举例说明大数据的基本应用 答: 9.举例说明大数据的关键技术 答:批处理计算,流计算,图计算,查询分析计算 10.大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。

11.定义并解释以下术语:云计算、物联网 答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。 12.详细阐述大数据、云计算和物联网三者之间的区别与联系。

数据库原理及应用练习题及参考答案

数据库原理与应用练习题及参考答案 一、选择题 1.一下关于关系的说法正确的是( A ) A. —个关系就是一张二维表 B. 在关系所对应的二维表中,行对应属性,列对应元组。 C. 关系中各属性不允许有相同的域。 D. 关系的各属性名必须与对应的域同名。 3. 进行自然连接运算的两个关系( A. 至少存在一个相同的属性名 C 不可存在个相同的属性名 A ) B. 可不存在任何相同的属性名 D 所有属性名必须完全相同 4. 概念结构设计是整个数据库设计的关键,它通过对用户需求进行综合、归纳与抽象,形成 一个独立于具体 DBMS 的(B )。 A. 数据模型 B.概念模型 C 层次模型 D.关系模型 5. Access 2010数据库具有很多特点,下列叙述中,正确的是( B )。 A. Access 2010数据表可以保存多种数据类型,但是不包括多媒体数 B. Access 2010可以通过编写应用程序来操作数据库中的数据 C. Access 不能支持 Internet/Intranet 应用 D. Access 2010 使用切换面板窗体管理数据库对象 6. 数据表的基本对象是( A ) 7.利用 Access 2010 创建数据库文件, 其扩展名是( B ) A.mdb B.accdb C.xlsx D. acc 8. 启动 Access 2010 后,最先显示的是什么界面( C ) A.数据库工作界面 B. “打开”窗口 C. Backstage D 导航窗格 9. 在 Access 数据库对象中,不包括的是( B ) A.表 B.向导 C 窗体 D.模块 10. 表的组成内容包括( C ) A.查询和字段 B.报表和字段 C.字段和记录 D.记录和窗体 2.关系数据表的关键字可由( A.一个 B.两个 D )属性组成。 C 多个 D.—个或多个 A. 表 B.查询 C 报表 D.窗体

(完整版)大数据技术原理与应用林子雨版课后习题答案

第一章 1.试述信息技术发展史上的3次信息化浪潮及具体内容。 2.试述数据产生方式经历的几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。 3.试述大数据的4个基本特征 答:数据量大、数据类型繁多、处理速度快和价值密度低。 4.试述大数据时代的“数据爆炸”的特性 答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。 5.数据研究经历了哪4个阶段?

答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。 6.试述大数据对思维方式的重要影响 答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。 7.大数据决策与传统的基于数据仓库的决策有什么区别 答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。 大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。 8.举例说明大数据的基本应用 答: 9.举例说明大数据的关键技术

答:批处理计算,流计算,图计算,查询分析计算 10.大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。 11.定义并解释以下术语:云计算、物联网 答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。 12.详细阐述大数据、云计算和物联网三者之间的区别与联系。

林子雨大数据技术原理与应用答案(全)

林子雨大数据技术原理及应用课后题答案 大数据第一章大数据概述课后题 (1) 大数据第二章大数据处理架构Hadoop课后题 (5) 大数据第三章Hadoop分布式文件系统课后题 (10) 大数据第四章分布式数据库HBase课后题 (16) 大数据第五章NoSQl数据库课后题 (22) 大数据第六章云数据库课后作题 (28) 大数据第七章MapReduce课后题 (34) 大数据第八章流计算课后题 (41) 大数据第九章图计算课后题 (50) 大数据第十章数据可视化课后题 (53) 大数据第一章课后题 ——大数据概述 1.试述信息技术发展史上的3次信息化浪潮及其具体内容。 第一次信息化浪潮1980年前后个人计算机开始普及,计算机走入企业和千家万户。代表企业:Intel,AMD,IBM,苹果,微软,联想,戴尔,惠普等。 第二次信息化浪潮1995年前后进入互联网时代。代表企业:雅虎,谷歌阿里巴巴,百度,腾讯。 第三次信息浪潮2010年前后,云计算大数据,物联网快速发展,即将涌现一批新的市场标杆企业。 2.试述数据产生方式经历的几个阶段。 经历了三个阶段: 运营式系统阶段数据伴随一定的运营活动而产生并记录在数据库。 用户原创内容阶段Web2.0时代。 感知式系统阶段物联网中的设备每时每刻自动产生大量数据。 3.试述大数据的4个基本特征。

数据量大(Volume) 据类型繁多(Variety) 处理速度快(Velocity) 价值密度低(Value) 4.试述大数据时代的“数据爆炸”特性。 大数据摩尔定律:人类社会产生的数据一直都在以每年50%的速度增长,即每两年就增加一倍。 5.科学研究经历了那四个阶段? 实验比萨斜塔实验 理论采用各种数学,几何,物理等理论,构建问题模型和解决方案。例如:牛一,牛二,牛三定律。 计算设计算法并编写相应程序输入计算机运行。 数据以数据为中心,从数据中发现问题解决问题。 6.试述大数据对思维方式的重要影响。 全样而非抽样 效率而非精确 相关而非因果 7.大数据决策与传统的基于数据仓库的决策有什么区别? 数据仓库以关系数据库为基础,在数据类型和数据量方面存在较大限制。 大数据决策面向类型繁多的,非结构化的海量数据进行决策分析。 8.举例说明大数据的具体应用。 汽车行业大数据和物联网技术无人汽车

大数据技术及应用题库

大数据技术及应用题库单选题: 1 从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库 2 下列论据中,能够支撑“大数据无所不能”的观点的是( A )。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3 数据仓库的最终目的是(D)。 a. . 收集业务需求 b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析 d. . 为用户和业务部门提供决策支持 4 大数据处理技术和传统的数据挖掘技术最大的区别是(A)。 a. . 处理速度快(秒级定律)

b. . 算法种类更多 c. . 精度更高 d. . 更加智能化 5 大数据的起源是( C )。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理 6 大数据不是要教机器像人一样思考。相反,它是( A )。 a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚 7 人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

8 数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查 d. . 重复数据记录处理 9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指 的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据 1大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分 析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态 c. . 新一代技术平台 d. . 新一代信息技术和服务业态

《大数据技术原理与操作应用》第1章习题答案

第一章 单选题 1、下列选项中,最早提出“大数据”这一概念的是()。 ?A、贝恩 ?B、麦肯锡 ?C、吉拉德 ?D、杰弗逊 参考答案: B 答案解析: 暂无解析 2、下列选项中,哪一项是研究大数据最重要的意义()。 ?A、分析 ?B、统计 ?C、测试 ?D、预测 参考答案: D 答案解析: 研究大数据,最重要的意义是预测。 3、Hadoop1.0中,Hadoop内核的主要组成是()。 ?A、HDFS和MapReduce ?B、HDFS和Yarn ?C、Yarn ?D、MapReduce和Yarn 参考答案: A 答案解析: Hadoop1.0中,Hadoop内核的主要是由HDFS和MapReduce两个系统组成。 4、在HDFS中,用于保存数据的节点是()。

?B、datanode ?C、secondaryNode ?D、yarn 参考答案: B 答案解析: 暂无解析 多选题 1、下列选项中,属于Google提出的处理大数据的技术手段有()。 ?A、MapReduce ?B、MySQL ?C、BigTable ?D、GFS 参考答案: A,C,D 答案解析: Google提出了三个处理大数据的技术手段,分别是MapReduce、BigTable和G FS。 2、下列选项中,属于Hadoop优势的有()。 ?A、扩容能力强 ?B、可靠性 ?C、低效率 ?D、高容错性 参考答案: A,B,D 答案解析: Hadoop具有扩展能力强、成本低、高效率、可靠性、高容错性的优势。 3、下列选项中,属于Hadoop版本系列的有()。 ?A、Hadoop4 ?B、Hadoop2 ?C、Hadoop1

《数据库原理与应用》课后习题参考答案

《数据库原理与应用》课后习题参考答案 第一章作业参考答案 1. 单选题C C D B C 2. 判断题对错错错对 3填空题网状模型用户商业智能数据挖掘系统设计 4简答题 1)数据模型是指描述事物对象的数据组成、数据关系、数据约束的抽象结构及其说明。数据模型是指描述事物对象的数据组成、数据关系、数据约束的抽象结 构及其说明。数据模型是指描述事物对象的数据组成、数据关系、数据约束的抽象 结构及其说明。3)数据约束:用于描述数据结构中数据之间的语义联系、数据之间 的制约和依存关系,以及数据动态变化的规则。主流数据库采用关系图模型。数据 库典型数据模型:层次数据模型网状数据模型关系数据模型其它数据模型(如对 象数据模型、键值对数据模型、列式数据模型。。。) 2)数据库——是一种依照特定数据模型组织、存储和管理数据的文件,数据库文件一般存放在辅助存储器以便长久保存。数据库具有如下特点:数据不重复存 放;提供给多种应用程序访问;数据结构独立于使用它的应用程序;对数据增、 删、改、检索由统一软件进行管理和控制。 3)数据库(Database)是一种依照特定模型组织、存储和管理数据的数据结构。 在数据库中,不仅存放了数据,而且还存放了数据与数据之间的关系。数据库内部 元素:用户表:用户在数据库中创建的数据库表;系统表:数据库中系统自带的数 据库表;视图:数据库中用于对数据进行查询的虚拟表;索引:数据库中用于加快 数据查询的索引项;约束:数据库中对数据、数据关系施加的规则;存储过程:数 据库内部完成特定功能处理的程序;触发器:数据库内部因数据变化自动执行的一 类存储过程等等 4)数据库系统包括:用户、数据库应用程序、数据库管理系统和数据库四个组成要素。 5)数据库管理系统(Database Manage System,DBMS )——是一种专门用来创建数据库、管理数据库、维护数据库,并提供对数据库访问的系统软件。数据 库管理系统(DBMS)主要功能:创建数据库和表; 创建支持结构,如索引等; 读取数 据库数据; 修改数据库数据; 维护数据库结构; 执行规则; 并发控制; 提供安全性; 执行 备份和恢复等等 第二章作业参考答案 1 单选题C B D A A 2. 判断题对对错对错 3填空题全外连接数据约束候选键用户定义完整性4简答题外码键 1)在关系模型中,使用“关系”来存储“实体”中的数据。关系(relation)——是指存放实体数据的二维表。关系特征:行存储实体的个体数据;列存储所

大数据技术原理及应用

大数据技术原理及应用 (总10页) -CAL-FENGHAI.-(YICAI)-Company One1 -CAL-本页仅作为文档封面,使用请直接删除

大数据技术原理及应用 大数据处理架构—Hadoop简介 Hadoop项目包括了很多子项目,结构如下图 Common 原名:Core,包含HDFS, MapReduce和其他公共项目,从Hadoop 版本后,HDFS和MapReduce分离出去,其余部分内容构成Hadoop Common。Common为其他子项目提供支持的常用工具,主要包括文件系统、RPC(Remote procedure call) 和串行化库。 Avro Avro是用于数据序列化的系统。它提供了丰富的数据结构类型、快速可压缩的二进制数据格式、存储持久性数据的文件集、远程调用RPC的功能和简单的动态语言集成功能。其中,代码生成器既不需要读写文件数据,也不需要使用或实现RPC协议,它只是一个可选的对静态类型语言的实现。Avro系统依赖于模式(Schema),Avro数据的读和写是在模式之下完成的。这样就可以减少写入数据的开销,提高序列化的速度并缩减其大小。 Avro 可以将数据结构或对象转化成便于存储和传输的格式,节约数据存储空间和网络传输带宽,Hadoop 的其他子项目(如HBase和Hive)的客户端和服务端之间的数据传输。 HDFS HDFS:是一个分布式文件系统,为Hadoop项目两大核心之一,是Google file system(GFS)的开源实现。由于HDFS具有高容错性(fault-tolerant)的特点,所以可以设计部署在低廉(low-cost)的硬件上。它可以通过提供高吞吐率(high throughput)来访问应用程序的数据,适合那些有着超大数据集的应

数据库原理与应用期末复习总结含试题及其答案

数据库原理综合习题答案 1.1名词解释 (1) DB:即数据库(Database),是统一管理的相关数据的集合。DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。 (2) DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。 (3) DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。 (4) 1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。 (5) 1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。 (6) M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。 (7) 数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。 (6) 概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。 (9) 结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。 (10) 层次模型:用树型结构表示实体类型及实体间联系的数据模型。 (11) 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。 (12) 关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。 (13) 概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 (14) 外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。 (15) 内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。 (16) 模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。 (17) 外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。 (18) 数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。 (19) 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。

数据库原理与应用复习题

数据库原理及应用试题 一?单项选择 1. 按照所使用的数据模型来分,数据库可分为_________ 三种模型。 A ?网状,环状和层次 B ?网状,关系和链状 C ?层次,关系和网状 D ?层次,链状和网状 2. 数据库的体系结构由_______ 来组织。 A. 数据库,文件,记录 B.模式,外模式,内模式 C.物理级数据库,信息级 D.文件级,记录级,数据级 3 ? ____ 的数据独立性最高。 A ?文件系统 B ?数据库 C .手工处理 D .其他 4 .数据库中,数据的物理独立性是指______ _______ 。 A ?数据库与数据库管理系统的相互独立 B .用户程序与DBMS的相互独立 C?用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 D ?应用程序与数据库中数据的逻辑结构相互独立 5. 数据库管理系统(DBMS )是_________ 。 A. 一组硬件 B. 一组软件 C.既有硬件,也有软件 D. 一个完整的数据库应用系统 6. 数据管理方法主要有________ 。 A.文件系统与分布式系统 B.分布式系统与批处理 C.批处理与数据库系统 D.数据库系统与文件系统 7 ?对关系模型叙述错误的是_______ 。 A ?建立在严格的数学理论、集合论和谓词演算公式的基础之上 B .微机DBMS绝大部分采取关系数据模型 C ?用二维表表示关系模型是其一大特点 D ?不具有连接操作的DBMS也可以是关系数据库系统 8 .同一个关系模型的任意两个元组值_________ 。 A .不能全同 B .可全同 C ?必须全同 D ?以上都不是 9. 数据库三级模式体系的划分,有利于________ 的保持。 A.数据独立性 B.数据安全性 C.操作可行性 D.结构规范化 10. E-R图时数据库设计的工具之一,一般是用于建立数据库的____________ A.逻辑模型 B.物理模型 C.结构模型 D.概念模型 11. 在关系DB中,任何二元关系模式的最高范式必定是 A.1NF B.2NF C. 3NF D . BCNF 12 .数据库系统的核心是 _______ A.数据库 B ?数据库管理系统 C ?数据模型 D ?软件工具 13. 下列关系中,不可作为关系数据库的关系是 ______

数据库原理与应用试题含答案

一、判断题 [数据库系统概论]2 (F)与用文件系统来管理数据相比,用数据库管理数据增加了数据冗余度。 (F)一个信息只能用一种数据形式来表示。 (F)数据库系统是数据库管理系统的重要组成部分。 (F)数据库的三级模式是概念模型、逻辑模型和物理模型。 (F)E-R模型只能转换为关系模型,不能转换为层次模型和网状模型。 (F)如果一个实体A对应多个实体B,则A与B之间必然是一对多的联系。 [关系型数据库基本原理]2 (F)一个关系的主键只能包含一个属性。 (F)在实体-联系模型中,实体具有属性,联系不能具有属性。 (F)关系运算中,选择运算是从列的角度进行的运算,投影运算是从行的角度进行的运算。 (F)在一个关系模式中,如果A->B,B->C,则称C部分依赖于A。 (F)E-R图转换为关系模型时,实体可转换为关系模式,联系不能转换为关系模式。 (F)E-R图转换为关系模式时,所有的联系都必须转换为独立的关系模式。 [数据库的管理]1 (F)数据库的文件包括数据文件、事务日志文件和索引文件。 (F)数据库的一个数据文件可以属于多个文件组。 (F)在SQL Server中,数据库的主数据文件的扩展名是ldf。 [表的管理]2 (F)创建一个表时,对于表的每一列,必须指明数据类型和长度,例如“生日datetime(8)”。(T)在SQL Server中,nchar数据类型与nvarchar数据类型的区别是,前者是固定长度的,后者是可变长度的。 (T)在SQL Server中,存储逻辑型数据值的数据类型是bit. (F)SQL中的数据定义语言(DDL)用于实现数据增、删、改、查等数据操作。 (F)对于逻辑型的属性,赋值是只能写“YES”或“NO”。 (T)在SQL语句中,对一个字符型的属性赋值,应该两边用单引号将值包括起来。 [数据查询]1 (F)关系型数据库的连接查询有内连接和外连接之分,内连接只能实现两个表的查询,外连接可以实现多个表的查询。 (F)在SELECT语句的WHERE子句部分,不能再使用SELECT语句。 (T)在进行分组统计时,如果需要对分组进行筛选,应使用HAVING语句而不是WHERE语句。[索引与视图]2 (F)为了提高数据库的检索和更新速度,最好在数据表的每个字段都建立索引。 (F)聚集索引一定是唯一性索引,非聚集索引一定是非唯一性索引。 (T)主键索引必然是唯一索引。 (F)视图一旦创建,就存储了数据。 (F)视图只能用来查看数据,不能在视图上进行数据更新。 (F)视图只能用来查看一个基本表的数据,相当于在一个基本表上的投影与选择。 [数据完整性]1

大数据技术及应用题库

1从大量数据中提取知识的过程通常称为( A )。 a. .数据挖掘 b. .人工智能 c. .数据清洗 d. .数据仓库 2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3数据仓库的最终目的是(D)。 a. .收集业务需求 b. .建立数据仓库逻辑模型 c. .开发数据仓库的应用分析 d. .为用户和业务部门提供决策支持 4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。 a. .处理速度快(秒级定律) b. .算法种类更多 c. .精度更高 d. .更加智能化 5大数据的起源是(C)。 a. .金融 b. .电信 c. .互联网 d. .公共管理 6大数据不是要教机器像人一样思考。相反,它是(A )。 a. .把数学算法运用到海量的数据上来预测事情发生的可能性 b. .被视为人工智能的一部 c. .被视为一种机器学习 d. .预测与惩罚 7人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. .感测技术 b. .微电子技术 c. .计算机技术

叮叮小文库d. .通信技术 8数据清洗的方法不包括(D )。 a. .缺失值处理 b. .噪声数据清除 c. . 一致性检查 d. .重复数据记录处理 9.下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B.数据类型多样 C.数据处理速度快 D.数 据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D) o a. .富数据 b. .贫数据 c. .繁数据 d. .大数据 11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分 析,从中发现新知识、创造新价值、提升新能力的(D)o a. .新一代信息技术 b. .新一代服务业态 c. .新一代技术平台 d. .新一代信息技术和服务业态 12万维网之父是(C) A. 彼得?德鲁克 B.舍恩伯格 C.蒂姆?伯纳斯一李 D.斯科特?布朗 13下列演示方式中,不属于传统统计图方式的是(D)o A、柱形图 B、饼状图 C、曲线图 D、网络图 14当前社会中,最为突出的大数据环境是(A)o A、互联网 B、物联网 C、综合国力 D、自然资源

《数据库原理与应用》习题集

《数据库原理与应用》习题集 第1、2章数据库技术基础知识 一、单选题 1. 以下的英文缩写中表示数据库管理系统的是()。 A.DB B.DBMS C.DBA D.DBS 2. 数据库管理系统、操作系统、应用软件的层次关系从核心到外围分别是( )。 A. 数据库管理系统、操作系统、应用软件 B. 操作系统、数据库管理系统、应用软件 C. 数据库管理系统、应用软件、操作系统 D. 操作系统、应用软件、数据库管理系统 3. DBMS是( )。 A. 操作系统的一部分B.一种编译程序 C.在操作系统支持下的系统软件 D.应用程序系统 4. 数据库系统提供给用户的接口是()。 A.数据库语言 B.过程化语言 C.宿主语言D.面向对象语言 5. ()是按照一定的数据模型组织的,长期存储在计算机内,可为多个用户共享的数据的聚集。 A.数据库系统B.数据库 C.关系数据库D.数据库管理系统6. ()处于数据库系统的核心位置。 A.数据模型B.数据库C.数据库管理系统D.数据库管理员7. ()是数据库系统的基础。 A.数据模型B.数据库C.数据库管理系统D.数据库管理员 8. ( )是数据库中全部数据的逻辑结构和特征的描述。 A.模式B.外模式 C.内模式D.存储模式 9. ( )是数据库物理结构和存储方式的描述。 A.模式 B.外模式 C.内模式D.概念模式 10. ( )是用户可以看见和使用的局部数据的逻辑结构和特征的描述 A.模式B.外模式 C.内模式D.概念模式 11. 有了模式/内模式映像,可以保证数据和应用程序之间( )。 A.逻辑独立性B.物理独立性C.数据一致性 D.数据安全性 12. 数据库系统3层结构的描述存放在( )中。 A.数据库B.运行日志C.数据库管理系统D.数据字典 13. 数据管理技术发展阶段中,文件系统阶段与数据库系统阶段的主要区别之一是数据库系统()。 A.有专门的软件对数据进行管理 B.采用一定的数据模型组织数据 C.数据可长期保存 D.数据可共享 14. 关系数据模型通常由3部分组成,它们是( )。 A. 数据结构、数据通信、关系操作 B. 数据结构、关系操作、完整性约束 C. 数据通信、关系操作、完整性约束 D. 数据结构、数据通信、完整性约束 15. 用户可以使用DML对数据库中的数据进行()操纵。 A.查询和更新B.查询和删除C.查询和修改D.插入和修改16. 要想成功地运转数据库,就要在数据处理部门配备( )。 A.部门经理B.数据库管理员C.应用程序员 D.系统设计员17. 下列说法不正确的是( )。

数据库原理与应用试题(A)

湖南农业大学课程考核试卷 课程名称(全称):数据库原理与应用 课程代码:20363B1 考核时间:2008 年 7 月 日 试卷号:A 考核对象:2006级电子商务 1.在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中,数据独立性最高的是____阶段。 A .数据库系统 B .文件系统 C .人工管理 D .数据项管理 2.对关系模型叙述错误的是____。 A .建立在严格的数学理论、集合论和谓词演算公式的基础之上 B .微机DBMS 绝大部分采取关系数据模型 C .用二维表表示关系模型是其一大特点 D .不具有连接操作的DBMS 也可以是关系数据库系统 3.关系运算中花费时间可能最长的运算是____。 A .投影 B .选择 C .笛卡尔积 D .除 4.假定学生关系是S (S #,SNAM E ,SEX ,AGE ),课程关系是C (C #,CNAME ,TEACHER ),学生选课关系是SC (S #,C #,GRADE )。 要查找选修“COMPUTER ”课程的“女”学生姓名,将涉及到关系____。 A .S B .SC ,C C .S ,SC D .S ,C ,SC 一 选择题(本大题共20分,每小题2分)

5. 消除了部分函数依赖的INF的关系模式,必定是____。 A.1NF B.2NF C.3NF D.4NF 6.关系规范化中的删除操作异常是指________。 A.不该删除的数据被删除B.不该插入的数据被插入 C.应该删除的数据未被删除D.应该插入的数据未被插入7.在关系数据库设计中,设计关系模式是____的任务。 A.需求分析阶段B.概念设计阶段C.逻辑设计阶段D.物理设计阶段 8.从E-R模型关系向关系模型转换时,一个M:N联系转换为关系模式时,该关系模式的码是____。 A.M端实体的码B.N端实体的码 C.M端实体码与N端实体码组合D.重新选取其他属性9.下面哪个不是数据库系统必须提供的数据控制功能____。 A.安全性B.可移植性C.完整性D.并发控制 10.设有两个事务T1、T2,其并发操作如图1所示,下面评价正确的是____。 A该操作不存在问题B.该操作丢失修改 C.修改该操作不能重复读D.该操作读“脏”数据 T1 T2 ①读A=10,B=5 ②读A=10 A=A*2写回 ③读A=20,B=5 求和25验证错 图1事务并发操作图 二填空(本大题共20分,每空2分) 1._________是DBMS的基本单位,它是用户定义的一组逻辑一致的程序序列。

相关文档
相关文档 最新文档