文档库 最新最全的文档下载
当前位置:文档库 › 大数据技术原理与应用 林子雨版 课后习题答案(精编文档).doc

大数据技术原理与应用 林子雨版 课后习题答案(精编文档).doc

大数据技术原理与应用 林子雨版 课后习题答案(精编文档).doc
大数据技术原理与应用 林子雨版 课后习题答案(精编文档).doc

【最新整理,下载后即可编辑】

第一章

1.试述信息技术发展史上的3次信息化浪潮及具体内容。

2.试述数据产生方式经历的几个阶段

答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。

3.试述大数据的4个基本特征

答:数据量大、数据类型繁多、处理速度快和价值密度低。

4.试述大数据时代的“数据爆炸”的特性

答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。

5.数据研究经历了哪4个阶段?

答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。

6.试述大数据对思维方式的重要影响

答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。

7.大数据决策与传统的基于数据仓库的决策有什么区别

答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。

大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。

8.举例说明大数据的基本应用

答:

9.举例说明大数据的关键技术

答:批处理计算,流计算,图计算,查询分析计算

10.大数据产业包含哪些关键技术。

答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。

11.定义并解释以下术语:云计算、物联网

答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。

物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。

12.详细阐述大数据、云计算和物联网三者之间的区别与联系。

第二章

1.试述hadoop和谷歌的mapreduce、gfs等技术之间的关系答:Hadoop的核心是分布式文件系统HDFS和MapReduce,HDFS 是谷歌文件系统GFS的开源实现,MapReduces是针对谷歌MapReduce的开源实现。

2.试述Hadoop具有哪些特性。

答:高可靠性,高效性,高可扩展性,高容错性,成本低,运行在Linux平台,支持多种编程语言

3.试述Hadoop在各个领域的应用情况。

答:2007年,雅虎在Sunnyvale总部建立了M45——一个包含了4000个处理器和1.5PB容量的Hadooop集群系统;Facebook主要将Hadoop平台用于日志处理,推荐系统和数据仓库等方面;

百度主要使用Hadoop于日志的存储和统计、网页数据的分析和挖掘、商业分析、在线数据反馈、网页聚类等。

4.试述Hadoop的项目结构以及每个部分的具体功能。

答:

Commeon是为Hadoop其他子项目提供支持的常用工具,主要包括文件系统、RPC和串行化库

Avro是为Hadoop的子项目,用于数据序列化的系统,提供了丰富的数据结构类型、快速可压缩的二进制数据格式、存储持续性数据的文件集、远程调用的功能和简单的动态语言集成功能。

HDFS是Hadoop项目的两个核心之一,它是针对谷歌文件系统的开源实现。

HBase是一个提高可靠性、高性能、可伸缩、实时读写、分布式的列式数据库,一般采用HDFS作为其底层数据存储。

MapReduce是针对谷歌MapReduce的开源实现,用于大规模数据集的并行运算。

Zoookepper是针对谷歌Chubby的一个开源实现,是高效和可靠的协同工作系统,提供分布式锁之类的基本服务,用于构建分布式应用,减轻分布式应用程序所承担的协调任务。

Hive是一个基于Hadoop的数据仓库工具,可以用于对Hadoop 文件中的数据集进行数据整理、特殊查询和分布存储。

Pig是一种数据流语言和运行环境,适合于使用Hadoop和MapReducce平台上查询大型半结构化数据集。

Sqoop可以改进数据的互操作性,主要用来在H大哦哦哦配合关系数据库之间交换数据。

Chukwa是一个开源的、用于监控大型分布式系统的数据收集系统,可以将各种类型的数据收集成适合Hadoop处理的文件,并保存在HDFS中供Hadoop进行各种MapReduce操作。

第三章

1.试述分布式文件系统设计的需求。

2.分布式文件系统是如何实现较高水平扩展的?

分布式文件系统在物理结构上是由计算机集群中的多个节点构成的,这些节点分为两类,一类叫“主节点”(Master Node)或者也被称为“名称结点”(NameNode),另一类叫“从节点”(Slave Node)或者也被称为“数据节点”(DataNode)

3.试述HDFS中的块和普通文件系统中的块的区别。

答:在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位,恶如不是以字节为单位。

HDFS中的块,默认一个块大小为64MB,而HDFS中的文件会被拆分成多个块,每个块作为独立的单元进行存储。HDFS在块的大小的设计上明显要大于普通文件系统。

4.试述HDFS中的名称节点和数据节点的具体功能。

答:名称节点负责管理分布式文件系统系统的命名空间,记录分布式文件系统中的每个文件中各个块所在的数据节点的位置信息;

数据节点是分布式文件系统HDFS的工作节点,负责数据的存储和读取,会根据客户端或者是名称节点的调度来进行数据的存储和检索,并向名称节点定期发送自己所存储的块的列表。

hadoop fs -ls 显示指定的文件的详细信息

hadoop fs -cat 指定的文件的内容输出到标准输出

hadoop fs -mkdir 创建指定的文件夹

hadoop fs -get [-ignorecrc] [-crc] 复制指定的文件到本地文件系统指定的文件或文件夹。-ignorecrc 选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC 信息。

hadoop fs -put 从本地文件系统中复制指定的单个或多个源文件到指定的目标文件系统中。也支持从标准输入(stdin)中读取输入写入目标文件系统。

hadoop fs -rmr 删除指定的文件夹及其的所有文件

第四章

1.试述在Hadoop体系架构中HBase与其他组成部分的相互关系。

答:HBase利用Hadoop MapReduce来处理HBase中的海量数据,实现高性能计算;利用Zookeeper作为协同服务,实现稳定服务和失败恢复;使用HDFS作为高可靠的底层存储,利用廉价集群提供海量数据存储能力; Sqoop为HBase的底层数据导入功能,Pig和Hive为HBase提供了高层语言支持,HBase是BigTable的开源实现。

2.请阐述HBase和BigTable的底层技术的对应关系

答:

3.请阐述HBase和传统关系数据库的区别

答:

4.HBase有哪些类型的访问接口?

答:HBase提供了Native Java API , HBase Shell , Thrift Gateway , REST GateWay , Pig , Hive 等访问接口。

5.请以实例说明HBase数据模型。

6.分别解释HBase中行键、列键和时间戳的概念

(1)行键是唯一的,在一个表里只出现一次,否则就是在更新同一行,行键可以是任意的字节数组。

(2)列族需要在创建表的时候就定义好,数量也不宜过多。列族名必须由可打印字符组成,创建表的时候不需要定义好列。(3)时间戳,默认由系统指定,用户也可以显示设置。使用不同的时间戳来区分不同的版本。

7.请举个实例来阐述HBase的概念视图和物理视图的不同

HBase数据概念视图

HBase数据物理视图

在HBase的概念视图中,一个表可以视为一个稀疏、多维的映射关系。

在物理视图中,一个表会按照属于同一列族的数据保存在一起

8.试述HBase各功能组建及其作用

(1)库函数:链接到每个客户端;

(2)一个Master主服务器:主服务器Master主要负责表和Region 的管理工作;

(3)许多个Region服务器:Region服务器是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求

9.请阐述HBase的数据分区机制。

答:HBase采用分区存储,一个大的表会被分拆许多个Region,这些Region会被分发到不同的服务器上实现分布式存储。

10.HBase中的分区是如何定位的。

通过构建的映射表的每个条目包含两项内容,一个是Regionde 标识符,另一个是Region服务器标识,这个条目就标识Region 和Region服务器之间的对应关系,从而就可以知道某个Region 被保存在哪个Region服务器中。

11.试述HBase的三层结构中各层次的名称和作用。

12.请阐述HBase的三层结构下,客户端是如何访问到数据的。答:首先访问Zookeeper,获取-ROOT表的位置信息,然后访问-Root-表,获得.MATA.表的信息,接着访问.MATA.表,找到所需

的Region具体位于哪个Region服务器,最后才会到该Region服务器读取数据。

13.试述HBase系统基本架构以及每个组成部分的作用。(1)客户端

客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用来加快后续数据访问过程

(2)Zookeeper服务器

Zookeeper可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行,这就避免了Master 的“单点失效”问题

(3)Master

主服务器Master主要负责表和Region的管理工作:管理用户对表的增加、删除、修改、查询等操作;实现不同Region服务器之间的负载均衡;在Region分裂或合并后,负责重新调整Region的分布;对发生故障失效的Region服务器上的Region进行迁移

(4)Region服务器

Region服务器是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求

14.请阐述Region服务器向HDFS文件系统中读写数据的基本原理

Region服务器内部管理一系列Region对象和一个HLog文件,其中,HLog是磁盘上面的记录文件,它记录着所有的更新操作。每个Region对象又是由多个Store组成的,每个Store对象了表中的一个列族的存储。每个Store又包含了MemStore和若干个StoreFile,其中,MemStore是在内存中的缓存。

15.试述HStore的工作原理

每个Store对应了表中的一个列族的存储。每个Store包括一个MenStore缓存和若干个StoreFile文件。MenStore是排序的内存缓冲区,当用户写入数据时,系统首先把数据放入MenStore缓存,当MemStore缓存满时,就会刷新到磁盘中的一个StoreFile文件中,当单个StoreFile文件大小超过一定阈值时,就会触发文件分裂操作。

16.试述HLog的工作原理

答:HBase系统为每个Region服务器配置了一个HLog文件,它是一种预写式日志(Write Ahead Log),用户更新数据必须首先写入日志后,才能写入MemStore缓存,并且,直到MemStore 缓存内容对应的日志已经写入磁盘,该缓存内容才能被刷写到磁盘。

17.在HBase中,每个Region服务器维护一个HLog,而不是为每个Region都单独维护一个HLog。请说明这种做法的优缺点。

优点:多个Region对象的更新操作所发生的日志修改,只需要不断把日志记录追加到单个日志文件中,不需要同时打开、写入到多个日志文件中。

缺点:如果一个Region服务器发生故障,为了恢复其上次的Region对象,需要将Region服务器上的对象,需要将Region服务器上的HLog按照其所属的Region对象进行拆分,然后分发到其他Region服务器上执行恢复操作。

18.当一台Region服务器意外终止时,Master如何发现这种意外终止情况?为了恢复这台发生意外的Region服务器上的Region,Master应该做出哪些处理(包括如何使用HLog进行恢复)?

Zookeeper会实时监测每个Region服务器的状态,当某个Region服务器发生故障时,Zookeeper会通知Master。

Master首先会处理该故障Region服务器上面遗留的HLog文件,这个遗留的HLog文件中包含了来自多个Region对象的日志记录。

系统会根据每条日志记录所属的Region对象对HLog数据进行拆分,分别放到相应Region对象的目录下,然后,再将失效的Region重新分配到可用的Region服务器中,并把与该Region 对象相关的HLog日志记录也发送给相应的Region服务器。

数据库原理与技术

浙江林学院2007 – 2008学年第 2学期考试卷(A 卷) 课程名称:数据库原理与技术 课程类别:必修 考试方式: 闭卷 注意事项:1、本试卷满分100分。 2、考试时间 120分钟。 3、答案写在答题纸上。 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案, 每小题1分,共30分)。 1. 以下的英文缩写中表示数据库管理系统的是( )。 A .DB B .DBMS C .DBA D .DBS 2.下列说法不正确的是( )。 A .数据库避免了一切数据重复 B .数据库减少了数据冗余 C .数据库数据可为经DBA 认可的用户共享 D .控制冗余可确保数据的一致性 3.下面哪个不是E-R 模型的基本要素( )。 A .实体 B .属性 C .实体联系 D .键 4.( )是用户可以看见和使用的局部数据的逻辑结构和特征的描述。 A .模式 B .外模式 C .内模式 D .概念模式 5. 当两个关系没有公共属性时,其自然连接表现为( )。 A .笛卡儿积 B .等值连接 C .结果为空 D .出错 学院: 专业班级: 姓名: 学号: 订 线 内 不 要 答 题

6.四元关系R(A,B,C,D),下述中正确的是()。 A.πB,C(R)表示取值为B,C的两列组成的关系 B.π2,3(R)表示取值为2,3的两列组成的关系 C.πB,C(R)与π2,3(R)表示的是同一个关系 D.πB,C(R)与π2,3(R)表示不是同一个关系 7.实体完整性要求主属性不能取空值,这一点可以通过()来保证。A.定义外码 B.定义主码 C.用户定义的完整性 D.由关系系统自动生成8.已知关系:厂商(厂商号,厂名)PK=厂商号 产品(产品号,颜色,厂商号)PK=产品号,FK=厂商号 假设两个关系中已经存在如图所示元组: 厂商产品 若再往产品关系中插入如下元组: I(P03,红,C02)II(P01,蓝,C01) III(P04,白,C04)IV(P05,黑,null) 能够插入的元组是()。 A I,II,IV B I,III C I,II D I,IV

林子雨大数据技术原理及应用第四章课后作业答案

大数据技术原理与应用第四章课后作业 黎狸 1.试述在Hadoop体系架构中HBase与其他组成部分的相互关系。 HBase利用Hadoop MapReduce来处理HBase中的海量数据,实现高性能计算;利用Zookeeper作为协同服务,实现稳定服务和失败恢复;使用HDFS作为高可靠的底层存储,利用廉价集群提供海量数据存储能力; Sqoop为HBase的底层数据导入功能,Pig 和Hive为HBase提供了高层语言支持,HBase是BigTable的开源实现。 2.请阐述HBase和BigTable的底层技术的对应关系。 3.请阐述HBase和传统关系数据库的区别。 4.HBase有哪些类型的访问接口? HBase提供了Native Java API , HBase Shell , Thrift Gateway , REST GateWay , Pig , Hive 等访问接口。 5.请以实例说明HBase数据模型。

6.分别解释HBase中行键、列键和时间戳的概念。 ①行键标识行。行键可以是任意字符串,行键保存为字节数组。 ②列族。HBase的基本的访问控制单元,需在表创建时就定义好。 ③时间戳。每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索 引。 7.请举个实例来阐述HBase的概念视图和物理视图的不同。 8.试述HBase各功能组件及其作用。 ①库函数:链接到每个客户端; ②一个Master主服务器:主服务器Master主要负责表和Region的管理工作; ③③许多个Region服务器:Region服务器是HBase中最核心的模块,负责存储和 维护分配给自己的Region,并响应用户的读写请求

大数据技术原理与应用-林子雨版-课后习题答案复习进程

大数据技术原理与应用-林子雨版-课后习 题答案

第一章 1.试述信息技术发展史上的3次信息化浪潮及具体内容。 2.试述数据产生方式经历的几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。 3.试述大数据的4个基本特征 答:数据量大、数据类型繁多、处理速度快和价值密度低。 4.试述大数据时代的“数据爆炸”的特性 答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。 5.数据研究经历了哪4个阶段? 答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。 6.试述大数据对思维方式的重要影响 答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。 7.大数据决策与传统的基于数据仓库的决策有什么区别 答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。 大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。

8.举例说明大数据的基本应用 9.举例说明大数据的关键技术 答:批处理计算,流计算,图计算,查询分析计算 10.大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。 11.定义并解释以下术语:云计算、物联网 答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。

《数据库原理与技术》-复习题答案

数据库原理及应用 习题及解答 1. 数据库基础知识 1. 答: 数据是用于载荷信息的物理符号。 数据的特征是:①数据有“型”和“值”之分;②数据受数据类型和取值范围的约束; ③数据有定性表示和定量表示之分;④数据应具有载体和多种表现形式。 数据与信息的关系为:数据是信息的一种表现形式,数据通过能书写的信息编码表示信息。信息有多种表现形式,它通过手势、眼神、声音或图形等方式表达,但是数据是信息的最佳表现形式。由于数据能够书写,因而它能够被记录、存储和处理,从中挖掘出更深层的信息。但是,数据不等于信息,数据只是信息表达方式中的一种。正确的数据可表达信息,而虚假、错误的数据所表达的是谬误,不是信息。 2. 答: 数据处理是指对数据的收集、组织、整理、加工、存储和传播等工作。围绕着数据所做的工作均称为数据处理。 数据处理的目的为:通过数据管理,收集信息并将信息用数据表示和保存,在需要的时候,为各种使用和数据处理提供数据;通过数据加工,对数据进行变换、抽取和运算,从而得到更有用的数据,以指导或控制人的行为或事物的变化趋势;通过数据传播,使更多的人得到并理解信息,从而使信息的作用充分发挥出来。 3. 答: 数据管理的功能为:(1)组织和保存数据功能,即将收集到的数据合理地分类组织,将其存储在物理载体上,使数据能够长期地被保存;(2)数据维护功能,即根据需要随时进行插入新数据、修改原数据和删除失效数据的操作;(3)数据查询和数据统计功能,即快速地得到需要的正确数据,满足各种使用要求;(4)数据的安全和完整性控制功能,即保证数据的安全性和完整性。 数据管理的目标是:收集完整的信息,将信息用数据表示,按数据结构合理科学地组织并保存数据;为各种使用快速地提供需要的正确数据,并保证数据的安全性和完整性。 4. 答: 数据库是数据管理的新方法和技术,它是一个按数据结构来存储和管理数据的算机机软件系统。数据库中的数据具有的特点是:①数据库中的数据具有数据整体性,即数据库中的数据要保持自身完整的数据结构;②数据库中的数据具有数据共享性,不同的用户可以按各自的用法使用数据库中的数据,多个用户可以同时共享数据库中的数据资源。 5. 答: 数据库管理系统简称DBMS(DatabascManagementSystem),它是专门用于管理数据库的计算机系统软件。数据库管理系统能够为数据库提供数据的定义、建立、维护、查询和统计等操作功能,并完成对数据完整性、安全性进行控制的功能。

数据库原理与应用综合题

1、现有如下关系模式:R(A,B,C,D,E) ,R上的函数依赖集F={AB→E,B→C,C→D }。 1.该关系模式最高满足第几范式并说明原因。 2.如果将关系模式R分解为R1(A,B,E)和R2(B,C,D),指 出关系模式R2的码,并说明该关系模式最高满足第几范式?。 3.判断2中的分解是否具有无损连接性。 4.将关系模式R分解成具有无损连接性的BCNF。 答:1. 该关系模式的候选键为AB。因为B→C,所以非键属性C部分依赖于候选键AB,所以该关系模式不是2NF,最高是1NF。(3分) 2. F在R2上的投影为{B→C,C→D},候选键是B。不存在非键属性对候选键的部分依赖,但是有B→C,C→D,且C B,因此非键属性D传递依赖于键B,因此R2不是3NF,最高满足2NF。(3分) 3. 设U1和U2分别是R1和R2的属性集合。U1?U2=B,U1-U2=AE,B→AE 不属于F+,U2-U1=CD,B→CD属于F+,所以有U1?U2→U2-U1,所以分解具有无损连接性。(3分) 4. 因为B→C,决定因素B不是键,因此把R分解成R1(BC)和R2(ABDE)。其中R1上的函数依赖集合F1={B→C},候选键是B,因此是BCNF。R2上的函数依赖集合F2={AB→E},候选键为ABD,非BCNF,进一步分解为R21(ABE)和R22(ABD)。R21上的函数依赖集合F21={ AB→E },候选键是AB,是BCNF。R22的候选键是全键,函数依赖依赖集合为空集,也是BCNF。因此原关系模式R分解成R1、R21、R22。(3分,此题的分解方法不唯一) 2、一个图书借阅数据库系统要求提供下述服务:可随时查询书库中现有书籍的名称、品种、数量与存放位置,所有各类书籍均可由书号唯一标识;可随时查询书籍借还情况。包括借书人单位、姓名、借书证号、借书日期和还书日期。约定:任何人可借多种书,任何一种书可为多个人所借,借书证号具有唯一性;当需要时,可通过数据库中保存的出版社电报编号、电话、邮编及地址等信息向有关书籍的出版社增购有关书籍。约定:一个出版社可出版多种书籍,同一本书仅为一个出版社出版,出版社名具有唯一性。 1.根据上述语义画出ER图,要求在图中画出属性并注明联系的类型。(6分,其中实体2分、联系2分、属性2分) 2.将ER模型转换成关系模型,并指出每个关系模式的主键和外键。(共4分,每个完整的关系模式1分,若关系模式的属性描述正确但主键或外键有错误时适当给分)

大数据技术原理与应用 林子雨版 课后习题答案(精编文档).doc

【最新整理,下载后即可编辑】 第一章 1.试述信息技术发展史上的3次信息化浪潮及具体内容。 2.试述数据产生方式经历的几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。

3.试述大数据的4个基本特征 答:数据量大、数据类型繁多、处理速度快和价值密度低。 4.试述大数据时代的“数据爆炸”的特性 答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。 5.数据研究经历了哪4个阶段? 答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。 6.试述大数据对思维方式的重要影响 答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。 7.大数据决策与传统的基于数据仓库的决策有什么区别 答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。 大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。

8.举例说明大数据的基本应用 答: 9.举例说明大数据的关键技术 答:批处理计算,流计算,图计算,查询分析计算 10.大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。

11.定义并解释以下术语:云计算、物联网 答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。 12.详细阐述大数据、云计算和物联网三者之间的区别与联系。

数据库原理及应用练习题及参考答案

数据库原理与应用练习题及参考答案 一、选择题 1.一下关于关系的说法正确的是( A ) A. —个关系就是一张二维表 B. 在关系所对应的二维表中,行对应属性,列对应元组。 C. 关系中各属性不允许有相同的域。 D. 关系的各属性名必须与对应的域同名。 3. 进行自然连接运算的两个关系( A. 至少存在一个相同的属性名 C 不可存在个相同的属性名 A ) B. 可不存在任何相同的属性名 D 所有属性名必须完全相同 4. 概念结构设计是整个数据库设计的关键,它通过对用户需求进行综合、归纳与抽象,形成 一个独立于具体 DBMS 的(B )。 A. 数据模型 B.概念模型 C 层次模型 D.关系模型 5. Access 2010数据库具有很多特点,下列叙述中,正确的是( B )。 A. Access 2010数据表可以保存多种数据类型,但是不包括多媒体数 B. Access 2010可以通过编写应用程序来操作数据库中的数据 C. Access 不能支持 Internet/Intranet 应用 D. Access 2010 使用切换面板窗体管理数据库对象 6. 数据表的基本对象是( A ) 7.利用 Access 2010 创建数据库文件, 其扩展名是( B ) A.mdb B.accdb C.xlsx D. acc 8. 启动 Access 2010 后,最先显示的是什么界面( C ) A.数据库工作界面 B. “打开”窗口 C. Backstage D 导航窗格 9. 在 Access 数据库对象中,不包括的是( B ) A.表 B.向导 C 窗体 D.模块 10. 表的组成内容包括( C ) A.查询和字段 B.报表和字段 C.字段和记录 D.记录和窗体 2.关系数据表的关键字可由( A.一个 B.两个 D )属性组成。 C 多个 D.—个或多个 A. 表 B.查询 C 报表 D.窗体

(完整版)大数据技术原理与应用林子雨版课后习题答案

第一章 1.试述信息技术发展史上的3次信息化浪潮及具体内容。 2.试述数据产生方式经历的几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。 3.试述大数据的4个基本特征 答:数据量大、数据类型繁多、处理速度快和价值密度低。 4.试述大数据时代的“数据爆炸”的特性 答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。 5.数据研究经历了哪4个阶段?

答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。 6.试述大数据对思维方式的重要影响 答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。 7.大数据决策与传统的基于数据仓库的决策有什么区别 答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。 大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。 8.举例说明大数据的基本应用 答: 9.举例说明大数据的关键技术

答:批处理计算,流计算,图计算,查询分析计算 10.大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。 11.定义并解释以下术语:云计算、物联网 答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。 12.详细阐述大数据、云计算和物联网三者之间的区别与联系。

林子雨大数据技术原理与应用答案(全)

林子雨大数据技术原理及应用课后题答案 大数据第一章大数据概述课后题 (1) 大数据第二章大数据处理架构Hadoop课后题 (5) 大数据第三章Hadoop分布式文件系统课后题 (10) 大数据第四章分布式数据库HBase课后题 (16) 大数据第五章NoSQl数据库课后题 (22) 大数据第六章云数据库课后作题 (28) 大数据第七章MapReduce课后题 (34) 大数据第八章流计算课后题 (41) 大数据第九章图计算课后题 (50) 大数据第十章数据可视化课后题 (53) 大数据第一章课后题 ——大数据概述 1.试述信息技术发展史上的3次信息化浪潮及其具体内容。 第一次信息化浪潮1980年前后个人计算机开始普及,计算机走入企业和千家万户。代表企业:Intel,AMD,IBM,苹果,微软,联想,戴尔,惠普等。 第二次信息化浪潮1995年前后进入互联网时代。代表企业:雅虎,谷歌阿里巴巴,百度,腾讯。 第三次信息浪潮2010年前后,云计算大数据,物联网快速发展,即将涌现一批新的市场标杆企业。 2.试述数据产生方式经历的几个阶段。 经历了三个阶段: 运营式系统阶段数据伴随一定的运营活动而产生并记录在数据库。 用户原创内容阶段Web2.0时代。 感知式系统阶段物联网中的设备每时每刻自动产生大量数据。 3.试述大数据的4个基本特征。

数据量大(Volume) 据类型繁多(Variety) 处理速度快(Velocity) 价值密度低(Value) 4.试述大数据时代的“数据爆炸”特性。 大数据摩尔定律:人类社会产生的数据一直都在以每年50%的速度增长,即每两年就增加一倍。 5.科学研究经历了那四个阶段? 实验比萨斜塔实验 理论采用各种数学,几何,物理等理论,构建问题模型和解决方案。例如:牛一,牛二,牛三定律。 计算设计算法并编写相应程序输入计算机运行。 数据以数据为中心,从数据中发现问题解决问题。 6.试述大数据对思维方式的重要影响。 全样而非抽样 效率而非精确 相关而非因果 7.大数据决策与传统的基于数据仓库的决策有什么区别? 数据仓库以关系数据库为基础,在数据类型和数据量方面存在较大限制。 大数据决策面向类型繁多的,非结构化的海量数据进行决策分析。 8.举例说明大数据的具体应用。 汽车行业大数据和物联网技术无人汽车

最新2002级计算机科学与技术专业《数据库原理与应用》课程试题C

2004-2005学年第二学期期末考试C2002级计算机科学与技术专业 《数据库原理与应用》课程试题 一、选择题(15分,每空1分): 1.在数据库中,产生数据不一致的根本原因是____。 A.数据存储量太大 B.没有严格保护数据 C.未对数据进行完整性控制 D.数据冗余 2.相对于其他数据管理技术,数据库系统有①、减少数据冗余、保持数据的一致性、②和③的特点。 ①A.数据统一B.数据模块化 C.数据结构化D.数据共享 ②A数据结构化B.数据无独立性 C.数据统一管理D.数据有独立性 ③A.使用专用文件B.不使用专用文件 C.数据没有安全与完整性保障D.数据有安全与完整性保障 3.关系运算中花费时间可能最长的运算是____。 A.投影B.选择C.笛卡尔积D.除 4.关系数据库用①来表示实体之间的联系,关系的数学定义是②。 ①A.层次模型B.网状模型C.指针链D.二维表格数据 ②A.若干域(domain)的集合B.若干域的笛卡尔乘积(Cartesian product) C.若干域的笛卡尔乘积的子集D.若干元组(tuple)的集合 5.集合R与S的连接可以用关系代数的5种基本运算表示为________。 A.R-(R-S) B.σ F (R×S) C.空D.空 6.在关系代数中,对一个关系做投影操作后,新关系的元组个数____原来关系的元组个数。 A.小于B.小于或等于C.等于D.大于 7.下列SQL语句中,创建关系表的是____。 A.ALTER B.CREATE C.UPDATE D.INSERT 8.关系数据库设计中的陷阱(pitfalls)是指________。

《大数据技术原理与操作应用》第1章习题答案

第一章 单选题 1、下列选项中,最早提出“大数据”这一概念的是()。 ?A、贝恩 ?B、麦肯锡 ?C、吉拉德 ?D、杰弗逊 参考答案: B 答案解析: 暂无解析 2、下列选项中,哪一项是研究大数据最重要的意义()。 ?A、分析 ?B、统计 ?C、测试 ?D、预测 参考答案: D 答案解析: 研究大数据,最重要的意义是预测。 3、Hadoop1.0中,Hadoop内核的主要组成是()。 ?A、HDFS和MapReduce ?B、HDFS和Yarn ?C、Yarn ?D、MapReduce和Yarn 参考答案: A 答案解析: Hadoop1.0中,Hadoop内核的主要是由HDFS和MapReduce两个系统组成。 4、在HDFS中,用于保存数据的节点是()。

?B、datanode ?C、secondaryNode ?D、yarn 参考答案: B 答案解析: 暂无解析 多选题 1、下列选项中,属于Google提出的处理大数据的技术手段有()。 ?A、MapReduce ?B、MySQL ?C、BigTable ?D、GFS 参考答案: A,C,D 答案解析: Google提出了三个处理大数据的技术手段,分别是MapReduce、BigTable和G FS。 2、下列选项中,属于Hadoop优势的有()。 ?A、扩容能力强 ?B、可靠性 ?C、低效率 ?D、高容错性 参考答案: A,B,D 答案解析: Hadoop具有扩展能力强、成本低、高效率、可靠性、高容错性的优势。 3、下列选项中,属于Hadoop版本系列的有()。 ?A、Hadoop4 ?B、Hadoop2 ?C、Hadoop1

《数据库原理与应用》课后习题参考答案

《数据库原理与应用》课后习题参考答案 第一章作业参考答案 1. 单选题C C D B C 2. 判断题对错错错对 3填空题网状模型用户商业智能数据挖掘系统设计 4简答题 1)数据模型是指描述事物对象的数据组成、数据关系、数据约束的抽象结构及其说明。数据模型是指描述事物对象的数据组成、数据关系、数据约束的抽象结 构及其说明。数据模型是指描述事物对象的数据组成、数据关系、数据约束的抽象 结构及其说明。3)数据约束:用于描述数据结构中数据之间的语义联系、数据之间 的制约和依存关系,以及数据动态变化的规则。主流数据库采用关系图模型。数据 库典型数据模型:层次数据模型网状数据模型关系数据模型其它数据模型(如对 象数据模型、键值对数据模型、列式数据模型。。。) 2)数据库——是一种依照特定数据模型组织、存储和管理数据的文件,数据库文件一般存放在辅助存储器以便长久保存。数据库具有如下特点:数据不重复存 放;提供给多种应用程序访问;数据结构独立于使用它的应用程序;对数据增、 删、改、检索由统一软件进行管理和控制。 3)数据库(Database)是一种依照特定模型组织、存储和管理数据的数据结构。 在数据库中,不仅存放了数据,而且还存放了数据与数据之间的关系。数据库内部 元素:用户表:用户在数据库中创建的数据库表;系统表:数据库中系统自带的数 据库表;视图:数据库中用于对数据进行查询的虚拟表;索引:数据库中用于加快 数据查询的索引项;约束:数据库中对数据、数据关系施加的规则;存储过程:数 据库内部完成特定功能处理的程序;触发器:数据库内部因数据变化自动执行的一 类存储过程等等 4)数据库系统包括:用户、数据库应用程序、数据库管理系统和数据库四个组成要素。 5)数据库管理系统(Database Manage System,DBMS )——是一种专门用来创建数据库、管理数据库、维护数据库,并提供对数据库访问的系统软件。数据 库管理系统(DBMS)主要功能:创建数据库和表; 创建支持结构,如索引等; 读取数 据库数据; 修改数据库数据; 维护数据库结构; 执行规则; 并发控制; 提供安全性; 执行 备份和恢复等等 第二章作业参考答案 1 单选题C B D A A 2. 判断题对对错对错 3填空题全外连接数据约束候选键用户定义完整性4简答题外码键 1)在关系模型中,使用“关系”来存储“实体”中的数据。关系(relation)——是指存放实体数据的二维表。关系特征:行存储实体的个体数据;列存储所

数据库原理与技术课程习题答案

数据库原理与技术课程习题答案 第1章 一、选择题 1.下列关于用文件管理数据的说法,错误的是D A.用文件管理数据,难以提供应用程序对数据的独立性 B.当存储数据的文件名发生变化时,必须修改访问数据文件的应用程序 C.用文件存储数据的方式难以实现数据访问的安全控制 D.将相关的数据存储在一个文件中,有利于用户对数据进行分类,因此也可以加快用户操作数据的效率 2.下列说法中,不属于数据库管理系统特征的是 C A.提供了应用程序和数据的独立性 B.所有的数据作为一个整体考虑,因此是相互关联的数据的集合 C.用户访问数据时,需要知道存储数据的文件的物理信息 D.能保证数据库数据的可靠性,即使在存储数据的硬盘出现故障时,也能防止数据丢失 3.数据库管理系统是数据库系统的核心,它负责有效地组织、存储和管理数据,它位于用 户和操作系统之间,属于A A.系统软件B.工具软件 C.应用软件D.数据软件 4.数据库系统是由若干部分组成的。下列不属于数据库系统组成部分的是B A.数据库B.操作系统 C.应用程序D.数据库管理系统 5.下列关于数据库技术的描述,错误的是D A.数据库中不但需要保存数据,而且还需要保存数据之间的关联关系 B.数据库中的数据具有较小的数据冗余 C.数据库中数据存储结构的变化不会影响到应用程序 D.由于数据库是存储在磁盘上的,因此用户在访问数据库时需要知道其存储位置 二、简答题 1.试说明数据、数据库、数据库管理系统和数据库系统的概念。 答: 数据是描述事物的符号记录。描述事物的符号可以是数字,也可以是文字、图形、图像、声音、语言等,数据有多种表现形式,它们都可以经过数字化后保存在计算机中。 数据库是长期存储在计算机中的有组织的、可共享的大量数据的集合。 数据库管理系统是一个专门用于实现对数据进行管理和维护的系统软件。 数据库系统一般由数据库、数据库管理系统(及相关的实用工具)、应用程序、数据库管理员组成。 2.数据管理技术的发展主要经历了哪几个阶段? 答: 数据管理技术的发展因此也就经历了文件管理和数据库管理两个阶段。 最初对数据的管理是以文件方式进行的,也就是用户通过编写应用程序来实现对数据的存储和管理。后来产生了数据库技术,也就是用数据库来存储和管理数据。 3.文件管理方式在管理数据方面有哪些缺陷? 答: 文件方式管理数据有如下缺点。(1)编写应用程序不方便。(2)数据冗余不可避免。(3)

大数据技术原理及应用

大数据技术原理及应用 (总10页) -CAL-FENGHAI.-(YICAI)-Company One1 -CAL-本页仅作为文档封面,使用请直接删除

大数据技术原理及应用 大数据处理架构—Hadoop简介 Hadoop项目包括了很多子项目,结构如下图 Common 原名:Core,包含HDFS, MapReduce和其他公共项目,从Hadoop 版本后,HDFS和MapReduce分离出去,其余部分内容构成Hadoop Common。Common为其他子项目提供支持的常用工具,主要包括文件系统、RPC(Remote procedure call) 和串行化库。 Avro Avro是用于数据序列化的系统。它提供了丰富的数据结构类型、快速可压缩的二进制数据格式、存储持久性数据的文件集、远程调用RPC的功能和简单的动态语言集成功能。其中,代码生成器既不需要读写文件数据,也不需要使用或实现RPC协议,它只是一个可选的对静态类型语言的实现。Avro系统依赖于模式(Schema),Avro数据的读和写是在模式之下完成的。这样就可以减少写入数据的开销,提高序列化的速度并缩减其大小。 Avro 可以将数据结构或对象转化成便于存储和传输的格式,节约数据存储空间和网络传输带宽,Hadoop 的其他子项目(如HBase和Hive)的客户端和服务端之间的数据传输。 HDFS HDFS:是一个分布式文件系统,为Hadoop项目两大核心之一,是Google file system(GFS)的开源实现。由于HDFS具有高容错性(fault-tolerant)的特点,所以可以设计部署在低廉(low-cost)的硬件上。它可以通过提供高吞吐率(high throughput)来访问应用程序的数据,适合那些有着超大数据集的应

数据库原理与应用期末复习总结含试题及其答案

数据库原理综合习题答案 1.1名词解释 (1) DB:即数据库(Database),是统一管理的相关数据的集合。DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。 (2) DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。 (3) DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。 (4) 1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。 (5) 1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。 (6) M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。 (7) 数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。 (6) 概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。 (9) 结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。 (10) 层次模型:用树型结构表示实体类型及实体间联系的数据模型。 (11) 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。 (12) 关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。 (13) 概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 (14) 外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。 (15) 内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。 (16) 模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。 (17) 外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。 (18) 数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。 (19) 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。

数据库原理与技术-习题答案

数据库原理与技术-习题答 案 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

习题1 1.数据与信息有何区别有何联系 数据的概念:数字、文字、图画、声音和活动图象 信息的概念:信息是对人有用的数据 (1)数据与信息的区别: 数据包含信息 数据处理之后产生结果为信息 信息具有相对性,时效性 (2)数据与信息的联系: 信息是客观事物属性的反映。是经过加工处理并对人类客观行为产生影响的数据表现形式。数据是反映客观事物属性的记录,是信息的具体表现形式。数据经过加工处理之后,成为信息。而信息必须通过数据才能传播,才能对人类有影响。 2.简述数据库、数据库管理系统、数据库系统的概念。 (1)数据库( DataBase ,简称 DB ) :数据库是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。 (2)数据库管理系统( DataBase Management sytem ,简称 DBMs ) :数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。 DBMS 的主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。DBMS 是一个大型的复杂的软件系统,是计算机中的基础软件。目前,专门研制 DBMS 的厂商及其研制的 DBMS 产品很多。著名的有美国 IBM 公司的 DB2 关系数据库管理系统和 IMS 层次数据库管理系统、美国 Oracle 公司的 oracle 关系数据库管理系统、美国微软公司的 SQL Server关系数据库管理系统等。 (3)数据库系统( DataBaseSystem ,简称 DBS ) :数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。数据库系统是一个人一机系统,数据库是数据库系统的一个组成部分。但是在日常工作中人们常常把数据库系统简称为数据库。 3.数据管理技术经历了哪几个阶段各阶段的主要特点是什么 (1)人工管理阶段。 特点: 数据的管理者:人 数据面向的对象:某一应用程序 数据的共享程度:无共享,冗余度极大 数据的独立性:不独立,完全依赖于程序 数据的结构化:无结构

数据库原理与应用复习题

数据库原理及应用试题 一?单项选择 1. 按照所使用的数据模型来分,数据库可分为_________ 三种模型。 A ?网状,环状和层次 B ?网状,关系和链状 C ?层次,关系和网状 D ?层次,链状和网状 2. 数据库的体系结构由_______ 来组织。 A. 数据库,文件,记录 B.模式,外模式,内模式 C.物理级数据库,信息级 D.文件级,记录级,数据级 3 ? ____ 的数据独立性最高。 A ?文件系统 B ?数据库 C .手工处理 D .其他 4 .数据库中,数据的物理独立性是指______ _______ 。 A ?数据库与数据库管理系统的相互独立 B .用户程序与DBMS的相互独立 C?用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 D ?应用程序与数据库中数据的逻辑结构相互独立 5. 数据库管理系统(DBMS )是_________ 。 A. 一组硬件 B. 一组软件 C.既有硬件,也有软件 D. 一个完整的数据库应用系统 6. 数据管理方法主要有________ 。 A.文件系统与分布式系统 B.分布式系统与批处理 C.批处理与数据库系统 D.数据库系统与文件系统 7 ?对关系模型叙述错误的是_______ 。 A ?建立在严格的数学理论、集合论和谓词演算公式的基础之上 B .微机DBMS绝大部分采取关系数据模型 C ?用二维表表示关系模型是其一大特点 D ?不具有连接操作的DBMS也可以是关系数据库系统 8 .同一个关系模型的任意两个元组值_________ 。 A .不能全同 B .可全同 C ?必须全同 D ?以上都不是 9. 数据库三级模式体系的划分,有利于________ 的保持。 A.数据独立性 B.数据安全性 C.操作可行性 D.结构规范化 10. E-R图时数据库设计的工具之一,一般是用于建立数据库的____________ A.逻辑模型 B.物理模型 C.结构模型 D.概念模型 11. 在关系DB中,任何二元关系模式的最高范式必定是 A.1NF B.2NF C. 3NF D . BCNF 12 .数据库系统的核心是 _______ A.数据库 B ?数据库管理系统 C ?数据模型 D ?软件工具 13. 下列关系中,不可作为关系数据库的关系是 ______

数据库原理、技术与应用习题汇编

作业6:(数据库原理部分) 一、设某医院住院管理数据库包括病人、医生、科室、病房以及护士等5个实体集,其中“病人”包括病历号、姓名、性别、入院时间、病症等属性;“医生”包括医生工号、姓名、年龄、职称等属性;“科室”包括科室编码、名称、办公地点、科室主任等属性;“病房”包括病房号、位置、床位数等属性;“护士”包括护士工号、姓名、年龄等属性。已知医院住院管理的基本语义如下: ①一个医生对应治疗多个病人,一个病人可有多个医生治疗;②一个科室有多个医生和护士,一个医生和护士只属于一个科室;③一个病人对应一个床位号,一个护士护理多个床位,一个床位有多个护士护理。试根据上述语义完成下列各项数据库设计任务: ①设计满足上述要求的E-R图。(8分) ②将该E-R图转换成关系模式,并指出每一个关系的主码和外码。(8分) ③编写创建“医生”关系模式对应的基本表的T-SQL语句。(4分) ④假设符合1NF的医院数据库的关系模式如下所示,其基本语义为同一病人同一入院时间只有一个主治医生,试根据范式理论将该关系模式分解成符合3NF的多个关系模式。(8分)医疗(病历号,病人姓名,症状,床位号,病房编号,病房位置,床位数,医生工号,医生姓名,医生职称,科室编码,科室名称,科室地点,科室主任) 二、试设计某科技园区内用电管理系统关系数据库,已知该系统基本信息需求如下: 1)园区内有多幢建筑物(即办公楼),建筑物基本信息包括:建筑物编码、建筑物名称、建筑物楼对应的经度纬度坐标、建筑物所在地址、最低楼层、最高楼层、楼层数(计算得到)等。 2)园区内可以进驻多个企业单位(用户),企业基本信息包括企业编码、企业名称、联系人、联系电话、进驻时间等。每个企业进驻园区后,其管理总部对应园区内建筑物的某个楼层和房间号。 3)建筑物的各个楼层中安装有多个电表,电表基本信息包括:电表编码、电表名称、规格型号、供应商名称、安装位置(包括经度纬度坐标、建筑物及楼层)、电表所属的企业用户等。 4)园区物业管委会可以定期或随时采集各个电表的当前电表指示数据,存放在数据库中,同一电表同一天最多只保留一次数据采集记录。根据采集的数据和时间,系统可定期或实时计算出每个电表的实际耗电量,进而统计出每个企业的用电量。 5)为了更好节约和控制用电,每个企业单位每年都有一个分月度的用电计划。月末时,数据库应用系统可统计出每个企业的用电超标情况。 试根据上述语义,完成下列各题: 1. 设计满足上述要求的数据库E-R图。(6分) 2. 根据E-R图,转换得到各个关系模式,并指出每一个关系模式的主码和外码。(6分) 3.使用关系代数完成下列检索:(6分) ①检索“杭州信达”(企业名称)公司2014年5月10日在“科技创新楼”(建筑物名称)中的所有电表的采集数据。 ②检索哪些建筑物中安装有两个或两个以上不同单位的电表,列出这些建筑物的名称。 4)假设一个关系模式如下,试运用范式理论和方法,从第一范式开始将其逐步转换成符合3NF的关系模式。(6分) 电能管理数据库=(电表编码,电表名称,电表所在楼层,企业编码,企业名称,建筑物编码,建筑物名称,电表采集时间、电表当前指示数) 三、已知图书出版和销售管理的一个局部E—R图及其各个实体的属性如下图1所示,其语义如下: ①一本书可以由多个作者编写,一个作者可以编写多本书;

数据库原理与应用试题含答案

一、判断题 [数据库系统概论]2 (F)与用文件系统来管理数据相比,用数据库管理数据增加了数据冗余度。 (F)一个信息只能用一种数据形式来表示。 (F)数据库系统是数据库管理系统的重要组成部分。 (F)数据库的三级模式是概念模型、逻辑模型和物理模型。 (F)E-R模型只能转换为关系模型,不能转换为层次模型和网状模型。 (F)如果一个实体A对应多个实体B,则A与B之间必然是一对多的联系。 [关系型数据库基本原理]2 (F)一个关系的主键只能包含一个属性。 (F)在实体-联系模型中,实体具有属性,联系不能具有属性。 (F)关系运算中,选择运算是从列的角度进行的运算,投影运算是从行的角度进行的运算。 (F)在一个关系模式中,如果A->B,B->C,则称C部分依赖于A。 (F)E-R图转换为关系模型时,实体可转换为关系模式,联系不能转换为关系模式。 (F)E-R图转换为关系模式时,所有的联系都必须转换为独立的关系模式。 [数据库的管理]1 (F)数据库的文件包括数据文件、事务日志文件和索引文件。 (F)数据库的一个数据文件可以属于多个文件组。 (F)在SQL Server中,数据库的主数据文件的扩展名是ldf。 [表的管理]2 (F)创建一个表时,对于表的每一列,必须指明数据类型和长度,例如“生日datetime(8)”。(T)在SQL Server中,nchar数据类型与nvarchar数据类型的区别是,前者是固定长度的,后者是可变长度的。 (T)在SQL Server中,存储逻辑型数据值的数据类型是bit. (F)SQL中的数据定义语言(DDL)用于实现数据增、删、改、查等数据操作。 (F)对于逻辑型的属性,赋值是只能写“YES”或“NO”。 (T)在SQL语句中,对一个字符型的属性赋值,应该两边用单引号将值包括起来。 [数据查询]1 (F)关系型数据库的连接查询有内连接和外连接之分,内连接只能实现两个表的查询,外连接可以实现多个表的查询。 (F)在SELECT语句的WHERE子句部分,不能再使用SELECT语句。 (T)在进行分组统计时,如果需要对分组进行筛选,应使用HAVING语句而不是WHERE语句。[索引与视图]2 (F)为了提高数据库的检索和更新速度,最好在数据表的每个字段都建立索引。 (F)聚集索引一定是唯一性索引,非聚集索引一定是非唯一性索引。 (T)主键索引必然是唯一索引。 (F)视图一旦创建,就存储了数据。 (F)视图只能用来查看数据,不能在视图上进行数据更新。 (F)视图只能用来查看一个基本表的数据,相当于在一个基本表上的投影与选择。 [数据完整性]1

相关文档
相关文档 最新文档