文档库

最新最全的文档下载
当前位置:文档库 > 云计算复习题

云计算复习题

一、选择题

1. 云计算是对(D)技术的发展与运用

A. 并行计算 B网格计算 C分布式计算 D三个选项都是

2. 从研究现状上看,下面不属于云计算特点的是(C)

A. 超大规模

B. 虚拟化

C.私有化

D. 高可靠性

3. 与网络计算相比,不属于云计算特征的是(B)

A.资源高度共享

B.适合紧耦合科学计算

C. 支持虚拟机

D. 适用于商业领域

4. IBM在2007年11月退出了“改进游戏规则”的(A )计算平台,为客户带来即买即用的云计算平台。

A. 蓝云

B. 蓝天

C. ARUZE

D. EC2

5. 微软于2008年10月推出云计算操作系统是(C)

A. Google App Engine

B. 蓝云

C. Azure

D. EC2

6. 2008年,(A)先后在无锡和北京建立了两个云计算中心

A. IBM

B. Google

C. Amazon

D. 微软

7. 亚马逊AWS提供的云计算服务类型是(D)

A. IaaS

B.PaaS

C.SaaS

D.三个选项都是

8. 将平台作为服务的云计算服务类型是(B)

A. IaaS

B.PaaS

C.SaaS

D.三个选项都不是

9. 将基础设施作为服务的云计算服务类型是(A)

A. IaaS

B.PaaS

C.SaaS

D.三个选项都不是

10. IaaS计算实现机制中,系统管理模块的核心功能是(A)

A. 负载均衡 B 监视节点的运行状态 C应用API D. 节点环境配置

11. 云计算体系结构的(C)负责资源管理、任务管理用户管理和安全管理等工作

A.物理资源层

B. 资源池层

C. 管理中间件层

D. SOA构建层

12. 云计算技术的层次结构中包含(ABCD)下层

A.物力资源层

B.资源池层

C.管理中间件

D.SOA构建层

13. 云计算体系结构中,最关键的两层是(BC)

A.物力资源层

B.资源池层

C.管理中间件

D.SOA构建层

14. 云计算按照服务类型大致可分为以下类(ABC)

A.IaaS

B. PaaS

C. SaaS

D.效用计算

15. 下列不属于Google云计算平台技术架构的是(D)

A. 并行数据处理MapReduce

B.分布式锁Chubby

C. 结构化数据表BigTable

D.弹性云计算EC2

16. 与开源云计算系统Hadoop HDFS相对应的商用云计算软件系统是(A)

A. Google GFS

B. Google MapReduce C .Google Bigtable D.Google Chubby

17. Google文件系统(GFS)分块默认的块大小是(B)

A. 32MB

B. 64MB

C. 128MB

D.16MB

18. Google文件系统(GFS)分成固定大小的块,每个块都有一个对应的(C)

A. 代理

B. 结点

C. 索引号

D. 计数器

19. Google文件系统(GFS)提供给应用程序的访问接口是(A)

A . 专用接口 B. 遵守POSIX规范的接口

C.网络文件系统接口

D. Web网页接口

20. 下列不属于GFS的假设和目标是(C)

A. 硬件出错正常

B. 主要负载是流数据读写

C. 数据写主要是“插入写”

D. 需要存储大尺寸的文件

21. Google文件系统(GFS)通过(B)方式提高可靠性

A.双备份B.冗余C日志D.校验码

22. Google文件系统(GFS)中每个数据块默认是在(B)个数据块服务器上冗余

A.2B.3C.4D.5

23. Google文件系统(GFS)中客户端直接从(C)角色完成数据存取

A.主服务器B.桶C数据块服务器D管理块服务器

24. 下列不属于文件系统(GFS)中主服务器节点任务的是(D)

A.存储元数据B.文件系统目录管理

C.与数据块服务器进行周期性通信

D.向客户端传输数据

25. 在主服务器节点容错中,采用日志进行容错的是(C)

A.命名空间B.Chunk与文件名的映射表

26. 在数据块服务器容错中,每个Block对应(C)Bit的校验码

A.8B.16C.32D.64

27. GFS在Google中管理着(C)级别的数据

A. TB

B. GB

C. PB

D. MB

28. 在目前GFS集群中,每个集群包含(B)个存储节点

A.几百个

B. 几千个

C.几十个

D.几十万个

29. 下列选项中,哪条不是GFS采用中心服务器模式的原因(A)

A.不易成为整个系统的瓶颈

B.可以方便增加数据块服务器

C. 不存在元数据的一致性问题

D. 方便进行负载均衡

30. 下列选项中,哪条不是GFS选择在用户态下实现的原因(D)

A.调试简单

B.不影响数据块服务器的稳定性

C. 降低实现难度,提高通用性

D. 容易扩展

31. Google文件系统将整个系统的节点分为(ABC)的角色

A.客户端

B.主服务器

C.数据块服务器

D.监测服务器

32. Google文件系统具有(ABD)特点

A.采用中心服务器模式 B不缓存数据

C.采用边缘服务器模式 D在用户态下实现

33. Google不缓存数据的原因是(ABCD )

A. OFS的文件操作大部门是流式读写;

B. 维护缓存与实际数据之间的一致性太复杂

C. 不存在大量的重复读写

D. 数据块服务器上的数据存取使用本地文件系统

34. GFS中主服务器节点存储的元数据包含这些信息(BCD)

A.文件副本的位置信息

B.命名空间

C. Chunk与文件名的映射

D. Chunk副本的位置信息

35. 单一主服务器(Master)解决性能瓶颈的方法是(ABCD)

A.减少其在数据存储中的参与程度

B. 不适用Master读取数据

C.客户端缓存元数据

D. 采用大尺寸的数据块

36. (B)是Google提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。

A. GFS

B.MapReduce

C.Chubby

D.BitTable

37. Mapreduce适用于( D)

A. 任意应用程序

B. 任意可在windows servet2008上运行的程序

C.可以串行处理的应用程序

D. 可以并行处理的应用程序

38. 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是(A )

A .一个Map函数就是对一部分原始数据进行指定的操作

B.一个Map操作就是对每个ReD.uce所产生的一部分中间结果进行合并操作

C.Map与Map 之间不是相互独立的

D. Reduce与Reduce之间不是相互独立的

39. MapReduce执行过程中,数据存储位置不是在GFS上的是(A)

A. Map处理结果

B. ReD.uce处理结果

C.日志

40. MapReduce通常把输入文件按照(C)MB来划分

A. 16 B32 C64 D128

41. 与传统的分布式程序设计相比,Mapreduce封装了( ABCD )等细节,还提供了一个简单而强大的接口。

A. 并行处理

B. 容错处理

C. 本地化计算

D. 负载均衡

BitTable分布式结构化数据表

42. (D)是Google的分布式数据存储于管理系统

A. GFS

B. MapReduce

C. Chubby

D.Bigtable

43. 下面哪条不是bigtable主服务器作用(B)

A. 为每个子表服务器分配子表,对外提供服务

B. 对bigtable表中的数据进行存储

C. 探测子表服务器的故障和管理

D. 负载均衡

44. Bigtable中时间戳是(D)位整型数。

A. 32

B. 48

C. 56

D. 64

45. Bigtable中的数据压缩形式有(B)种

A. 2

B. 3

C. 4

D. 5

46. Bigtable中行关键字的大小不能超过(D)KB

A16 B32 C48 D64

47. (D)是Bigtable中数据划分和负载均衡的基本单位

A. 行 B列 C列族 D子表

48. (C)是Bigtable中访问控制的基本单元

A. 行 B列 C列族 D子表

49. (B)是Google为Bigtable设计的内部数据存储格式

A. 行

B. SSTable C列族 D子表

50. SSTable结尾的索引保存的是(A)信息

A.SSTable中块的位置

B. SSTable的位置

C.SSTable中块的大小

D.Sstable的大小

51. 在Bigtable中,(A)主要用来存储子表数据以及一些日志文件

A. GFS

B. Chubby

C.SSTable

D.MapReduce

52. Google设计Bigtable的动机主要是(ABC)

A.需要存储的数据种类繁多

B.海量的服务请求

C. 商用数据库无法满足Google的需求

D.需要频繁的修改数据

53. Bigtable主要由(ABC)三个部分组成

A. 客户端程序库

B. 一个主服务器

C.多个子表服务器 D数据管理服务器

54. Bigtable表中的数据是通过(ABD)来进行索引的

A.行关键字 B列关键字 C子表地址 D时间戳

55. Bigtable开发团队确定了Bigtable设计所需达到的基本目标(ABCD)

A.广泛的适用性 B很强的可扩展性 C高可用性 D简单性

56. Google APP Engine使用的数据库是(C)

A. 改进的SQLServer

B. Orack

C. Date store

D. 亚马逊的SimpleDB

57. Google APP Engine目前支持的编程语言有( AD )

A. Python语言

B. C++语言

C. 汇编语言

D. JAVA语言

58. 下列不属于亚马逊及其映像(AMI)类型的是(C)

A.公共AMI

B.私有AMI

C.通用AMI

D.共享AMI

59. 亚马逊AWS采用( A )虚拟化技术

A. 未使用

B. Hyper-V

C. Vmware

D. Xen

60. 亚马逊将区域分为(AC)

A地理区域 B不可用区域 C可用区域 D隔离区域

61. 下面选项属于Amazon提供的云计算服务是(ABC)

A.弹性云计算EC2 B简单存储服务S3

C简单队列服务SQS http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.html服务

62. 在使用弹性计算云EC2服务时,第一步要做的是(A)

A.创建或选用AMI

B.运行实例

C.选择区域

D.建立对象

63. 不属于弹性计算云EC2包含的IP地址的是(C)

A. 公共IP地址

B. 私有IP地址

C.隧道IP地址

D. 弹性IP地址

64. 在EC2中用户最多可以拥有(B)个实例

A、10

B、20

C、30

D、40

65. 在EC2 服务中,每个实例自身携带(A)个存储模块

A.1

B.2

C. 3

D.4

66. 在EC2服务的通信机制中,每个账户限制由(B)个弹性IP.

A. 4

B. 5

C. 6

D. 7

67. 在EC2的安全与容错机制中,一个用户目前最多可以创建(B)安全组。

A. 50

B. 100

C. 150

D. 200

68. EC2定义了CPU的计算单元ECU,下列资源中使用一个计算单元的是(B)

http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.htmlrge

B.Small

C. http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.htmlrge

D. High-CPUMeD.ium

69. 每个弹性存储EBS最多可以创建(B)个卷

A. 10

B. 20

C. 30

D. 40

70. 下列选项属于弹性块存储EBS功能的是(A)

A. 快照 B0负载均衡 C. 队列 D.映像

71. EC2常用的API包含下列哪些类型的操作(ABCD)

A.AMI

B. 安全组 C实例 D弹性IP地址

72. S3的基本存储单元是(B)

A.服务

B.对象

C.卷

D. 组

73. 下列操作类型不属于S3API范畴的是(C)

A. 创建桶

B. 读取对象

C.运行实例

D.设置访问控制策略

74. 桶是S3用于存储对象的容器,每个用户最多可以创建(D)个桶

A10 B50 C80 D100

75. 与SDB相比较,下列选项属于S3范畴的是(B)

A.支持数据查找、删除等操作

B. 专为大型、非结构化的数据块设计

C. 为复杂的数据建立

D. 为结构化的数据建立

76. S3采用的专门安全措施是(AB)

A.身份认证

B.访问控制列表

C防火墙 D防木马病毒技术

77. S3中对象有下面的(ABCD)组成

A.键 B数据 C元数据 D访问控制

78. 与关系数据库比较,下列选项属于SDB特性的是(ACD)

A.无需预定义模式

B.具有事物的概念

C.支持自动索引

D. 单个属性允许有多个值

79. SDB不能完成的操作有(ABCD)

A.没有事物的概念 B不支持连接操作

C实际存储的数据类型过于单一

D查询结果只包含条目名称而不包含相应属性值,且返回结果不支持排序操作

80. 简单队列服务SQS中采用的是(A)队列方式

A.先进先出模式 B堆栈模式 C.权重模式 D.后进先出模式

81. SQS由三个基本部分组成(ABC)

A.系统组件 B队列 C消息

82. SQS常用的API有(ABCD)

A队列管理 B消息管理 C访问控制 D可见性设置

83. 在云计算系统中,提供“云端”服务模式是(D)公司的云计算服务平台。

A. IBM

B. GOOGLE

C. Amaxon

D. 微软

84. 下面关于Live服务的描述不正确的是(C )

A. LIVE框架的核心组件是live操作系统;

B. 开发者可以使用基于浏览器的live服务开发者入口创建和管理应用程序所需的live服务;

C. Live操作环境不可以运行在桌面操作系统上。

D. Live操作环境既可以运行在云端,也可以运行在网络中的任何操作系统上。

85. 下列四种云计算方案中,服务间的耦合度最高的是()

A. 亚马逊AWS

B. 微软AZURE

C. Google APP Engine

D. IBM的“蓝云”

86. 云格可以完成的服务有(ACD)

A. 数据处理服务

B. 格处理服务

C. 高性能计算服务

D. 协作服务

87.云计算的特点?( ABCDE )

A.大规模 B. 平滑扩展C.资源共享 D. 动态分配 E. 跨地域

88.目前,选用开源的虚拟化产品组建虚拟化平台,构建基于硬件的虚拟化层,可以选用(BCD)

A .Xen B.VMware C. Hyper-v D. Citrix

89.在云计算中,虚拟层主要包括(ABC)

A.服务器虚拟化

B.存储虚拟化

C.网络虚拟化

D.桌面虚拟化

90.下列哪个选项能正确地在Hive中返回“查询年龄在18到25岁之间的用户返回的前5页”

的结果(A)

A.

SELECT p.url, COUNT(1) as clicks

FROM users u JOIN page_views p ON (http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.html = http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.htmler) WHERE u.age >= 18 AND u.age <= 25 GRO UP BY p.url ORDER BY clicks LIMIT 5;

B.

SELECT p.url, COUNT(1) as clicks FROM users u JOIN page_views p WHERE u.age >= 18 AND u.age <= 25 GROUP BY p.url ORDER BY clicks LIMIT 5;

C.

SELECT p.url, COUNT(1) as clicks

FROM page_views p ON (http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.html = http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.htmler) ORDER BY clicks LIMIT 5;

D.

SELECT p.url, COUNT(1) as clicks

FROM users u JOIN page_views p ON (http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.html = http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.htmler) WHERE u.age >= 18 AND u.age <= 25 GRO UP BY p.url ORDER BY clicks;

二、填空题

1. 云计算是以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片"云"成为每一个网民的数据中心和计算中心。

2. 对提供者而言,云计算可以三种部署模式,即共有云、私有云和混合云。

3. 当前,几乎所有的知名IT 提供商、互联网提供商,甚至电信运营商都在向云计算进军,都在提供相关的云服务。但归纳起来,当前云提供者可以分为三大类,即 SaaS提供商、 PaaS 和 IaaS 提供商。

4.云时代宝德科技在其中扮演的角色是公有云提供商、云基础设备提供商和私有云解决方案提供商。

5. 云计算(Cloud Computing):一种利用大规模低成本运算单元通过IP网络连接,以提供各种计算和存储服务的IT技术。

三、简答题

1、当数据量非常大超过单个机器的存储能力时需要将数据存储在不同的机器上,这时就需要分布式文件系统来管理这些数据,请回答关于分布式文件系统的下列问题:

(1).在设计分布式文件系统时需要注意哪些方面?

(2).原先存储超大文件的分布式文件系统现用来存储大规模小文件,如何对文件系统进行调整使其针对现在文件的特点发挥更好的性能?

(3).分布式文件系统保证数据不被丢失通常存在多个副本并存储在不同的机器上,当用户对数据进行修改时系统存在两种方案:完成一个副本的修改并给用户响应,之后待系统空闲时完成其它副本的修改;完成所有副本的修改之后给用户响应。请说明两种方案的优劣,并做出你的选择并说明选择原因(或者你有更好的方案?)。

2、在社会计算和移动计算迅猛发展的潮流下涌现了许多著名的互联网公司,假设你和你的朋友也准备加入创业大潮中,建立自己的企业。现假设你们公司的主要业务是移动设备的互联网信息搜索和挖掘,如使用手机拍下某图书封面就可以得到各个图书网站关于该书的价格及其对图书的评价,拍下某个人的头像可以得到这个人在社交网站的主页以及微博等相关信

息,当然你们已经设计了比较好的图形匹配算法及搜索算法,并计划使用云计算来进行处理,根据以上背景回答下面问题:

1).你们公司需要构建数据中心现在由你来负责,根据新一代数据中心的需求请说说你在构建数据中心的时候需要注意哪些?

2).在数据中心中使用虚拟化技术是必须的,请说说如何部署、管理虚拟化解决方案?你又如何使用商业公司的现有虚拟化产品?

3).受经济危机的影响以及公司盈利能力的不确定性,风险投资公司决定减少对你们公司的投资。现在构建数据中心已经不可能了,你需要将业务创建在云计算平台上

a). 与建立自己的数据中心相比,使用商业公司的云计算平台有什么优点和缺点?

b). 云构架的基本层次有哪些?并给出给出各个层次的实例。谈谈你如何在云计算平台上部署公司业务?

c). 谈谈你对云计算发展的看法。

(注:题中商业公司包括课堂上介绍的IBM、Amazon、Google、http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.html、Microsoft 以及其它现实存在的涉及虚拟化、云计算业务的公司)

3、举例描述*aaS的概念。

云计算按照其提供的“产品”或者是用户获得资源的类型,大致可以分为一些几种类别: 1)IaaS,全称Infrastructure as a Service,基础设施即服务。将多台服务器组成的“云端”计算资源和存储,作为计量服务提供给用户。它将内存、I/O、存储和计算能力整合成一个虚拟的资源池向业界用户提供存储资源和虚拟化服务器等服务。如Amazon EC2/S3。

2)PaaS,全称Platform as a Service,平台即服务,把服务器平台或者开发环境作为一种服务提供的商业模式,以SaaS的模式提交给用户。用户在服务提供商的基础架构上开发程序并通过网络传送给其他用户(最终用户)。如http://www.wendangku.net/doc/c6ae64b7941ea76e58fa04a3.html,Google App Engine,Microsoft Windows Azure。

3)SaaS,全称Software as a Service,软件即服务,是基于互联网提供软件服务的软件应用模式。将应用软件统一部署于服务器(集群),通过网络向用户提供软件。用户根据实际需求定制或者租用应用软件。消除了企业或者机构购买、构建和维护基础设施和应用程序的投入。如Saleforce online CRM。

4)DaaS,全称Data as a Service,数据即服务,是继SaaS,PaaS之后又一个新的服务概念。5)MaaS,全称M2M as a Service,M2M即服务,M2M是将数据从一台终端传送到另一台终端,也就是就是机器与机器(Machine to Machine)的对话,是物联网四大支撑技术之一。6)TaaS,全称everyTHING As A Service,虚拟化云计算技术,SOA等技术的结合实现物联网的泛在即服务。

4、写出MapReduce 分布式编程环境中的Map/Reduce原理,用基本概念、关键词排序的图描述思路。

MapReduce 通过“Map(映射)”和“Reduce(化简)”这样两个简单的概念来构成运算基本单元,用户只需提供自己的Map函数以及Reduce函数即可并行处理海量数据。MapReduce 实现了Map和Reduce两个功能:

1)Map把一个函数应用于集合中的所有成员,然后返回一个基于这个处理的结果集;

2)Reduce对结果集进行分类和归纳;

Map()和 Reduce() 两个函数可能会并行运行,即使不是在同一的系统的同一时刻。 MapReduce的编程方式:

map程序从输入文件中读取"records"的集合,执行任何需要的过滤或者转换,并且以(key,data)的形式输出records的集合。当map程序产生输出记录,"split"函数对每一个输出的记录的

key应用一个函数,将records分割为M个不连续的块(buckets)。这个split函数有可能是一个hash函数,而其他确定的函数也是可用的。当一个块被写满后,将被写道磁盘上。然后map程序终止,输出M个文件,每一个代表一个块(bucket)。

排序程序处理10的10次方个100个字节组成的记录。这个程序的Map函数从文本行中解析出10个字节的key值作为排序的key,并且把这个key和原始文本行作为中间的key/value pair值输出。我们使用了一个内置的恒等函数作为Reduce操作函数。这个函数把中间的key/value pair值不作任何改变输出。最终排序结果输出到两路复制的GFS文件系统。

5、简述Azure/VMware云的对比与不同,描述四点以上(优缺点)。

1)Windows Azure基于一个灵活且易于管理的基础设施为用户提供服务,即IaaS,与此同时还可以提供一系列基础设施服务平台即服务和软件即服务解决方案。而VMware目前则主要只提供基础设施即服务IaaS。

2)Windows Azure提供了从硬件到应用程序的全面集成监控和管理,而VMware都没有包含对应用程序的全面监控和管理。

3)Windows Azure提供了简便灵活的云端解决方案,有丰富的价值和多样化的选择,能够以更少的成本、人力轻松实现云部署,而VMware使用了大量的组件来创建自己的云解决方案,其中一些更是只限VMware最昂贵许可等级才能使用,另外一些组件需要单独的许可以及额外的费用。

4)Windows Azure提供了一整套免费的云端基础设施工具,为客户带来更好成效的简便方法,而VMware没有提供类似的工具。

6、举一个例子描述paas云产品(不可以是GAE),总结五点做技术描述。

云计算复习题

7、假设应用(企业软件)如何通过云计算转化成服务,如webservice服务进行改造?安全和

隐私问题如何兼顾?

保证访问安全有如下一些做法:

访问应用的授权与签名。客户端系统或应用接入云服务前,必须经过云服务商的认证。认证结果以授权码方式交给客户方。以后的每次访问,客户方都需要出示授权码,或请求使用授权码进行签名。系统返回的结果也同样由系统证书进行签名,以达到通信双方的互信。

时间戳方式。对于异步系统,使用时间戳及唯一的客户端ID作为请求的序列号,系统返回时同样使用相同的方式构造序列号以进行适配。

幂等检查。通过客户端生成唯一的序列号,服务端可以检测客户端命令是否重复发送,如有重复将直接抛弃。幂等检查可以保证所有服务请求都是一次性且唯一的,即使被恶意截获并通过网络设备重播,也不会执行。

通过安全白名单进行控制。通过白名单制度,系统保证只有经过安全认证的客户端能够接入,通常可以通过认证证书实现,这是最严格的访问限制。

8、通过云计算做数据中心DC(data-center)的关键问题是什么?怎么解决?

1)提示:

数据中心的选址标准:

1、大量的廉价电力;

2、绿色能源,更注重可再生能源;

3、靠近河流或湖泊;(设备冷却需要大量水源)

4、用地广阔;(隐秘性和安全性)

5、和其他数据中心的距离;(数据中心之间的快速链接)

6、税收优惠。

2)云计算datacenter:一个数据中心(或数据中心或数据中心或数据中心)是一个设施用于内部计算机系统和相关的部件,如电信和存储系统。它一般包括冗余或备份电源,冗余数据通信连接,环境控制(例如,空调,消防)和安全设备。

1)经营和管理运营的电信网络

2)提供数据中心应用程序直接向承运人的客户

3)提供托管应用三分之一方提供其客户服务

4)提供一个组合这些和类似的数据中心的应用。

9、GFS经典结构描述。

GFS的架构:一个GFS集群包含一个单独的Master节点、多台Chunk服务器,并且同时被多个客户端访问,如图所示 GFS的工作过程:

1)客户端使用固定大小的块将应用程序指定的文件名和字节偏移转换成文件的一个块索引,向master(主)发送包含文件名和块索引的请求;

2).master收到客户端发来的请求,master向块服务器发出指示,同时时刻监控众多chunkserver的状态。Chunkserver缓存master从客户端收到的文件名和块索引等信息。

3)master通过和chunkserver的交互,向客户端发送chunk-handle和副本位置。其中文件被分成若干个块,而每个块都是由一个不变的,全局唯一的64位的chunk-handle标识。Handle 是由master在块创建时分配的。而出于安全性考虑,每一个文件块都要被复制到多个chunkserver上,一般默认3个副本;

4)客户端向其中的一个副本发出请求,请求指定了chunk handle(chunkserver以chunk handle 标识chunk)和块内的一个字节区间。 5.客户端从chunkserver获得块数据,任务完成。

通常Client可以在一个请求中询问多个chunk的地址,而master也可以很快回应这些请求。

10、HDFS结构描述。

11、hadoop结构描述