2020年最新公需科目《大数据》考试题(含答案)
一、填空题
1.Hadp三种运行的模式.单机版 . 伪分布式和分布式。
二、单选题
2.下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题)
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
三、多选题
3.在网络爬虫的爬行策略中,应用最为基础的是(AB )。
A.深度优先遍历策略
B.广度优先遍历策略
C.高度优先遍历策略
D.反向链接策略
E.大站优先策略
4.Web2.0强调(C)。
A.机构
B.单位
C.个人
D.网站
5.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。√
正确
错误
6.()说明如果联网越多,从介入方式.技术上越来越突破,则网络规模越大.成本越低,网络的成本可能会趋向于零。
A.梅特卡尔夫定律
B.摩尔定律
C.吉尔德定律
D.新摩尔定律
7.大数据时代的五个无处不在,具体指的是().服务无处不在。
A.网络无处不在
B.计算无处不在
C.大数据无处不在
D.软件无处不在
8.运用大数据进行大治理要做到()。ABCD分
A.用数据决策
B.用数据管理
C.用数据说话
D.用数据创新
9.“最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?
A.牛顿定律
B.麦特卡尔夫定律
C.摩尔定律
■D.吉尔德定律
10.农业部发布的《关于推进农业农村大数据发展的实施意见》提出,到2020年底前,实现农业农村历史资料的数据化.()。ACD分
A.数据采集的自动化
B.数据分发的定期化
C.数据使用的智能化
D.数据共享的便捷化
11.根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。D
A.90%
B.70%
C.30%
D.50%
12.在保护个人隐私方面,吴军博士并没有提到以下哪种方法?C
A.法律的方法
B.技术的方法
C.文化的方法
D.双向监督的方法
13.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。
■A.分布式
B.密闭式
C.密集式
■D.共享式
14.以下选项中,不属于大数据对人才能力的要求是
A.业务能力
B.数学统计能力
C.IT 技术能力
■D.逻辑思维能力
15.医疗领域如何利用大数据?ABCD
A.临床决策支持
B.个性化医疗
C.社保资金安全
D.用户行为分析
16.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。×
正确
错误
四、简答题
17.请简要说明Hadp YARN的一级调度管理与二级调度管理?
答.YARN作为分布式集群资源管理框架,可用于集群资源的管理以及应用的调度。YARN 的一级调度管理包括计算资源管理和Applicatin生命周期的管理;二级调度管理包括Applicatin内部计算模型的管理以及多样化计算模型的管理。
五、论述题
18.第一个提出大数据概念的公司是d
A.谷歌公司
B.微软公司
C.脸谱公司
D.麦肯锡公司
19.IBM公司用3个V来描述大数据的三个基本特征,这3V是(ACD)
A.体量B。规模C。速度D。多样性E。复杂性
20.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)
A。数据规模大 B。数据类型多样 C。数据处理速度快D。数据价值密度高
21.宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。√分
正确错误
22.宁家骏委员指出,我国民生领域信息化服务水平显著提升。
分.1分
正确1
错误得
23.2015年,阿里平台完成农产品销售达到6000多亿元。分
正确
错误1
24.宁家骏委员指出,我国民生领域信息化服务水平显著提升。分.1分
正确1错误
25.在新加坡政府发展大数据行动中,政府侧重于做好数据分析和服务,不承担数据提供服务。(F )是否
26.当前社会中,最为突出的大数据环境是(A )。
A.互联网
B.物联网
C.综合国力
D.自然资源
27.请画出云计算的三层服务模型?
答.一般而言,云计算架构可以用三层SPI模型来表述。
1.基础设施即服务(IaaS,Infrastructrue as a Service)
这种把主机集中管理,以市场机制通过虚拟化层对外提供服务,用按使用量收费的盈利模式,形成了云计算的基础层。这就是基础设施即服务(IaaS,Infrastructrue as a Service),构成了云计算的基础层。
2.平台即服务(PaaS,Platfrm as a Service)
平台即服务(PaaS)是指把一个完整的应用程序运行平台作为一种服务提供给客户。在这种服务模式中,客户不需要购买底层硬件和平台软件,只需要利用PaaS平台,就能够创建.测试和部署应用程序。
3.软件即服务(SaaS,Sftware as a Service)
在其概念可以这样来定义.把软件部署为托管服务,用户不需要购买软件,可以通过网络访问所需要的服务,或者把各种服务综合成自己的需要,而客户按照使用量付费。SaaS的出现彻底颠覆了传统软件的运营模式。它不仅仅从价格上,交付模式上,实施风险上带来了明显改观。在云计算上,SaaS有了更好的发展空间。而云计算的推出,给SaaS提供了更好的生态环境。这就形成了云计算的第三层.软件即服务(SaaS,Sftware as a Service)。
这三个层结合起来,就形成了典型的云计算的SPI模型。可以预期,在这个模型上,大量的创新企业可以获得更好的生存空间。
28.下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。答案选C更正(多选题,本题3
分)
A.传统营销模式比基于大数据的营销模式投入更小
B.传统营销模式比基于大数据的营销模式针对性更强
C.传统营销模式比基于大数据的营销模式转化率低
D.基于大数据的营销模式比传统营销模式实时性更强
E.基于大数据的营销模式比传统营销模式精准性更强
29.PKI指的是公钥基础设施。√分
正确
错误
30.在数据生命周期管理实践中,( B)是执行方法。
A.数据存储和备份规范
B.数据管理和维护
C.数据价值发觉和利用
D.数据应用开发和管理
31.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。
正确√错误
32.下列关于计算机存储容量单位的说法中,错误的是( C)。
A.1KB<1MB<1GB
B.基本单位是字节(Byte)
C.一个汉字需要一个字节的存储空间
D.一个字节能够容纳一个英文字符,
33.支撑大数据业务的基础是( B)。
A.数据科学
B.数据应用
C.数据硬件
D.数据人才
34.在没有大数据的条件下,人才的发现与选拔都很难做到“全信息”,大数据能够帮助人们解决这个问题。√分
正确错误
35.当前大数据技术的基础是由( C)首先提出的。
A.微软
B.百度
C.谷歌
D.阿里巴巴
36.数据资产型企业产品线的盈利,主要通过提供收费服务来获取(F)是否
37.下列关于大数据的说法中,错误的是(AD )。
A.大数据具有体量大.结构单一.时效性强的特征
B.处理大数据需采用新型计算架构和智能算法等新技术
C.大数据的应用注重相关分析而不是因果分析
D.大数据的应用注重因果分析而不是相关分析
E.大数据的目的在于发现新的知识与洞察并进行科学决策
38.按照涉及自变量的多少,可以将回归分析分为(CD )。
A.线性回归分析
B.非线性回归分析
C.一元回归分析
D.多元回归分析
E.综合回归分析
39.“(A)大数据交易所”2015年4月14日正式运营,目前,交易所已有包括京东.华为.阿里巴巴等超过300家会员企业,交易总金额突破6000万元。(单选题1分)
A.贵阳
B.遵义
C.毕节
D.安顺
40.2009年,甲型H1N1流感在全球爆发,谷歌(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了()。(单选题1分)
A.77%
B.97%√
C.67%
D.87%
41.小型计算机网络时代是信息技术发展的第二阶段。√分
正确
错误
42.逻辑域构建了协议.软件.数据等组成的信息活动域√分
正确
错误
43.大数据的核心是洞察,洞察有以下哪些特色?(多选题3分)分
A.洞察工作重点√
B.洞察调度奥妙√
C.洞察管理规律√
D.洞察未来趋势√
44.关于大数据在社会综合治理中的作用,以下理解不正确的是(c )。
A.大数据的运用能够维护社会治安
B.大数据的运用能够加强交通管理
C.大数据的运用能够杜绝抗生素的滥用
D.大数据的运用有利于走群众路线
45.“最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?d
A.牛顿定律
B.麦特卡尔夫定律
C.摩尔定律
D.吉尔德定律
46.贵州发展大数据的顶层设计是要逐步建成三个中心,即(acd)。(多选题3分)得分.0分
A.大数据人才中心
B.大数据金融中心
C.大数据内容中心
D.大数据服务中心
47.下列各项表述中正确的有哪些?ad(多选题3分)得分.0分
A.我国中央网络安全和信息化领导小组宣告成立是在2013年。
B.中央网络安全和信息化领导小组组长是习近平。
C.我国中央网络安全和信息化领导小组宣告成立是在2014年。
D.中央网络安全和信息化领导小组组长是李克强;
48.依据黑龙江大农场的应用,精准农业技术能够将产量提高5%-10%。
得分.0分
正确1 错误
49.韩国政府利用位置信息和通话记录数据,规划出合理的公交线路,提升了政府科学决策和公共服务水平,提高了公众满意度。
正确√
错误
50.下列关于聚类挖掘技术的说法中,错误的是(B )。
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理