CDA LEVELⅠ业务分析师_模拟题:
一、单选
1.北京市统计局发布2014年度全市职工平均工资为77560元,月平均工资为6463元.众多网友直呼“被平均”,你认为下面哪种统计量测度平均工资会更被信服()
A 几何平均数
B众数
C极差
D中位数
2. 某企业2000年实现利润为200万元,2005年为300万元,则年平均增长速度为()
A.5%
B.11%
C.10%
D.8.4%
3. 当一组数据属于左偏分布时,则( )
A.平均数?中位数与众数是合而为一的
B.众数在左边?平均数在右边
C.众数的数值较小?平均数的数值较大
D.众数在右边?平均数在左边
4. 作为一家制造类企业,以下哪个图适合比较不同产品各年的销售变化情况()
A .分组饼形图
B.堆叠面积图
C.堆叠柱形图
D.分组柱形图
5. 横截面数据主要注意以下哪个数据问题()
A .异方差
B.不独立
C.非正态分布
D.不随机
6. 以下叙述正确的是()
A .极差较少受异常值的影响
B.四分位差较少受异常值的影响
C.方差较少受异常值的影响
D.标准差较少受异常值的影响
7. 某汽车品牌预测到未来不同型号汽车的利润率和销售量会发生变化,希望根据利润最大化得到最优产量,这属于哪类数据分析过程()
A.预测型建模
B.预报
C.优化
D.报警
8.为研究某种减肥茶减肥效果是否显著,可以采用()分析方法。
A、单样本t检验
B、两独立样本t检验
C、两配对样本t检验
D、方差分析
9. 中心极限定理的假设不包括()
A.样本相互独立
B.样本具有相同分布
C.样本足够大
D.样本服从正态分布
10. 下列场合下,( )适合用t检验统计量
A.样本为小样本,且总体方差已知
B.样本为大样本,且总体方差已知
C.样本为小样本,且总体方差未知
D.样本为大样本,且总体方差未知
11. 方差分析表表如下,值20应填在哪个位置上()
方差来源离差平方和自由度均方差F值
组间14245.8334748.61 2.16
组内A B C
总和D23
12. 某信用卡公司为了分析客户教育程度对授信额度是否有显著性差异,已知教育程度分为5种,每个教育程度取30个客户,则因素的水平为()
A 5
B 6
C 30
D 150
13.给出下列结论:
(1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好;
(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;
(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.以上结论中,正确的有()个.
A.1
B.2
C.3
D.4
14. 下列关系中,属于正相关关系的有( )
A.合理限度内,施肥量和平均单位产量之间的关系
B.产品产量与单位产品成本之间的关系
C.商品的流通费用与销售利润之间的关系
D.流通费用率与商品销售量之间的关系
15.下列关于SQL的说法错误的是()
A SQL 对大小写不敏感
B SQL为非过程化编程语言
C 不同的数据库的SQL完全一致
D一种数据库查询和程序设计语言,用于存取数据以及查询?更新和管理关系数据库系统
16. 要查询book表中所有书名中以“中国”开头的书籍的价格,可用()语句。
(A) SELECT price FROM book WHERE book_name = ‘中国*’
(B) SELECT price FROM book WHERE book_name LIKE ‘中国*’
(C) SELECT price FROM book WHERE book_name = ‘中国%’
(D) SELECT price FROM book WHERE book_name LIKE ‘中国%’
17. 为名为“zhangsan”的用户分配对数据库“studb”的“stuinfo”表查询和插入数据权限的语句是( )
A.grant select,insert on studb.stuinfo for‘zhangsan’@’localhost’
B.grant select,insert on studb.stuinfo to ‘zhangsan’@’localhost’
C.grant‘zhangsan’@’localhost’ to select,insert for studb.stuinfo
D.grant ‘zhangsan’@’localhost’ to studb.stuinfo on select,insert
18. 对于表TA(tel,net,…),其中tel为手机号,net为订购的上网流量套餐,如50M、100M等,若未订购则为空。为了分析客户上网对客户总费用的影响情况,下列哪种对空值的处理方式最合理的?()
A 将空缺观测全部删除
B 用所有客户上网套餐的中位数来替代
C用所有客户上网套餐的众数来替代
D 单独作为一类或者填充为0
19. 以下哪种方法不属于预测性(有监督学习)模型()
A.决策树
B.线性回归
C.关联分析
D.判别分析
20. 主成分分析计算分为根据相关系数和协方差矩阵两种方式,以下哪种情况适合用协方差矩阵计算()
A.全部变量的量纲相同
B.全部变量的方差相同
C.全部变量的值域相同
D.任何变量都可以
21. 下面关于因子分析的说法正确的是()
A 因子分析就是主成分分析
B 因子之间互相关也可不相关
C 因子受量纲的影响
D 可以对因子进行旋转,使其意义更明显
22. 以下哪种聚类方法需要实现指定聚类个数()
A.层次聚类
B.K均值聚类
C.基于密度的聚类
D.基于网格的聚类
23.对快速聚类说法错误的是( )
A 占内存少?计算量小?处理速度快
B 可以样本聚类,也可以对变量聚类
C 适合大样本
D需要事先确定多少个类别
24. 关于逻辑斯回归分析(logistic regrssion modle)说法正确的是( )
A:逻辑斯回归的因变量为数值变量
B:逻辑斯回归的因变量为定性变量
C:逻辑斯回归的因变量只能有两种取值
D:逻辑斯回归自变量只能是一个
25. 通过广告费分析销售收入,丙公司的销售经理根据36个月销售收入和广告费用的关系开发了简单线性回归模型。该模型如下所示,且给模型的判定系数为0.90。
Y=20 00元+2.50 X
其中,Y代表销售收入,X代表广告费用。
如果丙公司某月的广告费用为2 00元,那么销售收入的估计值为( )
A.2550元
B. 2500元
C. 2350元
D. 500元
26. 以下哪一种方法不能用来分析时间序列数据?( )
A. 德尔菲法
B. 移动平均法
C. 最小二乘法
D. 指数平滑法
27. 根据时间序列乘法模型的原理,为了测度季节变动,需要从时间序列中()
A.减去长期趋势和循环变动
B.减去长期趋势、循环变动和不规则变动
C.除去长期趋势和循环变动
D.除去长期趋势、循环变动和不规则变动
28. 关于数据挖掘的方法论CRISP-DM说法正确的是()
A 这是SPSS公司,Daimler Chrysler提出的数据挖掘流程
B 主要分为六步,业务理解,数据理解,数据准备,模型搭建,模型评估与模型发布
C 该方法论已经成功的在SAS EM中进行了实施
D 这六个过程有严格的前后顺序,一气呵成,分析过程中不能逆转或者跳转
29. RFM方法中的F说明客户的()
A.兴趣度
B.粘性
C.当前价值
D.未来价值
30. 某汽车品牌委托某公司及时收集客户在微博上关于该品牌汽车的负面留言,这属于哪类商业智能系统()
A.常规报表
B.即席查询
C.多维分析
D.预警
31. 某公司的总会计师决定用决策模型应对不确定性问题。目前,丙公司有两种方案可供选择,与另一跨国公司联合投资或不联合投资。总会计师提供了以下信息:方案1:联合投资的结果和概率:成功概率为60%,投资成本为1 200万元,投资成功的现金流为2 000万元,投资不成功的现金流为200万元,其他成本为0元,至此时已发生的成本为1 20万元。
方案2:不联合投资的结果和概率:至此时已发生的成本为1 20万元,其他成本为500 000 元。
下列哪项分别正确地反映了联合投资与不联合投资的期望值?( )
A.800 000元和-1 700 000元
B.-700 000元和-500 000元
C. 800 000元和-500 000元
D.-700 000元和-1 700 000元
32. 某公司在进行市场调研,以决定是否推出一款新产品。调研得出的结论是:出现有利结果的概率为60%,出现不利结果的概率为40%。如果结果有利,则产品成功的概率为70%;如果结果不利,则产品失败的概率会达到75%。如果产品成功,该公司预期年利润将达到5 000 000元;如果产品失败,该公司每年将损失2 000 000元。那么,这款新产品的年利润期望值为()
A.1 500 000元
B.1 640 000元
C. 2 000 000元
D.2 650 000元
二、多选题
1. 以下哪个分布是右偏分布()
A .均匀分布
B.卡方分布
C.F分布
D.对数正态分布
2.在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示(ACE)
A 有充足的理由否定原假设
B 原假设必定是错误的
C犯错误的概率不大于a
D犯错误的概率不大于b
E 在H。成立的情况下发生了小概率事件
3. 若检验统计量F 近似等于1,说明()
A.组间方差中不包含系统因素的影响
B.组内方差中不包含系统因素的影响
C.组间方差中包含系统因素的影响
D.方差分析中不应拒绝原假设
4. 以下哪些变量使用RFM方法构造出来的()
A.最近3期境外消费金额
B.最近6期网银消费交易笔数
C.信用额度
D.距最近一次逾期的月数
5.如下表student中,如何筛选type为包含数学或语文的记录?
ID type score
A01数学78
A02语文76
A03英语90
A04数学68
A05英语84
A select * from student where type=”数学” and type=”语文”
B select * from student where type=”数学” or type=”语文”
C select * from student where type in (”数学” , ”语文”)
D select * from student where type in (”数学”?”语文”)
6. 主成分分析计算分选择相关系数计算法时,确定主成分个数的大致原则包括()
A.特征根值大于1
B.特征根值大于0.8
C.累积特征根值加总占总特征根值的80%以上
D.累积特征根值加总占总特征根值的90%以上
7. 以下哪个聚类分析的方法是利用统计学定义的距离进行度量()
A.层次聚类法
B.快速聚类法
C.基于密度的聚类法
D.基于网格的聚类法
8 . 以下关于皮尔森相关分析叙述正确的是()
A.两变量独立,两者的皮尔森相关系数必然等于0
B.两变量皮尔森相关系数不等于0,两者必然不独立
C.皮尔森相关系数是否等于零,不能指明两变量是否独立
D.两变量不独立,两者的皮尔森相关系数必然不等于0
9. 在客户关系管理中,客户的生命周期都包括那几个阶段()
A.潜在客户
B.响应客户
C.即得客户
D.流失客户
10. 天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不应该进行: ( )
A. 对变量进行标准化
B. 对变量进行百分位秩或Turkey正态性转换
C. 对变量进行因子分析或变量聚类
D. 对变量进行分箱处理