文档库 最新最全的文档下载
当前位置:文档库 › 16pf各维度得分解释

16pf各维度得分解释

16pf各维度得分解释
16pf各维度得分解释

T分8分及8分以上为高分,3分及3分以下为低分

1.乐群性(A)得分:

您在乐群性维度上得分较高。高乐群性表现为外向、热情、乐群、和蔼可亲,善于与人打交道和处理人际关系,与人相处、合作的能力强,善于与陌生人接触,适应环境的能力较强。喜欢和别人共同工作、参加或组织各种社会活动,很少为小事斤斤计较,容易接受别人的批评意见和建议。

您在乐群性维度上得分居中。乐群性居中表现为不回避正常的社会交往,待人保持一般性的热情,能够与人保持交谈,但是不会特别主动的与陌生人攀谈,也一般不会主动地组织或者热切地盼望参加社交活动。同时被测试者也会比较喜欢独处,希望能够有自己独立思考的空间;愿意与人合作,也不惧怕自己独立完成工作。在做事情的时候,能够做到严于律己,宽于律人,愿意听取他人的意见,也能一定程度上坚持自己的意见。

您在乐群性维度上得分较低。低乐群性表现为缄默、孤独、冷漠。宁愿独自工作对事而不对人,不轻易放弃自己的主见。为人做事的标准常常很高,谨严而不苟且。

2.聪慧性(B)得分:

您在聪慧性维度上得分较高。高聪慧性表现为:聪明,富有才识,善于抽象思考,学习能力强,思考敏捷正确。教育文化水平高,个人心身状态健康,机警者这个项目多高分,反映心智机能的正常。

您在聪慧性维度上得分居中。您的聪慧水平属于平均程度,思维能力一般。在平常的生活中,被测试者学习能力一般,思维具有一定的灵活性,基本上能够顺利理解和解决遇到的一般性问题,从而较好地适应于学习、工作和生活;但是可能不会给人以聪明伶俐、思维敏捷的印象。

您在聪慧性维度上得分较低。低聪慧性表现为:思想迟钝、学识浅薄,抽象思考能力弱。低者通常学习能力与理解能力不强,不能“举一隅而以三隅反”。迟钝的原因可能由于情绪不稳定,心理病态或失常所致。

3.稳定性(C)得分:

您在稳定性维度上得分较高。高稳定性表现为:情绪稳定而成熟,能面对现实,行动充满魄力,能以沉着的态度应付现实中的各种问题。

您在稳定性维度上得分居中。稳定性居中表现为:您的情绪稳定性中等。在面对一般性生活事件和程度较低的挑战时,能够保持平静和稳定的情绪,不易烦恼、忧愁和紧张,能够很好地控制自己的情绪;但是在面对比较大的挑战和压力时,则可能会受到外在事件的支配而使自身的情绪变得起伏不定,患得患失,无法理智的面对现实和处理问题。

您在稳定性维度上得分较低。低稳定性表现为:情绪激动,易生烦恼,低者通常不能以“逆来顺受”的态度应付生活上所遭遇的阻挠和挫折。容易受环境的支配,而心神动遥不定。不能面对现实而时时会急躁不安,心身疲乏,甚至于有失眠、噩梦、恐怖等现象。所有神经病和精神病人都在此维度上得分很低。

4.恃强性(E)得分:

您在恃强性维度上得分较高。高恃强性表现为:好强固执,独立积极。高分者通常自视甚高,容易自以为是,较为武断,反抗权势,希望将自己的观点强加给他人,或领导和影响他人。一般地,领袖以及有地位有成就的人多高E,救火队员和航空飞行员的因素E高,男人较女人高。

您在恃强性维度上得分居中。恃强性居中表现为:支配性处于一般水平。通常不会将自己的观点和看法强加于人,也不会希望通过控制他人来让他人执行自己的决策;同时,对问题也会有自己的看法,不会轻易听任于他人的摆布,也不会强硬的坚持自己的看法。因而能够以一种沟通和合作的态度来对待自己的上级和下级。

您在恃强性维度上得分较低。低恃强性表现为:谦逊、顺从、通融、恭顺。低者通常行为温顺,迎合别人的意旨,也可能因为希求可遇而不可求,即使处在十全十美的境地,而有“事事不如人”之感。

5.兴奋性(F)得分:

您在兴奋性维度上得分较高。高兴奋性表现为:轻松兴奋,随遇而安,高分者通常活泼、愉快、健谈。对人对事,热心而富有感情。但有时也可能过分冲动,以致行为变幻莫测。

您在兴奋性维度上得分居中。兴奋性居中表现为:兴奋性和活跃程度中等。通常不会特别地活跃,因而在社交场合中不会滔滔不绝,热情奔放;但也不会特别地拘谨不安,不会让人感到难以接触;被测试者对待工作和生活中的事情,会比较认真负责,但对于需要持久的细心和耐心的工作也会感到枯燥。

您在兴奋性维度上得分较低。低兴奋性表现为:严谨、审慎、冷静、寡言。低者通常行动拘谨,内省而不轻易发言与较消极阴郁。有时可能过分熟虑,又近乎骄傲自满,对工作职责往往表现得认真而可靠。

6.有恒性(G)得分:

您在有恒性维度上得分较高。高有恒性表现为:有恒负责,做事尽职。责任心强,工作细心周到,有始有终。是否善恶是他的行为指针,所结交的朋友多系努力苦干的人,不十分欣赏诙谐有趣的场合。

您在有恒性维度上得分居中。有恒性居中表现为:有自己的目标和理想,虽然不是特别远大,但会持续地去追求。一般情况下,遵纪守法,对人对事都会负起自己的责任。

您在有恒性维度上得分较低。低有恒性表现为:责任性较差。不喜欢遵从各种规则、规范和道德准则。通常苟且敷衍,缺乏奉公守法的精神。缺乏高尚的目标和理想,对于人群社会没有责任感,有时甚至不惜知法犯法,不择手段以达到某一目的。因此,虽然常能有效的解决实际问题,但可能会因此而损害到他人的利益。

7.敢为性(H)得分:

您在敢为性维度上得分较高。高敢为性表现为:冒险敢为,少有顾忌。通常不掩饰,不畏缩,有敢做敢为的精神,能经历艰难辛苦而保持有刚毅的毅力。有时可能太粗心大意,忽视细节,遭受无谓的打击与挫折。做事具有强烈的积极性和主动性。

您在敢为性维度上得分居中。敢为性居中表现为:在陌生的或者压力比较大的社会交往情境中,通常比较胆小,退缩,容易害羞和窘迫,较少主动地和陌生人交流;但是在自己比较熟悉的情境中,则能够很自然地与人进行沟通和交流,也会在一定程度上主动采取行动来表现自己。

您在敢为性维度上得分较低。低敢为性表现为:畏怯退缩缺乏自信心。低者通常在人群中羞怯,有不自然的姿态,有强烈的自卑感,拒不发言,更不愿和陌生人交谈。凡事采取观望的态度。有时由于过份的自我意识而忽视了社会环境中的重要事物与活动。

8.敏感性(I)得分:

您在敏感性维度上得分较高。高敏感性表现为:对周围事物敏感,容易感情用事,易受周围的人和事的感动,这类性格的人通常倾向于女性化,有一定的艺术天赋,喜欢幻想,有时想法甚至不切合实际,缺乏耐性与恒心,不喜欢接近粗俗的人,不愿意从事繁重的工作。在团体活动中,由于这类性格的人有一些不着实际的想法和行为,因此可能会影响团体的工作效率。

您在敏感性维度上得分居中。敏感性居中表现为:在待人接物的过程中,通常能够兼顾感性和理性,在关注事情客观进展的同时也可以看到其中的感性成分,从而在理智逻辑与感情之间寻得自己的平衡。在日常生活当中会注意到事物的实用性,也可以欣赏其艺术性因素。

您在敏感性维度上得分较低。低敏感性表现为:理智的,着重现实,自持其力。低者常多以客观、坚强、独立的态度处理当前的问题。并不重视文化修养,以及一些主观和感情用事的看法,可能过分骄傲,冷酷无情。

9.怀疑性(L)得分:

您在怀疑性维度上得分较高。高怀疑性表现为:怀疑、刚愎、固执己见。多疑,不信任别人,与人相处斤斤计较,不顾别人的利益。

您在怀疑性维度上得分居中。怀疑性居中表现为:一般情况下,倾向于认为他人是真诚、值得信任的,但对有些人或事也会保持警惕,但当完全了解他人之后,会乐于接受和信任他们。

您在怀疑性维度上得分较低。低怀疑性表现为:信赖随和,为人宽容,易于相信他人而很少有猜忌的念头,也不愿与人角逐竞争。通常易与人相处,顺应合作,善于体贴人,同时也希望得到公平的待遇和他人的信赖。但是,对于极低分者,由于从不猜忌他人行为的意图,有可能被他人利用。

10.幻想性(M)得分:

您在幻想性维度上得分较高。高幻想性表现为:幻想的,放荡不羁。通常忽视生活的细节,只以本身的动机,当时的兴趣等主观因素为行为的出发点。可能富有创造力,有时也过分不务实际,近乎冲动。因而容易被人误解及奚落。

您在幻想性维度上得分居中。幻想性居中表现为:通常能够既关注现实的环境和事实,同时也不乏想象力,进而在关注外界环境因素与关注内在思维过程两者之间寻求一个平衡。在解决问题时即能关注事物的事实和细节,又会从更广阔的思路去思考。被测试者不会让人觉得缺乏想象力,也不会给人留下过分冲动,不切实际的印象。

您在幻想性维度上得分较低。低幻想性表现为:现实,合乎成规,力求妥善合理。低者通常先要斟酌现实条件,而后决定取舍;不鲁莽从事。在紧要关键时,也能保持镇静,有时可能过分重视现实,为人索然寡趣。

11.世故性(N)得分:

您在世故性维度上得分较高。高世故性表现为:精明能干、为人处事世故圆滑。高世故性者通常处世老练,言谈举止得体。遇事能冷静的分析与思考,并做出得当地处理。对于事物的观察和处理十分理智、客观,很少受感性因素的影响。

您在世故性维度上得分居中。世故性居中表现为:通常愿意较为公开地展现真实的自我,平等程度跟他人交换有关个人的信息和观点,但是会考虑到现实情况,不会口无遮拦,或者过分直言不讳而让他人感到尴尬和不满。能够保持自己言行的得体,不会让人感到过分直白、轻率,也不会让人感到虚伪世故,不可信任。

您在世故性维度上得分较低。低世故性表现为:坦白、直率、天真。低者通常思想简单,感情用事。与人无争,与世无忤,自许,心满意足。但有时显得幼稚、粗鲁、笨拙、似乎缺乏教养。

12.忧虑性(O)得分:

您在忧虑性维度上得分较高。高忧虑性表现为:忧虑、抑郁、容易烦恼,常常为一些微不足道的小事患得患失。高忧虑性的人常常会有世事艰难之感,并因此会产生沮丧悲观的情绪,容易产生自卑情绪,缺乏与人交往的信心和勇气。

您在忧虑性维度上得分居中。忧虑性居中表现为:对自己的优点和缺陷有着较为现实的认识,不会盲目地自我怀疑或者自我推崇,因此有时会为自己的胜任能力而感到担忧、担心;但是不会轻易的自我否定,相信自己具有一定的解决问题的能力,因此不会经常的感到担心、忧愁,不会时时有患得患失。

您在忧虑性维度上得分较低。低忧虑性表现为:安详、沉着、有自信心。低者通常有自

信心,不轻易动摇,信任自己有应付问题的能力。有安全感、能适应裕如。有时因为缺乏同情,而引发别人的反感与恶意。

13.实验性(Q1)得分:

您在实验性维度上得分较高。高实验性表现为:自由、民主、激进、不拘泥于现实,具有批判性,喜欢对现有的理论、事实等进行以新的评价,一般不轻易判断是非曲直,接纳新事物的能力较强,并主动学习和了解先进的思想、技术和潮流,学识广博,在实践中不断丰富自己的知识和经验。

您在实验性维度上得分居中。实验性居中表现为:对新观念和经验的开放程度一般,不会顽固地墨守成规,不会反对新思想、新事物,但也不会主动地去探索、寻求变革,而是在遵循常规的基础上接受一定的变化性,在必要的时候会尝试新的途径和方法。

您在实验性维度上得分较低。低实验性表现为:保守的,尊重传统观念与行为标准。通常无条件地接受社会中许多相沿已久而有权威性的见解,不愿尝试探求新的境界。常常激烈的反对新思潮以及一切新的变动。在政治与宗教信仰上,墨守成规,可能被称为老顽固或时代的落伍者。

14.独立性(Q2)得分:

您在独立性维度上得分较高。高独立性表现为:自立自强,当机立断。通常能够自作主张独立完成自己的工作计划,不依赖别人。

您在独立性维度上得分居中。独立性居中表现为:会在融合于群体及独立于群体这两个极端中间寻找一个平衡。能够与他人合作完成任务,但同时也有自己的判断和思考,并有着独立担负工作的信心和能力。不会过分依赖于团体也不会给人过分特立独行的印象。

您在独立性维度上得分较低。低独立性表现为:依赖,随意附和。低者通常宁欲与人共同工作,而不愿独立孤行,常常放弃个人的主见,附合众议,以取得别人的好感。需要集体的支持以难持自信心,却并非真正的乐群者。

15.自律性(Q3)

您在自律性维度上得分较高。高自律性表现为:知己知彼,自律谨严。高者通常言行一致,能够合理的支配自己的感情行动,为人处世总能保持其自尊心,赢得人的尊重,有时却不免太固执成见。

您在自律性维度上得分居中。自律性居中表现为:处理问题时会有一定的计划性,但是经常无法完全按照计划实施。他们会比较顾全大局,但有时会不能克制自己的欲望而违背规则或习俗。能够正常的适应各种环境和团体,但是不善于有意识的利用环境资源实现自己的目标或者很快被大家认同为团体的领导者。

您在自律性维度上得分较高。低自律性表现为:矛盾冲突,不顾大体。低者通常既不能克制自己,又不能尊重礼俗,更不顾考虑人的需要的,充满矛盾,却无法解决,生活适应有问题者多具有低分特征。

16.紧张性(Q4)

您在紧张性维度上得分较高。高紧张性表现为:遇事容易紧张、兴奋、激动,缺乏耐心,心神不安,并因此经常导致身心疲惫,长期为此困扰,缺少安全感,心理素质也可能因此而受到影响。

您在紧张性维度上得分居中。紧张性居中表现为:通常能够保持心态的平和放松,享受生活和工作带给自己的乐趣,但是在面对压力情境时,会感到紧张、不安和焦虑,进而调整身心进入"备战"状态。适度的紧张有利于更好的完成任务,提高效率和效果。

您在紧张性维度上得分较高。低紧张性表现为:心平气和、闲散宁静。低者通常知足常乐,保持内心的平衡。也可能过分疏懒,缺乏进取心。

卡特尔16种人格因素问卷(16PF)

卡特尔16种人格因素问卷(16PF) 本测验有许多关于个人兴趣与态度的题目,每个人对这些题目会有不同的回答,这些回答无对错之分。请凭直觉反应选择适合自己的答案,不要迟疑不决,尽量不选中性答案。请先写下您的姓名( )、性别( )、出生日期( )、职业( )、文化程度()。请您回答下列问题,将答案(可写1或2或3)写在题目后()内。 1、我很明了本测验的说明。() ①是的;②不一定;③不是的。 2、我对本测验的每一个问题,都能做到诚实地回答。() ①是的;②不一定;③不是的。 3、如果我有机会的话,我愿意:() ①到一个繁华的城市旅行;②介于①③之间;③游览清净的山区。 4、我有能力应付各种困难。() ①是的;②不一定;③不是的。 5、即便是关在铁笼里的猛兽,也会使我见了惴惴不安。() ①是的;②不一定;③不是的。

6、我总是不敢大胆批评别人的言行。() ①是的;②有时如此;③不是的。 7、我的思想似乎:() ①比较先进;②一般;③比较保守。 8、我不擅长说笑话、讲趣事。() ①是的;②介于①③之间;③不是的。 9、当我见到亲友或邻居争吵时,我总是:() ①任其自己解决;②介于①③之间;③予以劝解。 10、在群众集会中,我:() ①谈吐自如;②介于①③之间;③保持沉默。 11、我愿做一个:() ①建筑工程师;②不确定;③社会科学教授。 12、阅读时,我喜欢选读:() ①自然科学书籍;②不确定;③政治理论书籍。 13、我认为很多人都有些心理不正常,只是他们不愿意承 认。()

14、我希望我的爱人擅长交际,无须具有文艺才能。() ①是的;②不一定;③不是的。 15、对于性情急躁爱发脾气的人,我仍能以礼相待。() ①是的;②介于①③之间;③不是的。 16、受人侍奉时我常常局促不安。() ①是的;②介于①③之间;③不是的。 17、在从事体力或脑力劳动后,我总是需要比别人有更多 的休息时间才能保持工作效率。() ①是的;②介于①③之间;③不是的。 18、半夜醒来,我常常因为种种惴惴不安而不能入睡。() ①常常如此;②有时如此;③极少如此。 19、事情进行得不顺利时,我常常急得涕泪交流。() ①从不如此;②有时如此;③常常如此。 20、我认为只要双方同意可以离婚,不要受传统观念的束 缚。()

数据仓库建模方法论 2018-3-29

数据仓库建模方法论 通过上一篇数据仓库建设的全局概览,我们认识了数据仓库,也明确了数据建模在仓库建设中的核心地位,数据仓库模型是整个大厦的基石,也是个难点。这么重要的环节就有必要单独拿出来详细说明一下。(本文的重点是维度建模)1什么是数据模型 数据模型是抽象描述现实世界的一种方法,是通过抽象的实体及实体之间的联系来表示现实世界中事务的相互关系的一种映射。 数据仓库模型是数据模型中针对特定的数据仓库应用系统的特定模型。由下图四部分内容组成: ●业务建模,主要解决业务层面的分解和程序化。 ●领域建模,主要对业务模型进行抽象处理,生成领域概念模型。 ●逻辑建模,主要将领域模型的概念实体以及实体之间的关系进行数据库层 次的逻辑化。 ●物理建模,主要解决逻辑模型针对不同关系型数据库的物理化以及性能等 一些具体的技术问题。

2数据仓库数据模型架构 数据仓库模型由五部分组成,如下图: 系统记录域:数据仓库业务数据存储区,模型保证了数据的一致性。(继续使用Oracle?) 内部管理域:也就是元数据模型的存储管理。(工具待定) 汇总域:系统记录域的汇总数据,数据模型保证的主题分析的性能,满足部分报表查询。 分析域:用于各个业务部分的具体的主题分析。也就是数据集市。 反馈域:针对前端反馈的数据,根据业务需求而定。 3数据模型的作用 ●进行全面的业务梳理,改进业务流程。 ●建立全方位的数据视角,打通信息孤岛,去除数据差异。 ●解决业务的变动,提高数据仓库灵活性。 ●帮助数据仓库系统本身的建设。

4如何创建数据仓库模型 4.1数据仓库建模四个阶段 4.1.1业务建模 ●划分整个企业的业务,一般按部门划分,进行各个部分之间业务工作 的界定,理清各业务部门之间的关系。 ●深入了解各业务部门工作流程的方法。 ●提出修改和改进业务部门工作流程的方法。 ●数据建模的范围界定,确定数据仓库项目的目标和阶段划分。 4.1.2领域概念建模 ●抽取关键业务概念,并抽象化。 ●将业务概念分组,按业务主线聚合类似的分组概念。 ●细化分组概述,理清分组概念内的精力流程并抽象化。 ●理清分组概念之间的关联,形成完整的领域概念模型。 4.1.3逻辑建模 业务概念实体化、事实实体化、说明实体化,并考虑其属性内容。 4.1.4物理建模 ●针对特定物理平台做出相应的技术调整 ●针对模型的性能考虑,结合特定平台做出相应调整

卡氏人格测定量表(16PF)

卡特尔十六种个性因素测验16PF-人格测定量表 本测验共有187道题目,都是有关个人的兴趣和态度等问题。每个人对这些问题是会有不同看法的,回答也是不同的,因而对问题如何回答,并没有对与不对之分,只是表明你对这些问题的态度。请你要尽量表达个人的意见,不要有顾虑。 应当记住的是: 1.每一测题只能选择一个答案; 2.不可漏掉任何测题; 3.尽量不选择B答案; 4.本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决,拖延时间。一定要在一个小时以内完成整个测验。 5.有些题目你可能从未思考过,或者感到不太容易回答。对于这样的题目,同样要求你做出一种倾向性的选择 1. 我很明了本测试的说明: (A)是的(B)不一定(C)不是的 2. 我对本测试的每一个问题,都能做到诚实地回答: (A)是的(B)不一定(C)不同意 3. 如果我有机会的话,我愿意: (A)到一个繁华的城市去旅行 (B)介于(A),(C)之间(C)浏览清静的山区 4. 我有能力应付各种困难: (A)是的(B)不一定 (C) 不是的 5. 即使是关在铁笼里的猛兽,我见了也会感到惴惴不安: (A)是的(B)不一定(C)不是的 6. 我总是不敢大胆批评别人的言行: (A)是的(B)有时如此(C)不是的 7. 我的思想似乎: (A)比较先进(B)一般(C)比较保守 8. 我不擅长说笑话,讲有趣的事: (A)是的(B)介于(A),(C)之间(C)不是的 9.当我见到邻居或新友争吵时,我总是: (A)任其自己解决(B)介于(A),(C)之间(C)予以劝解 10.在群众集会时,我:

(A)谈吐自如(B)介于(A),(C)之间(C)保持沉默 11.我愿意作一个: (A)建筑工程师(B)不确定 (C)社会科学研究者 12.阅读时,我喜欢选读: (A)自然科学书籍(B)不确定 (C)政治理论书籍 13.我认为很多人都有些心里不正常,只是他们不愿承认: (A)是的(B)介于(A),(C)之间 (C)不是的 14.我希望我的爱人擅长交际,无须具有文艺才能: (A)是的(B)不一定 (C)不是的 15.对于性情急躁,`爱发脾气的人,我仍能以礼相待: (A)是的(B)介于(A),(C)之间 (C)不是的 16.受人侍奉时我常常局促不安: (A)是的(B)介于(A),(C)之间 (C)不是的 17.在从事体力或脑力劳动之后,我总是需要有别人更多的休息时间,才能保持工作效率:(A)是的(B)介于(A),(C)之间 (C)不是的 18.半夜醒来,我常常为种种不安而不能入睡: (A)常常如此(B)有时如此 (C)极少如此 19.事情进行的不顺利时,我常常急得涕泪交流: (A)常常如此(B)有时如此 (C)极少如此 20.我以为只要双方同意可离婚,可以不受传统观念的束缚: (A)是的(B)介于(A),(C)之间 (C)不是的 21.我对人或物的兴趣都很容易改变: (A)是的(B)介于(A),(C)之间 (C)不是的 22.工作中,我愿意: (A)和别人合作(B)不确定 (C)自己单独进行 23.我常常无缘无故的自言自语: (A)常常如此(B)偶尔如此 (C)从不如此 24.无论是工作,饮食或外出游览,我总是: (A)匆匆忙忙不能尽兴(B)介于(A),(C)之间 (C)从容不迫

数据仓库与数据挖掘 课后答案 (陈志泊 著) 清华大学出版社

第1章数据仓库的概念与体系结构 1.数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。 2.元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据元数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。 3.数据处理通常分成两大类:联机事务处理OLTP和联机分析处理OLAP。 4.多维分析是指对以“维”形式组织起来的数据(多维数据集)采取切片(Slice)、切块(dice)、钻取(Drill-down 和Roll-up 等)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。 5. ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。 6.数据仓库按照其开发过程,其关键环节包括数据抽取、数据存储与管理和数据表现等。 7.数据仓库系统的体系结构根据应用需求的不同,可以分为以下4种类型:两层架构、独立型数据集市、依赖型数据集市和操作型数据存储、逻辑型数据集市和实时数据仓库。 8.操作型数据存储实际上是一个集成的、面向主题的、可更新的、当前值的(但是可“挥发”的)、企业级的、详细的数据库,也叫运营数据存储。 9.“实时数据仓库”意味着源数据系统、决策支持服务和数据仓库之间以一个接近实时的速度交换数据和业务规则。 10.从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主、以分析为主、以预测模型为主、以营运导向为主、以实时数据仓库和自动决策为主。 11.什么是数据仓库?数据仓库的特点主要有哪些? 答:数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持。 数据仓库的特点包含以下几个方面:(1)面向主题。操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外部档案数据相关。(2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企事业单位一致的全局信息。也就是说存放在数据仓库中的数据应使用一致的命名规则、格式、编码结构和相关特性来定义。(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎不再做修改和删除操作,也就是说针对数据仓库,通常有大量的查询操作及少量定期的加载(或刷新)操作。(4)反映历史变化。操作型数据库(OLTP)主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含较久远的历史数据,因此总是包括一个时间维,以便可以研究趋势和变化。数据仓库系统通常记录了一个单位从过去某一时点(如开始启用数据仓库系统的时点)到目前的所有时期的信息,通过这些信息,可以对单位的发展历程和未来趋势做出定量分析和预测。 12. 简述数据仓库4种体系结构的异同点及其适用性。 答:(1)两层架构(Generic Two-Level Architecture)。 (2)独立型数据集市(Independent Data Mart)。 (3)依赖型数据集市和操作型数据存储(Dependent Data Mart and Operational Data Store)。 (4)逻辑型数据集市和实时数据仓库(Logical Data Mart and Real-Time Data Warehouse)。 13. 答:数据仓库技术的发展包括数据抽取、存储管理、数据表现和方法论等方面。在数据抽取方面,未来的技术发展将集中在系统集成化方面。它将互连、转换、复制、调度、监控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为数据仓库服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜力。在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,并与Internet/Web 技术紧密结合。按行业应用特征细化的数据仓库用户前端软件将成为产品作为数据仓库解决方案的一部分。数据仓库实现过程的方法论将更加普及,将成为数据库设计的一个明确分支,成为管理信息系统设计的必备。 14. 答: (1)IBM 公司提供了一套基于可视化数据仓库的商业智能(BI)解决方案,包括:Visual Warehouse

卡特尔16PF性格测评量表有计分标准

卡特尔16PF测试问卷 本测验题包括一些有关个人的兴趣与态度等问题.每个人对这些问题是会有不同的看法的,回答自然也是不同的,因而对问题的如何回答,并没有“对”与“不对”之分,只是表明你对这些问题的态度,请你要尽量表达个人的意见,不要有所顾忌. 本测验每一测题都有三个供选择的答案(A、B、C),答卷纸上相应地附有三个方格,请把你所选择的答案以“ⅹ”为符号,填到相应的方格中,即:你如果选择“A”答案就在第一格内划“ⅹ”;选择“B”答案就在第二格内划一“ⅹ”;选择“C”答案就在第三个方格内划一“ⅹ”。 下面有四个例题,请试作回答,把答案填在答案纸左上方“例题”处的后面方格中。 例题: 1、我喜欢看球赛: A、是的 B、偶然的 C、不是的 2、我所喜欢的人大都是: A、拘谨缄默的 B、介于A、C之间的 C、善于交际的。 3、钓鱼不能使人快乐: A、是的 B、介于A、B之间 C、不是的 4、“妇女”与“儿童”就象“大猫”与: A、小猫 B、狗 C、男孩 作答时请注意以下四点: 1、务请坦白地表达自己的兴趣和态度,对问题不费时间去斟酌,应当顺其自然, 根据你个人的反应进行选答。通常每分钟可答三至四题,全部测验在一小时内即可完成。

2、务请回答每一测题,不要有遗漏。 3、每一测题只能选择一个答案 4、要尽量少选择中性答案,即“介于A、C”之间或“不确定”等答案。 如果你对本测验的方法,要求全部掌握了的话,下面就请开始正式测验。 1.我很明了本测试的说明: (A)是的(B)不一定 (C)不是的 2.我对本测试的每一个问题,都能做到诚实地回答: (A)是的(B)不一定(C)不同意 3.如果我有机会的话,我愿意: (A)到一个繁华的城市去旅行(B)介于(A),(C)之间 (C)浏览清静的山区 4.我有能力应付各种困难: (A)是的(B)不一定 (C) 不是的 5.即使是关在铁笼里的猛兽,我见了也会感到惴惴不安: (A)是的 (B)不一定(C) 不是的 6.我总是不敢大胆批评别人的言行: (A)是的 (B)有时如此 (C)不是的 7.我的思想似乎: (A)比较先进 (B)一般(C)比较保守 8.我不擅长说笑话,讲有趣的事: (A)是的(B)介于(A),(C)之间(C)不是的 9.当我见到邻居或新友争吵时,我总是: (A)任其自己解决(B)介于(A),(C)之间(C) 予以劝解 10.在群众集会时,我: (A)谈吐自如(B)介于(A),(C)之间(C)保持沉默11.我愿意作一个: (A)建筑工程师(B)不确定(C)社会科学研究者 12.阅读时,我喜欢选读: (A)自然科学书籍 (B)不确定 (C)政治理论书籍

多维数据库维度层次的理解

多维数据库维度层次的理解 多维度数据库是按照多维数据模型的思想来建立的。而一个多维数据模型是由多个维度和实事组成。维度是多维数据模型中非常重要的概念,要进行多维分析、编写高效准确的MDX 查询,首先要对维及其维度的概念分层有比较深刻的理解。 维是描述事实的角度,也即观察数据的角度。一个多维数据模型通常都包含多个维度。比如:描述企业的销售信息这样一个事实,我们就可能要用到客户维度、时间维度、产品维度、仓库维度等。在多维数据库中,维度表的来源通常都是关系数据库中的基础数据表,如上面提到的客户维度就来自关系数据库中的客户表,产品维度就来自关系数据库中的产品表等等。而这些维度表除了与事实表相关联的键属性以外还有很多其它的数据表属性。在基于关系数据库的查询中,我们可能更多的关注表之间的关系。而在多维数据库中,应该把思维改进一下,应该理解和注意维度属性之间的关系,分析维度中每个属性之间的关系。而维度属性之间的关系就引出了本文的中心——维度层次。 还是上面那个企业销售的例子,对于客户维度,除了键属性外,可能还会有客户的名字属性,所在国家,所在城市以及省,性别,教育情况,职业等信息。通过分析这些属性的值,可以发现:城市是属于某个省的,而省又是属于某个国家的,所以在这些属性的值中就表现了一种层次关系。分析这个层次结构如下图: 图一:客户维度属性层次分析图 上图中左边是客户维度表中国家属性,城市属性和省属性所组成的层次表示,右边就是这几个属性的值之间的关系。在SSAS中,图中左边的部分表示一个层次,这个层次由四个级别组成,这四个级别分别是:国家,省,城市和客户。在这个层次中国家是粒度最大的级别,客户是粒度最小的级别。在进行多维数据分析的时候,我们就可能会在这个层次的不同级别上进行综合或分析,上卷或下钻。 维度中的层次关系有的时候是隐含的,由数据的意义表示。所以维度层次有的时候可以自动生成,但更多的时候是人为定义的。对维进行概念分层使得我们可以在任意的抽象级别分析数据。 在SSAS中有一些与层次相关的函数,要利用好这些函数,其前提就是要理解维度的层次结构。这些函数我将会在另一篇文章中介绍。

事实表设计

事实表中一般要包含2部分:一是由主键和外键所组成的键部分,另一部分是用户希望在数据仓库中所了解的数值指标,这些指标是为每个派生出来的键而定义和计算的,称为事实或指标。由于事实是一种度量,所以事实表中的这种指标往往需要具有数值化和可加性的特征。但是在事实表中,只有那些具有完全可加性的事实才能根据所有的维度进行累加而具有意义。而事实表有一些事实表示的是某种强度,这类事实就不具有完全加法性,而是一种半加法性。例如,账目余款反映的是某个时间点的数据,它可以按照地点和商品等大多数维度进行累加,但是对于时间维度则例外,将一年中每个月的账目余款进行累加是毫无意义的,而决策者则可能需要了解所有地区和所有商品账目余款的累加值。在事实表中还有一些事实是非加法性的,即这些事实具有对事实的描述特性,在这种情况下一般要将这些非加法性事实转移到维度表中。 以事实表中度量的可加性情况,可以把事实表及其包含的事实分为4种样式。 1.事务事实 事务事实以企业事件的单一情况为基础,因此通常只包含事实的次数这一种度量条件,应该尽可能以最低级别来表示。比如银行的ATM提款机的提款次数,使用某种服务的次数等。2.快照事实 快照事实以企业在某一特定时间的特殊状态为基础。也就是只有在某一段时间内才出现的结果。它们也许没有包含所有维的条件,比如不是所有的产品每天都有销售量。 3.线性项目事实 这类事实通常用来储存关于企业经营项目的详细信息。包括表现与企业相关的个别线性项目的所有度量条件,比如销售数量、销售金额、成本和运费等数值数据,也就是关键性能指标。此类事实运用范围很广,比如采购、销售和库存等。 4.事件(状态事实) 这是类特殊的事实,通常只表示事件发生与否和一些非事实本身具备的细节。它所表现的是一个事件发生后的结果变化,并且没有度量数值表示。如哪些产品在促销期间内没有卖出,有还是没有,就是事件或状态事实所表现的结果。 在事实表模型的设计中还需要注意到派生事实。派生事实主要有2种,一种是可以用同一事实表中的其他事实计算得到,例如销售行为中的商品单价可以用商品的销售总金额和销售数量计算得到,对于这些派生事实一般不保留在事实表中;另一种是非加法性事实,例如各种商品的利润率等各种比率。 在事实表模型的设计中必须要考虑到事实表中的这些事实特性,通过多次反复来确定。首先,通过调查确定所有可能的基本事实和派生事实;然后,对所有的事实按照功能或某种方式进行排序,以删除重复的事实;接着,确认那些基于不同准则但是有相同性质的派生事实,例如公司门市销售总额与地区销售总额虽由于维度的不同而被定义为不同的事实,但实际计算方法是一样的;最后,再一次确定事实表模型,在确认中要检查所有的计算派生事实的基本事实是否已经包含在模型中,并且与用户取得—致。 在设计事实表时,一定要注意使事实表尽可能地小,因为过于庞大的事实表在表的处理、备份和恢复及用户的查询等方面需要较长的时间。在实际设计时,可以利用减少列的数量、降低每一列的大小和把历史数据归档到单独的事实表中等多种方法来降低事实表的大小。另外,在事实表中还要解决好数据的精度和粒度的问题,下面将阐释粒度的设计方法。 =========================== 事实、度量和事实表 确定分析内容的构成:事实及其粒度 事实表是数据库中最大的表,是星形模型结构的核心。事实表包含了基本商业事务的详细信息,是对商务活动进行客户关系、销售趋势和产品趋势等分析的素材。事实表的设计包括对

16pf问卷

卡氏十六种人格因素测验(16PF) 说明 1、本测验包括一些有关个人兴趣与态度的问题。每个人都各有自己的看法,对问题的回答自然不同。无所谓正确与错误。请你尽量表达自已的意见。 2、下面是四个例题。请尝试回答这几个问题,将你的答案填在“16PF回答用纸”右上角例题框内,每一个题号后有三个格子。如果你选答“A”则在第一格内划“×”。选“B”则在第二格内划“×”。选“C”则在第三格内划“×”。 例题: ⑴我喜欢看团体球赛:A.是的B.偶然的C.不是的。 ⑵我所喜欢的人大都是:A.拘谨缄默的B.介乎A与C之间C.善于交际。 ⑶金钱不能给予快乐:A.是的B.介乎A与C之间C.不是的。 ⑷“女人”与“儿童”,犹如“猫”与:A.小猫B.狗C.男童。 第四题的正确答复应当为小猫,不过问卷中这一类问题比较少见。 3、作答时请不要费时斟酌。应当顺其自然地依你个人的反应选答。一般说来,问题都略显简短而不能包含所有有关的因素或条件。譬如例题一是有关球赛的问题。你对于参观排球赛或蓝球赛的爱好可能不同,你的回答应就一般球赛而论。通常每分钟作五六题,全部问题应在半个小时内完成。 4、除非在万不得已的情形下,应尽量避免选如“介于A与C之间”,或“不甚确定”这样的中性答案。 5、请不要遗漏,务必对第一个问题作答,但每一题只能选一个答案。有些问题似乎不符合于你,有些问题又似乎涉及隐私。但本测验的目的,在于研究比较青年和成人的兴趣和态度,希望你能真实作答。 6、作答时,请坦白表达自已的兴趣与态度,不必顾忌到老师或其他人的意见与立场。 7、答卷纸上的题目顺序是由上至下,请看清题号和答卷纸上相应的号码,以免发生错误。 8、本书要反复使用,不要在上面写、划、做任何标记,请保持卷面整洁,每一问题答案做在“16PF回答用纸”上。 清楚了以上说明请翻到下页开始作答

数据库维度的基本概念

基本概念: 1.多维数据集: 多维数据集是联机分析处理(OLAP)中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。 2.xx(dimension): 是多维数据集的结构性特性。它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。 3.度量值: 在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。 即,度量值是最终用户浏览多维数据集时重点查看的数字数据。您所选择的度量值取决于最终用户所请求的信息类型。一些常见的度量值有sales、cost、expenditures和productioncount等。 4.元数据: 不同OLAP组件中的数据和应用程序的结构模型。元数据描述OLTP数据库中的表、数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同的记录块。 5.级别: 级别是维度层次结构的一个元素。级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。 6.数据挖掘:

数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP数据集中的数据。之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。 7.多维OLAP(MOLAP): MOLAP存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。根据分区聚合的百分比和设计,MOLAP存储模式为达到最快查询响应时间提供了潜在可能性。总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。 8.关系OLAP(ROLAP): ROLAP存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。但是,可为分区数据使用ROLAP存储模式,而不在关系数据库中创建聚合。 9.混合OLAP(HOLAP): HOLAP存储模式结合了MOLAP和ROLAP二者的特性。 10.粒度: 数据汇总的层次或xx。 11.聚合|聚集: 聚合是预先计算好的数据汇总,由于在问题提出之前已经准备了答案,聚合可以改进查询响应时间。 12.切块: 由多个维的多个成员限定的分区数据,称为一个切块。 13.切片(slice): 由一个维的一个成员限定的分区数据,称为一个切片。

数据仓库维度建模笔记

数据仓库维度建模笔记 2009-03-24 20:01 《数据仓库工具箱—维度建模的完全指南》是数据仓库建模方面的经典著作, 1996年第一版出版被认为是数据仓库方面具有里程碑意义的事件。作者kimballl是数据仓库方面的权威,他将多年的数据仓库建模实战经验、技巧融入本书。他提出的许多维度建模概念被广泛应用于数据仓库的设计和开发中。2002年本书出版了第二版。 这是一部非常好的数据仓库建模的书,前后完整的读了三遍,受益匪浅。 以下笔记将本按四个部分组织:一、数据仓库体系结构和建模过程、技巧。 二、维度表建模技术。三、事实表建模技术。四、行业建模经验。 一、数据仓库体系结构和建模过程、技巧 关键点:数据仓库体系结构、维度建模的四个步骤、数据仓库总线结构、一致性维度。 1、对于数据仓库来说,业务需求是第一位的。 2、数据仓库的目标:(1)、随心所欲的访问数据。直观、明显、简单、易用、切割、合并、下钻、上卷。(2)、一致的展现数据(相对于原来从多个系统中出来的报表不一致)。(3)、适应性、扩展性、可维护性。(4)、为领导决策提供支持。 3、数据仓库的组成。源数据-->数据准备区-->数据仓库(维度建模)-->数据聚集区(OLAP)-->展现。其中原系统到数据准备区属于ETL过程。数据仓库和数据聚集区本书称为数据展示。展现本书称为数据存取工具。 4、数据仓库应特别注意的几点特点:(1)、数据应该以维度的形式进行展示、存储和访问。(2)、数据仓库中必须包含详细的原子数据。(3)、必须采用共同的维度和事实表来建模。 5、数据仓库采用使用维度建模的好处:易理解、查询的高性能、修改的灵活性和可扩充性。 6、维度建模的扩展性。表现在三个方面:(1)、在现有的事实表中增加维度。(2)、在事实表中增加事实。(3)、在维度表中增加属性。(第一章) 7、维度模型设计的四个步骤。(1)、选取业务(主题)。(2)、定于业务处理的粒度。(3)、选择维度。(4)、选择事实。 8、应优先为模型选择有原子性的信息,因为原子性的数据提供了最大限度的灵活性,可以接受任何可能形式的约束。(第二章)

16pf量表(卡特尔十六种人格因素测试)

校学生会新干事心理测试 说明: 1. 测试结果仅由心理部部长及副部共三人进行独立分析。绝对不会出现外泄情况。 2. 测试结果仅由干事本人作为参考,各位的部长、副部均不会看到你们的测试结果。 3. 请各位干事们秉着对自己认真、负责的态度完成整个测试。 4. 题目均由心理中心老师挑选,应用于临床心理测试前沿,题目本身权威性很高。 本测验共有187 道题目,都是有关个人的兴趣和态度等问题。每个人对这些问题是会有不同看法的,回答也是不同的,因而对问题如何回答,并没有对与不对之分,只是表明你对这些问题的态度。请你要尽量表达个人的意见,不要有顾虑。 应当记住的是: 1.每一测题只能选择一个答案; 2.不可漏掉任何测题; 3.尽量不选择B 答案; 4.本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决拖延时间,一定要在一个小时以内完成整个测验。 5.有些题目你可能从未思考过,或者感到不太容易回答。对于这样的题目,同样要求你做出一种倾向性的选择。 1. 我很明了本测验的说明 A. 是的 B. 不一定.

C. 不是的. 2. 我对本测验每个问题都会按自己的真实情况作答 A. 是的. B. 不一定 C. 不同意. 3. 有度假机会时,我宁愿 A. 去一个繁华的都市. B. 介乎A与C之间. C. 闲居清静而偏僻的郊区. 4. 我有足够的能力应付困难 A. 是的. B. 不一定. C. 不是的. 5. 即使是关在铁笼内的猛兽,我见了也会惴惴不安 A. 是的. B. 不一定. C. 不是的. 6. 我总避免批评别人的言行 A. 是的. B. 有时如此. C. 不是的.

7. 我的思想似乎: A. 走在了时代前面. B. 不太一定. C. 正符合时代. 8. 我不擅长说笑话讲趣事 A. 是的. B. 介乎A与C之间. C. 不是的. 9. 当我看到亲友邻居争执时,我总是 A. 任其自己解决. B. 置之不理. C予以劝解. 10. 在社交场合中,我 A. 谈吐自然. B. 介乎A与C之间. C. 退避三舍,保持沉默. 11. 我愿做一名 A. 建筑工程师. B. 不确定. C. 社会科学的教员. 12. 阅读时,我宁愿选读

经典16PF分量表内容

十六种人格因素: 因素A(乐群性):低分特征:缄默,孤独,冷漠。高分特征:外向,热情,乐群。 A:3 .26.27.51.52.76.101.126.151. 176. 3. 如果我有机会的话,我愿意: A到一个繁华的城市旅行 B介于AC之间 C游览清净的山区 26. 如果我在工厂里工作,我愿做 A技术科的工作 B介于AC之间 C宣传科的工作 27. 在阅读时我愿意阅读 A有关太空旅行的书籍 B不太确定 C有关家庭教育的书籍 51. 如果待遇相同,我愿做: A森林管理员 B不一定 C中小学教师 52. 每逢年节或亲友结婚时,我: A喜欢赠送礼品 B不太确定 C不愿相互送礼 76. 如果待遇相同,我愿做一个: A文学研究工作者 B不确定 C旅行社经理 101. 如果让我选择我宁愿做: A列车员 B不确定 C描图员 126. 如果待遇相同,我愿做一个: A律师 B不确定 C航海员 151. 根据我个人的兴趣,我愿参加 A摄影组活动 B不确定 C文娱队活动 176. 下列工作如果让我挑选的话,我愿做 A少先队辅导员 B不太确定 C修表工作 因素B(聪慧性):低分特征:知识面比较窄,抽象思考能力比较弱。高分特征:富有才识,善于抽象思考,学习能力强,思考敏捷。 B:28.53.54.77.78.102.103.127 .128.152.153.177.178.180. 28. 本题后面列出的三个单词,哪个与其它两个单词不类同 A狗 B石头 C牛 53. 本题后面列举的三个数字中,哪个数字与其它两个不类同 A5 B2 C7 54. 猫和鱼就像牛和: A牛奶 B牧草 C盐 77. “惊讶”与“新奇”犹如“惧怕”与: A勇敢 B焦虑 C恐怖 78. 本题后面列出的三个分数,哪一个数与其它两个不类同 A3/7 B3/9 C3/11 102. “理不胜词”的意思是: A理不如词 B理多而词少

维度建模

维度建模的基本概念及过程 摘要:本文首先介绍维度模型中的维度表和事实表这2个基本构成要素的基础知识;其次,介绍设计维度模型的4个基本步骤;再次,围绕某银行为实现业务价值链数据集成的需要,介绍多维体系结构中的3个关键性概念:数据仓库总线结构、一致性维度、一致性事实。 关键词:维度表;事实表;维度模型设计过程;数据仓库总线结构;一致性维度;一致性事实。 引言: 与流行的说法不同,Ralph Kimball本人并没有定义“维度”和“事实”这样的术语。术语“维度”与“事实”,最初是20世纪60年代在一个由General Mills与Dartmouth大学主持的联合研究计划中提出的。70年代,AC Nielsen和IRI都一致地使用这些术语描述他们的数据发布应用,用现在更为准确的话来说,就是关于零售数据的维度数据集市(Data Mart)。在简明性成为生活方式的潮流之前的长时期内,早期的数据库垄断组织们致力于将这些概念用来简化用做分析的信息。他们意识到,除非数据库做得简单易用,否则没有人会用它。因此,在将可理解性和性能作为最高目标的驱动下,产生了维度模型的构造思想。 1 维度表和事实表 1.1 事实表 事实表是维度模型的基本表,其中如图所示存放有大量的业务性能度量值。力图将从一个业务处理过程得到的度量值数据存放在单个数据集市。由于度量值数据压倒性地成为任何数据集市的最大部分,因此应该避免在企业范围内的不同地方存储其拷贝。用术语“事实”代表一个业务度量值。可以设想一个作为例子的情形:查询某个客户在某个机构下某个产品合约账户的某个币种的某个时点余额,在各维度值(客户、产品合约、账户、机构、币种、日期)的交点处就可以得到一个度量值。维度值的列表给出了事实表的粒度定义,并确定出度量值的取值范围

一步一步学习ETL

一步一步学习SQL Server BI 一步一步学习sqlserver BI--数据仓库设计 因为项目还没有真正开始,但是接触BI已有半年多,手痒,这几天准备搞一个简化版本的BI项目。一方面给刚BI入门的朋友一个参考,另外一方面也为自己的将要开始的项目做个准备,让自己能够考虑到一些项目的细节。同时也希望对BI有研究的朋友提供一些建议和经验。因为我们的这个案例是采用微软的sqlserver2005的BI平台开发的,所以这里先贴一张WebCast里面截来的图,这张图主要反映了采用 sqlserver2005的BI项目的架构。 好了,咱们开始吧。我说的这个项目需求很简单,因为是简化版本的么。这是一个游戏中使用到的物品的销售分析软件。里面包括几个概念,游戏,销售部门,物品,交易金额,交易笔数,发布单数等。我们要做的事情就是按游戏,按部门,按物品来实现对交易金额,笔数等的数据交叉分析。 在我们这个系统里面,我们的数据颗粒度是天。好了,既然是简化版,我们也就不用那么罗嗦,什么需求分析,分析设计都省了吧,下面直接进入数据库设计。 我们的数据库一共包括四张维度表(部门维度,游戏维度,物品维度,时间维度),一张事实表(游戏交易数据事实表)。 部门维度表

游戏维度表 物品维度表 时间维度表

交易数据事实表 由于我们的这个案例比较简单,所以维度与事实表之间的关系也比较简单,是一个简单的星型架构。 这一节我们就先写到这里,下一节我将会详细的写这个项目的ETL部分。

一步一步学习sqlserver BI--ETL设计 这节我们主要讲讲我的游戏交易数据分析项目的ETL(数据抽取、加载、转换)具体是怎么做的。 先来讲下源系统吧,因为我们的交易主站的服务器不是架在公司的,因此不能直接从源系统直接抽取数据了。事实上我们已经存在一个简单的数据分析系统了,只不过这个是以前人家做的,没有采用sqlserver2005的BI平台来做,而是直接写winform程序来弄的。原来的数据抽取是主站那边提供导出的excel文件过来,然后到我们这边,导入到我们的分析库中去。 好了,为了简便,事实上我只是在做一个demo,为以后项目做准备,所以我们抽取数据直接是从上面说的已经存在分析库中抽的,因为数据结构比较相近,所以ETL过程还是比较简单的。 先看看游戏维度表吧: 首先,我们来新建一个Integration Services项目。 接着,新建一个ImportDimGamePackage.dtsx的SSIS包。 拖放一个数据流任务到控制流面板上(如图) 双击数据流任务,来到数据流面板

(完整版)卡特尔16PF性格测评量表-有计分标准

卡特尔16PF测试问卷 本测验题包括一些有关个人的兴趣与态度等问题.每个人对这些问题是会有不同的看法的,回答自然也是不同的,因而对问题的如何回答,并没有“对”与“不对”之分,只是表明你对这些问题的态度,请你要尽量表达个人的意见,不要有所顾忌. 本测验每一测题都有三个供选择的答案(A、B、C),答卷纸上相应地附有三个方格,请把你所选择的答案以“ⅹ”为符号,填到相应的方格中,即:你如果选择“A”答案就在第一格内划“ⅹ”;选择“B”答案就在第二格内划一“ⅹ”;选择“C”答案就在第三个方格内划一“ⅹ”。 下面有四个例题,请试作回答,把答案填在答案纸左上方“例题”处的后面方格中。 例题: 1、我喜欢看球赛: A、是的 B、偶然的 C、不是的 2、我所喜欢的人大都是: A、拘谨缄默的 B、介于A、C之间的 C、善于交际的。 3、钓鱼不能使人快乐: A、是的 B、介于A、B之间 C、不是的 4、“妇女”与“儿童”就象“大猫”与: A、小猫 B、狗 C、男孩 作答时请注意以下四点: 1、务请坦白地表达自己的兴趣和态度,对问题不费时间去斟酌,应当顺其自然, 根据你个人的反应进行选答。通常每分钟可答三至四题,全部测验在一小时内即可完成。

2、务请回答每一测题,不要有遗漏。 3、每一测题只能选择一个答案 4、要尽量少选择中性答案,即“介于A、C”之间或“不确定”等答案。 如果你对本测验的方法,要求全部掌握了的话,下面就请开始正式测验。 1.我很明了本测试的说明: (A)是的(B)不一定(C)不是的 2.我对本测试的每一个问题,都能做到诚实地回答: (A)是的(B)不一定(C)不同意 3.如果我有机会的话,我愿意: (A)到一个繁华的城市去旅行 (B)介于(A),(C)之间(C)浏览清静的山区 4.我有能力应付各种困难: (A)是的(B)不一定 (C) 不是的 5.即使是关在铁笼里的猛兽,我见了也会感到惴惴不安: (A)是的(B)不一定(C)不是的 6.我总是不敢大胆批评别人的言行: (A)是的(B)有时如此(C)不是的 7.我的思想似乎: (A)比较先进(B)一般(C)比较保守 8.我不擅长说笑话,讲有趣的事: (A)是的(B)介于(A),(C)之间(C)不是的9.当我见到邻居或新友争吵时,我总是: (A)任其自己解决(B)介于(A),(C)之间(C)予以劝解10.在群众集会时,我: (A)谈吐自如(B)介于(A),(C)之间(C)保持沉默11.我愿意作一个: (A)建筑工程师(B)不确定 (C)社会科学研究者 12.阅读时,我喜欢选读: (A)自然科学书籍(B)不确定 (C)政治理论书籍 13.我认为很多人都有些心里不正常,只是他们不愿承认: (A)是的(B)介于(A),(C)之间 (C)不是的

数据仓库维度模型知识点记录

1.生命周期 a)业务需求定义 i.收集需求 ii.分析业务 iii.数据仓库建立总线矩阵 iv.项目规划 b)维度建模、 i.建模过程 1.标识需要建模的业务过程 2.声明粒度 3.标识和选择维度 4.标识和选择事实 ii.维度表 1.代理键 a)日期维度可以使用20140101这样的智能键,智能键可以用来分区 2.渐变维度 a)SCD1 直接更新 b)SCD2 标记维度的时间作用域,插入新数据,增加新行 c)SCD3 不同的列记录不同时间域的值,增加新列 d)将经常变化属性集合为小维度表 3.退化维度 a)没有对应维度表的非事实属性:类似于订单ID 4.支架维度/引用维度 a)比较类似于雪花模型,例如顾客的生日属性可以链接到日期维度表。 日期维度表就是顾客维度的支架维度 5.多值维度 a)使用桥接表实现 b)事实与维度的多值关系 i.例如订单的为多商户分成,可以通过一个商户分组链接表实现, 订单事实中记录商户分组的ID,分组链接表中分行记录不同商 户的账号ID及其分成 c)维度与维度的多值关系 i.例如用户帐户维度与消费自然人客户维度有多对多关系。因此在 帐户维度表与自然人维度表中加入一个“帐户与客户关系”桥接 表。记录 d)可变层次展示 i.例如职员与职员间隶属关系:可以使用桥接表记录每个职员与其 所有下属之间的隶属距离和其下属的直接上司,就可以层次化的 表示出职员之间关系 6.角色扮演维 a)例如下单日期维度和退款日期维度都是通过视图链接到日期维度表, 这两个维度都是角色扮演维。 7.杂项维度 a)慎用杂项维度

b)将小维度合并组成杂项维度。 iii.事实表 1.事务型事实 2.周期快照事实 3.累计快照事实 4.没有事实的事实 a)例如用户登录行为事实,其只有维度没有度量,那么添加一个值永远 为1的login_cnt字段为度量,方便sum 5.面向状态的事实表 a)例如帐户余额其实对应了一个具体的自然人,在自然人的地理位置变 化后,该自然人维度会有SCD 2的转换,可能代理键从1 – 2.帐户余 额需要做一个SCD 2的转换,将自然人维度引用该为2.其实是为了查 询任意时间点,某个地理位置的帐户余额总和 c)物理设计和ETL开发 i.源数据探查 1.出具数据剖析表来记录字段的类型,数据分布等 ii.子系统 1.提取 a)数据剖析:KETTLE有插件datacleaner实现 i.NULL值判断 ii.字符串匹配 iii.数值分布报表 iv.正则表达式匹配等 b)更改数据捕获系统:KETTLE c)提取系统:KETTLE的INPUT节点的功能 2.清理和一致化:KETTLE已经实现 a)数据清洗 i.转换数据类型 ii.重命令列等 b)数据检验 i.Kettle提供了流读取功能来验证数据是否错误 1.取值范围是否合规 2.关系完整性是否存在 3.是否符合状态机规则(例如没有支付日期时就不应该有支付 状态) 4.一般依赖约束:例如派生列和其父列是否满足约束 c)错误事件模式:KETTLE的错误流节点 i.过程错误:trans step等出错 ii.数据校验错误 iii.过滤器错误 iv.一般步骤错误 v.ETL工具箱中描述的错误事件数据分析表能够起作用 d)审核维度汇编器:KETTLE通过统计节点实现 i.审计事实细节:数据从哪里来,什么时候加载,在那个服务器上

浙江工商大学数据仓库与数据挖掘以及试卷真题回忆

1、数据仓库的定义:数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。 数据仓库特征:数据仓库是将原始的操作数据进行各种处理并转换成综合信息,提供功能强大的分析工具对这些信息进行多方位的分析以帮助企业领导做出更符合业务发展规律的决策。 2、数据仓库与数据库的相同点与不同点: 3、数据仓库的重要特性:面向主题性、集成性、时变性、非易失性、集合性和支持决策作用。 4、数据挖掘的定义:从技术角度看,数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。 5、数据挖掘与数据仓库的关系: ●数据挖掘是数据仓库发展的必然结果:数据挖掘可以看作是联机分析处理的高级阶段。 ●数据仓库为数据挖掘提供应用基础 总之,数据仓库为数据挖掘提供了更广阔的活动空间。数据仓库完成数据的收集、集成、存储和管理工作,数据挖掘面对的是经初步加工的数据,使得数据挖掘更能专注于知识的发现。 6、数据仓库的体系结构:数据仓库系统是由数据源、数据仓库的数据存储、数据仓库的应用工具和可视化用户界面组成。 7、主题数据是数据仓库的核心数据,一般以多维数据模型的形式存储在数据仓库中。 8、在数据仓库中涉及数据存储包括以下几种:数据源、主题数据、数据准备区和查询服务数据。 9、数据集市定义:数据集市一般是为满足某个业务部门进行分析决策的需求而建立的,我们可以将数据集市理解为部门级的数据仓库,数据仓库是数据集市的集合。如果一个数据集市不依赖于中央数据仓库,则这个数据集市为独立数据集市。 10、元数据的定义:元数据就是关于数据的数据。元数据是任何信息处理环境的一个重要组成部分。元数据描述了数据仓库的数据和环境,并使得用户能够更方便地使用数据仓库中的数据进行各种分析,辅助决策。 11、元数据的主要两种作用:元数据进行数据仓库的管理和通过元数据来使用数据仓库。用于对元数据进行管理的元数据称为管理元数据,而帮助我们使用数据仓库的元数据又称作用户元数据。 12、元数据的分类:根据元数据的内容我们将其分为四类:数据源元数据、预处理数据源元数据、数据仓库主题数据元数据、查询服务元数据。 13、数据仓库的数据模型: ●概念模型:多维数据模型是一种能够清楚地表达分析领域的数据模型。实体关系模型注重的是数据的结构,而 多维数据模型注重的是数据的含义。数据仓库的概念模型一般采用多维数据模型来建模。 在多维数据模型中,包含两种建模要素:观察事物的角度和观察得到的事实数据,前者被称作维度,后者被称作事实。一个分析领域或主题表达为由多个维度和一组事实数据构成的一个星型模型。 ●一个数据仓库通常包含多个主题,其概念模型也就由多个星型模型组成。 ● 14、数据仓库中的粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。越是详细的数据,粒度级别就越小;越是概括的的数据,粒度级别就越大。判断:粒度问题是设计数据仓库的一个非常重要的方面,它既是一个逻辑设计的问题,也是一个物理设计的问题。 15、数据分割是把大的数据集划分成多个较小的数据集,并分散到多个物理单元中进行存储,使它们能独立的被处理。粒度的划分和数据的分割对数据仓库的设计和实现有重大的影响。 16、确定粒度大小的一般原则: ●如果数据仓库的空间很有限的话,为了节省存储空间,宜采用大粒度集表示数据。 ●如果追求数据仓库能够回答的问题类型的能力,要求能够回答非常具体的问题,那么使用较小的粒度级别。 ●如果想要减轻服务器的负担,提高查询性能,则采用较大的数据集粒度。 ●如果没有存储空间的限制,则可以在一个数据仓库中采用多重粒度级别,既存储多粒度级别的数据,也存储高 粒度级别的数据,以同时获得高的查询效率和查询能力。 17、数据仓库的建设应该以建立部门级的数据集市为出发点,同时统观全局,使建立的数据集市成为整个企业数据仓库的逻辑子集。从而由多个数据集市集成企业级的数据仓库。为了实施这种数据仓库建设的思想,提出了一种总线型的数据仓库结构,称之为数据仓库的总线型结构。这种数据仓库结构的核心思想是使用统一的维和统一的事实来构造数据仓库的总线。 18、统一的维是指该维可以在数据集市中共享,且不论它与哪个事实表相连接,维的含义都是完全相同的。

相关文档
相关文档 最新文档