文档库 最新最全的文档下载
当前位置:文档库 › 基于数据仓库的数据挖掘模型应用方案建议书【方案之家】

基于数据仓库的数据挖掘模型应用方案建议书【方案之家】

基于数据仓库的数据挖掘模型应用方案建议书【方案之家】
基于数据仓库的数据挖掘模型应用方案建议书【方案之家】

数据挖掘模型应用方案建议书

方案之家欣晨制作

目录

第1章系统概述 (4)

1.1 项目背景 (4)

1.2 建设原则 (5)

1.3总体要求 (6)

1.3.1 基本指导思想 (6)

1.3.2 系统定位 (6)

1.3.3 功能描述 (6)

1.4 建设目标 (7)

1.4.1 近期目标 (7)

1.4.2 中长期目标 (8)

1.5 术语解释 (8)

第2章系统平台方案 (8)

2.1 硬件总体方案.................................................................................. 错误!未定义书签。

2.1.1 基本原则 ............................................................................. 错误!未定义书签。

2.1.2 网络拓扑图及说明 ............................................................. 错误!未定义书签。

2.1.3 硬件平台组成及功能.......................................................... 错误!未定义书签。

2.2 硬件配置依据.................................................................................. 错误!未定义书签。

2.2.1 性能问题分析 ..................................................................... 错误!未定义书签。

2.2.2 数据挖掘系统磁盘存储容量计算...................................... 错误!未定义书签。

2.2.3 磁盘存储总容量 ................................................................. 错误!未定义书签。

2.2.4 数据库服务器处理能力计算.............................................. 错误!未定义书签。

2.3 系统安全控制.................................................................................. 错误!未定义书签。

2.3.1 网络安全管理 ..................................................................... 错误!未定义书签。

2.3.2 操作系统安全 ..................................................................... 错误!未定义书签。

2.3.3 数据库系统安全 ................................................................. 错误!未定义书签。

2.3.4 应用软件上的安全控制...................................................... 错误!未定义书签。

2.3.5 数据备份 ............................................................................. 错误!未定义书签。

2.4 硬件配置方案1............................................................................... 错误!未定义书签。

2.4.1 产品配置清单 ..................................................................... 错误!未定义书签。第3章挖掘模型介绍. (17)

3.1 xxx的流失预警模型流程 (17)

3.1.1 商业理解 (17)

3.1.2 数据理解 (18)

3.1.3 数据准备 (18)

3.1.4 建立模型 (19)

3.1.5 模型检验 (19)

3.1.6 模型发布 (21)

3.2 xxx的客户细分模型流程 (21)

3.2.1 商业理解 (21)

3.2.2 数据理解 (22)

3.2.3 数据准备 (22)

3.2.4 建立模型 (22)

3.2.5 模型检验 (23)

3.2.6 模型发布 (23)

3.3 xxx的信用度模型流程 (24)

3.3.1 商业理解 (24)

3.3.2 数据理解 (25)

3.3.3 数据准备 (25)

3.3.4 建立模型 (27)

3.3.5 模型检验 (27)

3.3.6 模型发布 (28)

3.4 xxx的生命周期模型设计 (28)

3.4.1 建模原因 (28)

3.4.2 建模流程 (28)

3.5 xxx的终身价值模型设计 (30)

3.5.1 建模原因 (30)

3.5.2 建模流程 (31)

3.6 xxx的交叉销售和提升销售模型设计 (32)

3.6.1 系统功能结构图 (32)

3.6.2 模块说明 (32)

3.6.3 数据准备程序 (34)

3.6.4 建模流程 (35)

3.6.5 交叉销售模型 (35)

3.6.6 提升销售模型 (36)

3.6.7 生产流程 (37)

3.6.8 交叉销售模型 (37)

3.6.9 提升销售模型 (39)

3.6.10 验证流程 (40)

3.6.11 交叉销售模型验证流程 (40)

3.6.12 提升销售模型验证流程 (41)

3.7 xxx的营销方案损益测算模型设计............................................... 错误!未定义书签。

3.7.1 系统功能结构图 ................................................................. 错误!未定义书签。

3.7.2 模块说明 ............................................................................. 错误!未定义书签。

3.7.3 计算设计 ............................................................................. 错误!未定义书签。

3.7.4 测算文件模版 ..................................................................... 错误!未定义书签。

3.7.5 程序流程图 ......................................................................... 错误!未定义书签。第4章应用解决方案. (41)

4.1 设计原则 (41)

4.2 应用三层模型 (42)

4.3 软件系统结构图 (44)

4.4 业务逻辑 (44)

4.5 软件功能 (45)

4.6 软件模块划分 (45)

4.7 系统内部接口 (45)

4.8 系统外部接口 (46)

4.9 模型设计步骤和流程 (46)

4.10 功能实现 (46)

4.10.1 ETL子系统实现 (46)

4.10.2 数据准备实现 (47)

4.10.3 模型自动化实现 (48)

4.10.4 前台展现实现 (49)

4.11 xxx数据挖掘模型的优势 (51)

第1章系统概述

1.1 项目背景

面对新的世界经济格局和态势,“客户中心”理论引导商业社会的积极参与者必须为客户提供更好的产品,更优质的服务,更加适应新生活所需的个性需求,企业最终通过有市场竞争力的服务赢得客户对企业的尊重,获得企业的利润。

近年电信市场竞争已经逐步由单纯的资费竞争、价格竞争、网络质量竞争转向多元化的营销模式竞争、渠道竞争、服务竞争、品牌竞争等更深层次,移动通信战场硝烟弥漫,异常惨烈,各家各出奇招,变粗放型经营为精细化经营已经势在必行。

数据仓库技术是市场竞争的产物,他的目标是整合企业内部所有分散的原始的业务数据,并通过便捷有效的数据访问手段,支持企业内部不同部门、不同需求、不同层次的用户随时获得自己所需的信息。数据仓库是提供有效的决策支持,能为企业有效的管理数据提供技术上的保证。目前,已建立和使用的数据仓库应用系统都取得了明显的经济效益,在市场竞争中显示了强劲的活力。

在目前日益激烈的市场竞争中如果没有有力的技术手段来支持更高一层的管理模式,是无法和强大的竞争对手进行抗衡的。从深圳目前的客观条件来看,深圳联通公司经过近10年的发展,积累了大量的客户资料、通话信息、网间通话数据等,这些都是非常宝贵的资源,但由于缺乏必要的手段,无法使用这些资源运用到对新兴客户的获取以及在网用户的二次营销上。而主要竞争对手深圳移动早已经开始了这方面的工作,针对客户流失、客户发展、竞争对手、客户消费模型等设立了多种挖掘计算专题。目前这些专题已经产生了效果,对我们经营造成了非常大的威胁,给我们的发展新客户、挽留老客户都带来了障碍。因此结合开展直复营销的契机全面在深圳的一线和二线部门提升量化营销的能力是非常必要的。基于该背景,积极通过量化营销支撑系统的建设全面提高深圳联通量化营销能力,进一步提升其市场核心

竞争力,已迫不及待。

1.2 建设原则

根据xxx多年的建设经验和客户的需求。系统规划和建设的原则主要包含以下几个方面:

1.系统集中、分步实施原则

采用统一原则,建立统一基础模型结构,考虑有多个模型需要建立,根据模型的重要性和紧迫性采用分步实施,先实施主要的几个模型,随后逐步实施其它模型,不仅符合运营商初期现实情况,又有效的保护了投资,使ROI最大化。

2. 以客户为中心,以市场为导向

系统需满足个性化、信息化的需求。围绕以客户为中心吸引客户、方便客户、满足客户,为客户提供多样化及个性化服务,赢得客户满意的理念设计系统,以适应市场不断的变化。

3.接口的标准化和规范化原则

实现系统内部接口的标准化、规范化,并且能够实现与综合营帐、综合客服、专业计费等相关专业系统间接口的标准化、规范化。系统与外部应用应遵从双向接口,向应用提供模型数据输出以及接受模型评估后的结果进行模型自动修正。

4.具备先进性的同时规避风险

充分利用开发商(xxx)在与其它各大运营商在多年合作中积累的市场、技术、客户体验的经验。充分利用xxx在深圳联通经营分析系统建设中的沟通与经验的积累。采用新的实现技术,新的管理理念使系统具备先进性,同时继承其成熟的技术,成熟的理念,有效规避建设风险。

1.3 总体要求

1.3.1 基本指导思想

1、将数据仓库建设成为全公司、全业务、全产品的统一经营数据分析核心平台;

2、具备公司全业务、全流程的预测、调整、评估能力;

3、具备对各生产作业系统的指挥、调度、评估能力;

4、具备对各环节、各作业单元、各产品较完善的财务损益测算能力;1.3.2 系统定位

系统定位为整个公司核心的经营分析、生产决策平台,使用模型生产的结果数据进行有效的营销。

1.3.3 功能描述

1.基本内容:

●具备对客户价值、行为、生命周期、信用等方面评分分级功能;

●具备对各营销方案、维系挽留政策财务损益测算功能;

●具备针对不同营销活动进行响应客户识别功能;

2.功能要求

●具备数据挖掘能力、财务损益测算评估的能力;

●用户界面必须友好、人性化;

●具备方便的模型参数调整功能与界面,可实现参数动态灵活调整,

并需要具备参数到期自动提醒功能;

●数据源必须丰富,不仅包含系统性数据源,还要包含计财、市场等

管理性外部数据源;

●具备界面友好的模型评估功能;

●具备经营分析数据与文档统一存储功能;

●具备方便的可扩充的外部接口与各应用系统交互;

●具备较好的帮助功能、在线培训功能;

1.4 建设目标

本工程建设,考虑到技术、投资、效益、管理等各方面,需要按照指导思想提到的“个别试点、逐步铺开”的原则来开展。目前,技术上存在效果可行性的进一步核实和论证问题,投资方需要确定投资的规模和风险,项目建成后是否可以取得预期的效果也有不确定性,管理上也需要急迫的见到工程实施后的效果,所以需要将整个工程分成以下几个阶段。

具体如何区分地市的类别,可以按照目前省公司的分类方法,也可以选用经济状况划分,分类如下:

以上地市类别是按照各地市的话务收入来划分的。

1.4.1 近期目标

近期目标主要,完成“方案论证”,“南京、扬州试点”和“I 类地市”的应用。近期目标这样的安排,对以后规避投资风险,以及总结成功经验有好处,

做好“南京、扬州试点”工作后,将使用该项技术及延伸的业务问题解决能力,推广到急需使用的、并且经济条件好的地市。

1.4.2 中长期目标

中长期目标,在巩固了近期目标,并进步深化落实近期目标的基础上,总结经验后,向全省各地市铺开,全面建立数据挖掘模型基础,并解决急切的业务难题,实现项目预期的客户信用控制技术基础和应用。

1.5 术语解释

DB:Database数据库,是数据的存储组织方法。

OS:Operation Systerm操作系统,对硬件设备进行管理和对软件系统进行支撑的平台。

ETL:Extraction、Transformation、Loading数据抽取、转换、装载系统,该系统整合不同的数据源过来的数据,并对数据进行初步的规格化整理,清洗除杂。

捕获率:实际上是同一用户被判断为同一用户的人数/实际上是同一用户的总人数。

捕获纯度:实际上是同一用户被判断为同一用户的人数/所有用户(包括同一用户和不同用户)被判断为同一用户的总人数。

第2章系统平台方案

2.1 硬件总体方案

2.1.1 基本原则

硬件平台包括硬件和系统软件两个大的方面,同时,网络架构安全性的考虑也是关键的部分。

系统的硬件设计中遵循以下几个基本原则:

●先进性

采用当前世界先进的基于计算机网络的软件、硬件产品,从而保证系统在技术上领先。计算机产业是发展迅速的产业,新技术不断涌现,旧产品快速淘汰。选择能够长久发展的主流机种可以减缓机器更换频率,提高主机的服务年限,更好的利用设备投资。在实用的前提下,应从投资保护及长远观点做适当考虑,在技术上要保持五至十年左右的先进性。

●可靠性

系统应具有极高的运行质量,能够一天24小时连续不断工作。整个系统应采用多种系统容错手段,主要设备采用高可靠性设计,保证无故障时间满足系统要求。这就要求从硬件和软件平台的角度,能够提供高可用的解决方案。高可用方案针对可靠性、可用性、容错能力、最大无故障时间等方面提供完整科学系统方案。

●稳定性

系统必须保证稳定运行。

●可扩展性

软件、硬件平台应具有良好的可扩充、扩展能力,能够方便进行系统升级和更新,以适应各种不同业务的不断发展。市场竞争越加激烈,为了提高竞争力而不断推出新业务得以满足市场要求。这就要求系统在技术上具有强大的扩展能力,能够满足业务量的提升,同时能够为增加软件功能提供运行空间。

●安全性

充分考虑了整个系统运行的安全、备份与恢复策略和机制,可以根据不同的业务要求和应用处理,设置不同的安全措施。系统包括大量的数据,保证这些数据不被恶意破坏、非法侵取是电脑系统安全策略所要解决的内容。安全、备份与恢复策略提供网络、主机、交易等关键资源有力保护,为业务系统创造安全可信的运作空间。

●经济性

经济性原则要求系统的设计与实施必须考虑现有资源的使用和闲置情况,如存储、网络资源等的利用,尽可能使用最小的投资,完成最可靠的系统。设计应充分保护目前的设备投资并将再投资规模控制在较合理的范围之内,保证系统的建设具有很好的投资回报效应。同时系统应该还具有较低的运行和维护费用。

●高性能

平台应用具有强大而平衡的处理能力。针对系统数据量大,数据格式复杂,业务比数繁多等情况,要求服务器能够支持大规模批量处理,尤其在高峰期间能够与磁盘系统配合,使整个系统性能平衡不会出现系统瓶颈,保证系统响应大压力的数据负载。

2.1.2 网络拓扑图及说明

整个系统具有以下特点:

●存储系统采用SAN网络,有利于系统存储的扩展。

●数据库服务器配置1台,应用服务器使用1台,两台服务器做成双机互备,保证

了高可用性。

●可以采用IP映射的方式,将IP映射到firewall的DMZ区,保证系统的安全

性。

●内网与外网之间通过防火墙隔离,保证内网的安全,必要时可以采用IDS系统对

系统进行入侵检测。

●与其他系统数据传送通过firewall设备进行安全控制,这样可以避免对其他系

统安全带来威胁。

●前端可以通过专网或者Internet接入,接入可以多样性。

网络拓扑结构图如下:

2.1.3 硬件平台组成及功能

系统的硬件平台主要有以下设备组成:

●数据库服务器

数据库服务器是系统数据处理的中心。通常把数据库服务器称为主机系统。支撑主机系统的核心系统软件是数据库支撑软件,采用Oracle10gR2 Enterprise Edition。

挖掘服务器是数据模型算法中心,用在系统中用来对数据进行分析和挖掘。本系统的建设将系统的数据挖掘服务器与数据库服务器物理上采用同一台主机,采用Insightful Miner挖掘支撑工具。

●应用服务器

应用服务器是系统业务逻辑的核心,承担着前端用户的访问。

●磁盘存储系统

存储系统实际上包括联机存储和脱机存储两部分,磁盘阵列就是我们通常所说的联机存储。这部分也包括硬件和软件两块,硬件包括SAN交换机和磁盘阵列。

●网络设备

网络设备主要包括核心交换机、接入交换机、路由器等各种保证网络互联互通的设备。建议方案采用与营帐等其他系统共用方式,节省投资。

●网络安全设备

防火墙是在网络层保证系统安全的重要组成部分,它可以防止恶意攻击,也可以防止非法入侵。同时还具有网络隔离的功能,是保证系统安全的最核心、最有效部分。

2.2 硬件配置依据

2.2.1 性能问题分析

首先,必须有适当的硬件体系结构,要优化网络和CPU的效用,如果要最充分的利用网络和CPU资源,则数据的布局将是很重要的。在为取得性能进行数据布局时,数据的布局会受到很多因素的影响,包括规模、数据的易变性、复制、数据的访问频率以及其他因素。

其次,要有良好的数据库结构设计。如果数据库设计得不合适,不仅不能充分发挥最大作用,而且应用程序的性能则会受到影响。本系统是一个面向业务的系统,因此,如何提高效率、响应速度,是业务每一个环节都必需考虑的问题。

2.2.2 数据挖掘系统磁盘存储容量计算按50万的用户规模计算存储容量。

下面将对这部分的容量进行详细计算:

2.2.3 磁盘存储总容量

系统的磁盘存储总容量为:

磁盘总容量= 2148(GB)

同时,在配置磁盘的时候,要考虑增加适当的Hotspace磁盘做为磁盘保护,防止由于磁盘损坏严重,造成数据丢失。

2.2.4 数据库服务器处理能力计算

数据挖掘处理是该系统的主要功能,也是处理过程最复杂的部分,是系统最有可能成为瓶颈的部分,因此,主机服务器处理能力依据数据挖掘过程,详细计算过程如下:

以流失预警模型为例进行分析:

S1=N2*N3/N1*T1/T2

S2=S1

2.3 系统安全控制

2.3.1 网络安全管理

采用的网络安全设备为硬件防火墙。

2.3.2 操作系统安全

在小型机和web服务器使用的UNIX/LINUX上,通过限制root用户的ftp、telnet等关键服务、限制普通用户对OS的权限等策略来保证操作系统安全。

也可以使用第三方软件(如安氏SystemScanner)对操作系统及服务可能存在的漏洞进行扫描,实时监控,防范于未然。

2.3.3 数据库系统安全

由DBA统一规划不同用户对数据库的访问权限,而且在本系统的应用层,是通过统一的数据库帐号对数据库进行存取和访问,保证了应用层和数据库层的安全隔离。

也可使用第三方软件(如安氏的DBScanner)对数据库的所有用户权限和服务进行漏洞扫描和实时监控,优秀的数据库安全软件只需要使用少量的系统资源和带宽,就能发挥重要的安全防护作用。

2.3.4 应用软件上的安全控制

建设网络的目的是实现信息共享、资源共享。因此,必须解决网络在应用层的安全。应用层安全主要与企业的管理机制和业务系统的应用模式相关。管理机制决定了应用模式,应用模式决定了安全需求。因此,在这里主要针对各局域网内应用的安全进行讨论,并就建设全网范围内的应用系统提出我们的一些建议。

应用层的安全需求是针对用户和网络应用资源的,主要包括:

?合法用户可以以指定的方式访问指定的信息;

?合法用户不能以任何方式访问不允许其访问的信息;

?非法用户不能访问任何信息;

?用户对任何信息的访问都有记录。

系统通过技术和管理手段可解决以下安全问题:

?非法用户利用应用系统的后门或漏洞,强行进入系统。

?用户身份假冒:非法用户利用合法用户的用户名,破译用户密码,然后假

冒合法用户身份,访问系统资源。

?非授权访问:非法用户或者合法用户访问在其权限之外的系统资源。

?数据窃取:攻击者利用网络窃听工具窃取经由网络传输的数据包。

?数据篡改:攻击者篡改网络上传输的数据包。

?数据重放攻击:攻击者抓获网络上传输的数据包,再发送到目的地。

?抵赖:信息发送方或接收方抵赖曾经发送过或接收到了信息。

2.3.5 数据备份

●备份恢复策略

在进行备份之前,首先要选择备份策略,这将决定何时需要进行备份,以及出现故障时恢复的方式。通常使用的备份方式有三种:

(1)完全备份

每隔一定时间就对系统进行一次全面的备份,这样在备份间隔期间出现数据丢失等问题,可以使用上一次的备份数据恢复到前次备份时情况。

(2)增量备份

首先进行一次完全备份,然后每隔一个较短时间进行一次备份,但仅仅备份在这个期间更改的内容。当经过一个较长的时间后再重新进行一次完全备份,开始前面的循环过程。

(3)策略

备份策略一般是采用完全备份与增量备份相结合的方式,一般以周为基本单位进行规划,举例如下表

每周五进行完全备份,其余作增量备份。

备份恢复方式

备份从方式上讲有逻辑备份和物理备份两种:

(1)逻辑备份

逻辑备份方式就是指利用数据库管理软件本身的备份工具,如oracle数据库的exp和imp工具对数据库进行备份,也就是我们经常说到的数据库的导出(exp)和导入(imp),这种备份方式是将数据库中的数据用exp工具形成文件的形式,保存在磁盘上,通常采用.dmp作为文件的后缀。一旦发生数据丢失,可以利用imp工具将数据重新导入数据库中。

(2)物理备份

物理备份也就是我们通常所说的磁带库备份。它是数据库软件与带库管理软件共同工作完成的,例如:利用oracle的recovery manager和相应的带库管理软件协同工作,是对数据库的物理备份,也就是说,将数据库的数据文件从物理上备份下来。这种备份一般用在系统灾难恢复方面,并支持按时间点恢复。

建议采用物理备份和逻辑备份互为补充的方法。

2.4 硬件配置方案

2.4.1 产品配置清单

LAN Switch

firewall

KVM/控制台

第3章挖掘模型介绍

3.1 xxx的流失预警模型流程

3.1.1 商业理解

客户是企业赢利的基础,但随着竞争的日趋激烈,客户流失也日趋严重。客户在流失之前,往往表现出一定的行为特征,通过对用户行为数据进行数据挖掘分析,能够提前预测用户可能流失的概率,从而对有较大可能流失并具有较高价值的客户提前进行重点关怀及挽留。

在客户流失分析中,客户流失可分为公司内客户转移,客户被动流失,客户主动流失。

1、公司内客户转移,表现为客户转移至本电信公司的不同网络或

不同业务。例如,从普通的固定电话转至IP电话。这种情况下,虽然就

某个业务单独统计来看存在客户流失,但对公司整体而言客户没有流

失。(可以用“指纹模型”预测这种重转网用户。)

2、客户被动流失表现为电信运营商由于客户欺诈或恶意欠费等行

为而主动终止客户使用网络和业务。

3、客户主动流失主要表现客户选择了另一家运营商,即所谓的“客

户跳网”。这种客户流失形式往往是研究的主要内容。

研究哪些客户即将流失时,将其定位为一个分类问题,即将现有客户分为流失和不流失两类。选择适量的历史上流失客户和未流失客户

的属性数据组成训练数据集,利用神经网络、决策树、logistic回归等分

类建立客户流失的分类模型。Insightful Miner给出分类结果的概率值,

这个值可以看作是客户的流失概率。用建立的分类模型预测可以对现有

用户进行流失预测,并给出流失概率。鉴于神经网络对资源要求比较

高,耗时较长;logistic回归本属于统计模型,在处理小数据量时较适

合;而决策树模型无论从精度、训练时间、规则易读性等方面考虑均较

优秀。

3.1.2 数据理解

选取一定数量的客户(包括流失的和未流失的),选择客户属性,包括客户资料、通话行为特征、消费属性、客服信息,采用统计技术中的描述分析及可视化分析技术,以及必要的统计检验及相关性检验技术,对数据进行分析,理解数据的范围、分布状况、方差、偏度、峰度及数据间的相关性,初步确定哪些因素可能影响客户流失。

流失状态定义:以上月出帐,本月不出帐的客户定义为本月流失顾客。

针对大客户可以单独建模,以本月的通话行为数据、费用数据、短信行为数据与前三个月平均值相比,减少N%可定义为休眠。

3.1.3 数据准备

数据准备阶段包括数据抽取、清洗、数据的转换和加载以及重构、整合、格式化、选择、抽样等。通过理解从客户入网到流失整个生命周期内的业务流程和相关要素,从数据仓库中抽取了流失客户群、客户基本资料、客户缴费资料、客户投诉资料、客户账单、客户通话资料等信息。

数据挖掘项目中使用的字段属性及建模用户选择

使用的客户属性:

客户属性、服务属性、客户消费行为数据与客户财务数据、客户最终状态.

使用的数据:绝对值、相对值(比例、增量)

字段选取:

为了对所有可能影响用户流失的因素进行探索及分析,经调研,初始收集了600-700个客户相关数据字段,通过数据探索用可视化工具及统计分析方法,展示及探索各个变量对客户流失的影响,包括柱状图、频数分析、相关分析等,然后将强相关性的变量(约60多个字段)引入到最终模型中。

建模用户的选择:

1、剔除服务计划标识为SZ****

2、SZ****J、SZ****Z、SZ****2、

SZ****Z的用户。

2、剔除测试、公免、FM市场、无线公话、无线固话、商务电话用户。

3、剔除上网卡用户。

数据集准备:

第i-4个月、i-3个月、i-2个月的客户行为、费用平均值+本月流失状态数据集,作为训练集和验证集。满足限制条件的客户数为X万人,我们从中随机抽样出75%作为训练集,25%作为验证集。第i-2个月、i-1个月、i个月的客户行为、费用平均值的客户行为、费用平均值作为应用数据集,预测第i+2个月的流失状态。

3.1.4 建立模型

通过数据探索分析,把所有数据准备好之后,采用决策树算法来预测客户的流失倾向。决策树方法可以建构出合乎逻辑且易解读的决策规则。

期间有2个问题要注意处理:

1、对不均衡现象的处理:流失顾客数相对于未流失用户数而言,

比例非常小,如果不经处理,建立的模型就不准确。所以在建模时我们需要进行抽样,抽取流失客户和未流失客户组成建模数据,两者的比例约为1:2,另一种处理方式是在建立模型时设置流失客户和未流失客户的权重组成建模数据。通常我们采用第一种方式处理不均衡现象。

2、参数设置:剪枝参数设置,我们把剪枝参数设为75%,目的是

为了既要保证模型精度,又要防止过渡拟合;设定成本矩阵参数,用于控制误判成本;设置子枝包含的最小记录数,减少模型复杂度。

3.1.5 模型检验

使用了两种验证方式:

1、验证集验证:采用与建模数据同月的未参与建模的数据定义为验证集,评估模型精度。(选打分模型时使用。)

2、滞后验证:用实际流失情况验证模型预测的精度。在第i个月预

测第i+2个的流失情况,待第i+3个月,实际流失结果出来后评估模型效果。(适用于建模初期,未投入应用时。)

按运营商的要求,重点查看滞后验证的捕获率、提升率。与别的挖掘项目重点查看验证集的提升率、捕获率不一样。因而其捕获率、提升率更能体现模型精度。

某运营商流失预警模型项目初期某月的滞后验证效果(摘自“某运营商流失预警模型检验结果综合报告”)

解读:选取10%的预测为流失的用户数11569人,预测要流失的当月(即第i+2个月)流失1929人,第i+3月流失2529人,第i+4月流失892人,三个月内共计流失5350人,捕获率达到了46.24%,提升率达到了5.1。

捕获率:捕获率=选取的用户中实际流失用户数/选取的用户数

提升率:提升率=捕获率/实际流失率

数据仓库模型的设计

2.5数据仓库模型的设计 数据仓库模型的设计大体上可以分为以下三个层面的设计151: .概念模型设计; .逻辑模型设计; .物理模型设计; 下面就从这三个层面分别介绍数据仓库模型的设计。 2.5.1概念模型设计 进行概念模型设计所要完成的工作是: <1>界定系统边界 <2>确定主要的主题域及其内容 概念模型设计的成果是,在原有的数据库的基础上建立了一个较为稳固的概念模型。因为数据仓库是对原有数据库系统中的数据进行集成和重组而形成的数据集合,所以数据仓库的概念模型设计,首先要对原有数据库系统加以分析理解,看在原有的数据库系统中“有什么”、“怎样组织的”和“如何分布的”等,然后再来考虑应当如何建立数据仓库系统的概念模型。一方面,通过原有的数据库的设计文档以及在数据字典中的数据库关系模式,可以对企业现有的数据库中的内容有一个完整而清晰的认识;另一方面,数据仓库的概念模型是面向企业全局建立的,它为集成来自各个面向应用的数据库的数据提供了统一的概念视图。 概念模型的设计是在较高的抽象层次上的设计,因此建立概念模型时不用考虑具体技术条件的限制。 1.界定系统的边界 数据仓库是面向决策分析的数据库,我们无法在数据仓库设计的最初就得到详细而明确的需求,但是一些基本的方向性的需求还是摆在了设计人员的面前: . 要做的决策类型有哪些? . 决策者感兴趣的是什么问题? . 这些问题需要什么样的信息? . 要得到这些信息需要包含原有数据库系统的哪些部分的数据? 这样,我们可以划定一个当前的大致的系统边界,集中精力进行最需要的部分的开发。因而,从某种意义上讲,界定系统边界的工作也可以看作是数据仓库系统设计的需求分析,因为它将决策者的数据分析的需求用系统边界的定义形式反映出来。 2,确定主要的主题域 在这一步中,要确定系统所包含的主题域,然后对每个主题域的内

数据仓库建设方案详细

第1章数据仓库建设 1.1数据仓库总体架构 专家系统接收增购项目车辆TCMS或其他子系统通过车地通信传输的实时或离线数据,经过一系列综合诊断分析,以各种报表图形或信息推送的形式向用户展示分析结果。针对诊断出的车辆故障将给出专家建议处理措施,为车辆的故障根因修复提供必要的支持。 根据专家系统数据仓库建设目标,结合系统数据业务规,包括数据采集频率、数据采集量等相关因素,设计专家系统数据仓库架构如下: 数据仓库架构从层次结构上分为数据采集、数据存、数据分析、数据服务等几个方面的容: 数据采集:负责从各业务自系统中汇集信息数据,系统支撑Kafka、Storm、Flume

及传统的ETL采集工具。 数据存储:本系统提供Hdfs、Hbase及RDBMS相结合的存储模式,支持海量数据的分布式存储。 数据分析:数据仓库体系支持传统的OLAP分析及基于Spark常规机器学习算法。 数据服务总线:数据系统提供数据服务总线服务,实现对数据资源的统一管理和调度,并对外提供数据服务。 1.2数据采集 专家系统数据仓库数据采集包括两个部分容:外部数据汇集、部各层数据的提取与加载。外部数据汇集是指从TCMS、车载子系统等外部信息系统汇集数据到专家数据仓库的操作型存储层(ODS);部各层数据的提取与加载是指数据仓库各存储层间的数据提取、转换与加载。 1.2.1外部数据汇集 专家数据仓库数据源包括列车监控与检测系统(TCMS)、车载子系统等相关子系统,数据采集的容分为实时数据采集和定时数据采集两大类,实时数据采集主要对于各项检测指标数据;非实时采集包括日检修数据等。 根据项目信息汇集要求,列车指标信息采集具有采集数据量大,采集频率高的特点,考虑到系统后期的扩展,因此在数据数据采集方面,要求采集体系支持高吞吐量、高频率、海量数据采集,同时系统应该灵活可配置,可根据业务的需要进行灵活配置横向扩展。 本方案在数据采集架构采用Flume+Kafka+Storm的组合架构,采用Flume和ETL 工具作为Kafka的Producer,采用Storm作为Kafka的Consumer,Storm可实现对海量数据的实时处理,及时对问题指标进行预警。具体采集系统技术结构图如下:

数据仓库物理模型设计

数据仓库物理模型设计 数据仓库的物理模型就是数据仓库逻辑模型在物理系统中的实现模式。其中包括了逻辑模型中各种实体表的具体化,例如表的数据结构类型、索引策略、数据存放位置和数据存储分配等。在进行物理模型的设计实现时,所考虑的因素有:I/O存取时间、空间利用率及维护的代价。 为确定数据仓库的物理模型,设计人员必须做这样几方面工作:首先要全面了解所选用的数据库管理系统,特别是存储结构和存取方法;其次了解数据环境、数据的使用频率、使用方式、数据规模及响应时间要求等,这些都是对时间和空间效率进行平衡和优化的重要依据;最后还需要了解外部存储设备的特征。只有这样才能在数据的存储需求与外部存储设备条件两者之间获得平衡。 1 设计存储结构 在物理设计时,常常要按数据的重要性、使用频率及对反应时间的要求进行分类,并将不同类型的数据分别存储在不同的存储设备中。重要性高、经常存取并对反应时间要求高的数据存放在高速存储设备上;存取频率低或对存取响应时间要求低的数据则可以存放在低速存储设备上。另外,在设计时还要考虑数据在特定存储介质上的布局。在设计数据的布局时要注意遵循以下原则。 l 不要把经常需要连接的几张表放在同一存储设备上,这样可以利用存储设备的并行操作功能加快数据查询的速度。 l 如果几台服务器之间的连接会造成严重的网络业务量的问题,则要考虑服务器复制表格,因为不同服务器之间的数据连接会给网络带来沉重的数据传输负担。 l 考虑把整个企业共享的细节数据放在主机或其他集中式服务器上,提高这些共享数据的使用速度。 l 不要把表格和它们的索引放在同一设备上。一般可以将索引存放在高速存储设备上,而表格则存放在一般存储设备上,以加快数据的查询速度。 在对服务器进行处理时往往要进行大量的等待磁盘数据的工作,此时,可以在系统中使用RAID(Redundant Array of Inexpensive Disk,廉价冗余磁盘阵列)。 2 设计索引策略 数据仓库的数据量很大,因而需要对数据的存取路径进行仔细地设计和选择。由于数据仓库的数据一般很少更新,所以可以设计索引结构来提高数据存取效率。在数据仓库中,设计人员可以考虑对各个数据存储建立专用的索引和复杂的索引,以获取较高的存取效率,虽然建立它们需要付出一定的代价,但建立后一般不需要过多的维护。 数据仓库中的表通常要比联机事务处理系统(OLTP)中的表建立更多的索引,表中应用的最大索引数应与表格的规模成正比。数据仓库是个只读的环境,建立索引可以取得灵活性,对性能极为有利。但是表若有很多索引,那么数据加载时间就会延长,因此索引的建立需要进行综合的考虑。在建立索引时,可以按照索引使用的频率由高到低逐步添加,直到某一索引加入后,使数据加载或重组表的时间过长时,就结束索引的添加。 最初,一般都是按主关键字和大多数外部关键字建立索引,通常不要添加很多的其他索引。在表建立大量的索引后,对表进行分析等具体使用时,可能需要许多索引,这会导致表的维护时间也随之增加。如果从主关键字和外部关键字着手建立索引,并按照需要添加其他索引,就会避免首先建立大量的索引带来的后果。如果表格过大,而且需要另外增加索引,那么可以将表进行分割处理。如果一个表中所有用到的列都在索引文件中,就不必访问事实表,只要访问索引就可以达到访问数据的目的,以此来减少I/O操作。如果表太大,并且经常要对它进行长时间的扫描,那么就要考虑添加一张概括表以减少数据的扫描任务。 3 设计存储策略

给公司的建议书范文

给公司的建议书范文 【篇一:公司建议书格式范文(共7篇)】 篇一:公司合理化建议书范本 公司合理化建议书范本 笔者私下诚恳进言,冷眼旁观,公司毫无制度可言。少数人的蛮横 无理代替了公司制度,他们确实为公司盈利,公司也默许他们疯咬,以此也就破坏了公司合理的竞争平台。从眼马前看这是上下互利臭 味相投,长远看这帮没素质的将会牵制公司的发展壮大。他们为什 么变成疯狗呢,就因为公司不正规,恶性循环。企盼领导高瞻远瞩,流氓思想岂能长久?何况还是泼妇无赖之徒!天天瞎招聘,好马拉 盐车,费力不讨好。公司这种状况,哪个人是被开除的?好人呆不 住被挤走,坏人行尸走肉无法无天。除了自己走的和被挤走的根本 就没来去的理由,你这是怎么个用人的?! 我给好员工的建议:有利必争,有问题必反应。这公司没个制度保证,有些人变成了疯狗,老是人为制造问题,前面救火,后面纵火,毫无制度机制约束,总是犯着同样的问题,致使工作举步维艰,难 以开展。产生这种状况的原因和员工自己毫不相关。只要自己已经 尽力而为,和戴韩国手钏儿的疯狗一般见识犯不着!没素质的东西!上行下效! 有句老话:公司不缺的就是人,离了谁地球照样转。这句话的前提 是什么?合理的运行机制和企业制度是基石。在此基础上,人就是 零件,废了就换。公司如果不完善规章制度,只知道靠少数业务强 手创收,他们的个人阴暗思想就代替了公司制度,人都是自私自利的,排挤他人,破坏公司整体竞争平台,最终牵制公司发展,早晚 完蛋!鼠目寸光,不学无术,上行下效,虚假伪劣!马上得天下不 能马上治天下,否则那些业务员老头老太太都是ceo级别的了!村 夫村妇,疯咬疯斗,和农村大娘们儿无赖扒手有什么区别?! 据领导说公司的业务员不属于任何人,但是疯狗只维护自己盘子里 的骨头,不是自己的骨头谁管那一套?自己打自己嘴巴,领导自己 不立信没脸说那些斩钉截铁的话!!疯狗护的是自己盘子里的食物,领导强调的是食物都是自己的,疯狗的行为最终会使领导失去所有 食物,离心离德,树倒猢狲散不远矣! 注释: 好马拉盐车——

倡议书的格式范文6篇

倡议书的格式范文6篇 倡议书一般由标题、称呼、正文、结尾、落款五部分组成。本文是为大家整理的倡议书的格式f范文,仅供参考。 一、倡议书的写作要点 倡议书是常用文体之一。那些针对社会生活中的实际问题,或是为了完成某些重大的任务由个人或集体带头提出些合理化建议的措施,向公众发出一些公开性的号召,将这些以信件形式书写出来,就是倡议书。如成立学雷锋小组的倡议,开展献爱心活动的倡议等。 理由 倡议书是种能起重大作用的特殊书信。如针对社会生活中实际问题的倡议,能引起人们对社会现象的关注,激发大家一起去解决它的热情。例如有个学校里的新生中,来了个坐三轮车上学的残疾学生,同学们看到家长天天推车来送他上学时,只投过去看希罕的目向外张望,他家的大人没按时来接他。一个高年级叫沈柏生的同学发这才发现,这残疾同学的父母都不在了,他是由奶奶抚养的。每天接送他的,并不是他的家长,而是他的邻居。沈柏生心里充满了对这个残疾同学的同情和关心,在学校贴出一份倡议书,倡议成立友爱护送队,每天负责接送这个残疾同学。学校领导以此为典型,开展送温暖活动,学校也因此出现新气象。可见,合理的倡议能够号召向先进学习,推广和传播先进的经验,能激发上进的热情,促进团结,能动员大家的力量,去完成重要的任务,推动社会主义物质文明和精神文明的建设。所以,学会写倡议书是十分有意义的事情,何况,它也是训练写应用

文的途径之一呢? 二、倡议书的写法、格式 首先,倡议书有自己的格式。一般分为标题、正文、署名、日期四部分。标题有的直接写"倡议书"三字,有时要点明倡议的核心事情,如"关于开展献爱心活动的倡议"等等。正文部分,有的写称呼,有的不写称呼,但必须写清楚三点:一是倡议做什么事?二是为什么要做这些事?即讲清目的和意义。三是怎么去做,提出初步设想。署名是署倡议者的名称和姓名,日期是发倡议的日子。 倡议书有无效果就看倡议的事情有无价值,这部分是否写得 能服人,能感人了。 其次,倡议既要有先进性,又要有可行性。如上述沈柏生同学发的倡议,就有先进性,青少年应关心残疾人,也有可行性,即同学们努力能做好的。这是一份倡议书能不能起作用的重要原因。第三,倡议书应写得情理并重,富有号召力。一份好的倡议书应说之以理,动之以情,使人读后能被你的理由说服,能被你的感情打动,这是倡议书的号召力的内在因素。同时,也要在语言上下功夫,有几句能深深地震撼别人心灵的话。 倡议书一般由标题、称呼、正文、结尾、落款五部分组成。 (一)标题倡议书标题一般由文种名独自组成,即在第一行正中用较大的字体写"倡议书"三个字。 另外,标题还可以由倡议内容和文种名共同组成。如"把遗体交给医学界利用的倡议书"。

数据仓库建设方案84099

1.数据仓库概述 经过多年IT的建设,信息对于XXX 的日常管理已经日益重要,并逐渐成为重要的信息资产,信息资产的管理已经成为日常管理中一个非常重要的环节。如何管理和利用好XXX 内部纷繁的数据也越来越成为信息管理的一项重要工作。 在过去相当一段时间内,XXX 业务系统的构建主要围绕着业务的数据展开,应用的构建多是自下而上构建,主要以满足某个部门的业务功能为主,我们称之为业务处理的时代。这样的构建方式造成了一个个分立的应用,分立的应用导致了一个个的静态竖井。由于数据从属于应用,缺乏XXX 全局的单一视图,形成了一个个信息孤岛,分立的系统之间缺乏沟通,同样数据的孤岛导致只能获得片面的信息,而不是全局的单一视图。存储这些信息的载体可能是各种异构或同构的关系型数据库,也有可能是XML 、EXCEL 等文件。因此,构建新一代的一体化平台提上了日程并最终促成全域数据的管理方式,目的是覆盖XXX 各个环节的关键业务数据,完善元数据管理,形成全局的数据字典、业务数据规范和统一的业务指标含义,能够灵活的获取XXX 业务数据的单一视图(需要保证数据的一致性、完整性、准确性和及时性)。数据的交换和共享主要发生在上下级组织机构之间或同级的不同部门之间。最终,这些数据可以为部队分析、决策支持(多维分析、即席查询、数据挖掘)等应用提供更及时、准确、有效的支持。 数据仓库的目标是实现跨系统数据共享,解决信息孤岛,提升数据质量,辅助决策分析,提供统一的数据服务。同时,数据仓库的构建也面临着各种挑战,比如信息整合在技术上的复杂度、信息整合的管理成本、数据资源的获取、信息整合的实施周期以及整合项目的风险等。

建议书的格式及范文

坚持每天取得一点点进步,就能获得人生的进步。下面请大家来看看小编辛苦为大家准备的《建议书的格式及范文》两篇,如果想要更多相关讯息,请继续关注我们的作文栏目。 篇一:建议书的格式及范文 亲爱的环保局局长: 自从改革开放以来,我们国家科技。经济等多个方面的技术变得越来越好了,但也正是为这几个方面,使地球的环境变的越来越差。近几年来,水体。大气层。土壤。固废不断的被污染,导致臭氧层被破坏,还使沙尘暴。酸雨。海啸。地震。台风。雪崩。龙卷风等多种自然危害不断地袭卷世界各的,我相信在这样下去的话,地球一定会被破坏,试问,如果地球被破坏了,我们还能去哪里?是的,有许多大人言不惭地说:“地球被破坏了,我们人类还可以移居到别的星球上去吗?”但本单元的第13课《地球只有一个》的里面已经明确的告诉了我们,人类只有一地球,至今为止,还没有找到一个类似的星球。如果哪一天地球上的所有资源都用光了,臭氧层没了,我们的末日就降临了。所以,为了地球不被遭到破坏和我们的未来着想,我向您提出几点建议,希望你能认可: 1、保护环境,先搞好绿化。我希望世界上的每一个人一年种一棵树。 2、把工厂排出的污水净化,在流向庄稼地和河流。 3、汽车应尽早使用太阳能汽车,不排尾汽,不污染环境。 4、要做到低碳又环保的生活。 在大自然的世界里,除了带走空气,什么也不要带走,除了留下脚印,什么也不要留下。别让眼泪成为地球上的一滴水,别让拍卖会上卖的物品是地球上的最后一瓶空气和最后一株小草,所以我们要带动身边所有的人,要保护动物。保护蓝天。保护地球。保护绿色。珍惜生命,珍爱我们的每一个朋友,让每一滴水都变的清澈透明,让每一棵花草树木都长得茂盛。让天空更蓝,让百花更艳,让新鲜的空气永留人间。让保护环境的行为成为我们的家常便饭,让保护动物的口号传遍世界各的! 篇二:建议书的格式及范文 环保局的叔叔阿姨们: 您们好! 我是滨东小学六年级的一名热爱大自然的学生,我在我的家乡已经整整生活了13年了,家乡的一切变化都被我看在眼里。今天,我之所以冒昧地给您们写这封建议书,是因为我有太多太多的话要说。 不知您们有没有发现这样一个严重的现象:近几年来,许多树木都被大量地砍伐了,那一棵棵参天大树没了,只剩下光秃秃的山丘。

倡议书的格式范文(共6篇)

篇一:倡议书格式和范文 倡议书格式和范文 倡议就是倡导、建议。倡议书是为倡议、发起某项活动而写的号召性的公开建议性的专用书信。如提议开展抢救国宝大熊猫的倡议书;给希望工程捐款的倡议书等。这些号召性的书信或公诸报端,或张贴校园,都是倡议书的范例。 倡议书的特点具体来讲具有以下几个方面: (一)倡议书的群众性 倡议书不是对某个人、某一集体、或某一单位而言的,它往往面向广大群众,或对一个部门的所有人发出,或对一个地区的所有人发出,甚至向全国发出。所以其对象广泛的群众性是倡议书的根本特征。 (二)倡议书对象的不确定性 倡议书是要求广大群众响应的,然而其对象范围往往是不定的。它即便是在文中明确了自己的具体对象,但实际上有关人员可以表示响应,也可以不表示响应,它本身不具有很强的约束力。而与此无关的别的群众团体却可以有所响应。 (三)倡议书的公开性 倡议书就是一种广而告之的书信。它就是要让广大的人民群众知道了解,从而激起更多的人响应,以期在最大的范围内引起共鸣。 倡议书遵循书信的一般格式,又有自己的特点。一般而言,分为向谁倡议,倡议什么,谁倡议的,以及倡议日期等几个部分,同一般专用书信差不多。特点在于第一行不写称呼,而是写倡议题目,如“关于抢救国宝大熊猫的倡议”、“关于成立学雷锋小组的倡议”等。接着在另起一行的顶格处写号召的对象。但称呼不像书信那么实指,而是泛指。有时也可以不写称呼,而直接写正文。 倡议书 全校师生: 今年我国长江流域和嫩江流域,发生了建国以来的特大洪水,给国家造成了巨大的财产损失,给灾区人民的生活带来极大不便。在社会主义大家庭里,“一方有难,八方支援”是共产主义精神的体现。我们倡议全校师生捐款捐物来帮助灾区人民渡过难关。“一分钱,一件衣”,钱物有价,情义无价,贵在大家的支持。希望大家尽己所能,热情地伸出友谊的双手,为灾区人民作出奉献。 篇二:建议书写作格式及范文 一、建议书的写作格式一般由标题、称呼、正文、结尾、落款几部分构成。 (一)标题标题一般在第一行中间写上“建议书”字样。有的建议书还写上所建议的内容,如“关于暑期中小学补课的建议书”。 (二)称呼建议书称呼要求注明受文单位的名称称呼或个人的姓名,要在标题下隔两行顶格写,后加冒号。 (三)正文建议书正文由以下三部分构成: 第一,要先阐明提出建议的原因、理由以及自己的目的、想法。这样往往可以使受文单位或个人从实际出发,考虑你的建议的合理性,为采纳你的建议打下基础。 第二,建议的具体内容。一般建议的内容要分条列出,这样可以做到醒目。建议要具体明白切实可行。 第三,提出自己希望采纳的想法,但同时也应谨慎虚心,不说过头的话,不用命令的口气。 (四)结尾结尾一般是表示敬意或祝愿的话。同一般书信相同。 (五)落款落款要署上提建议的单位或个人的称呼姓名,并署上成文日期。

建议书的格式及

建议书的格式及 【篇一:建议书写作格式及范文】 一、建议书的写作格式一般由标题、称呼、正文、结尾、落款几部 分构成。 (一)标题标题一般在第一行中间写上“建议书”字样。有的建议书还 写上所建议的内容,如“关于暑期中小学补课的建议书”。 (二)称呼建议书称呼要求注明受文单位的名称称呼或个人的姓名, 要在标题下隔两行顶格写,后加冒号。 (三)正文建议书正文由以下三部分构成: 第一,要先阐明提出建议的原因、理由以及自己的目的、想法。这 样往往可以使受文单位或个人从实际出发,考虑你的建议的合理性,为采纳你的建议打下基础。 第二,建议的具体内容。一般建议的内容要分条列出,这样可以做 到醒目。建议要具体明白切实可行。 第三,提出自己希望采纳的想法,但同时也应谨慎虚心,不说过头 的话,不用命令的口气。 (四)结尾结尾一般是表示敬意或祝愿的话。同一般书信相同。 (五)落款落款要署上提建议的单位或个人的称呼姓名,并署上成文 日期。 二、建议书 建议书是个人、单位和有关方面,为了开展某项工作,完成某项任 务或进行某种活动而倡议大家一起做什么事情,或提出合理化的意见、建议时使用的一种文体,也叫倡议书、意见书。 建议书是应用文的一种类型。其内容很广泛,像弘扬雷锋精神,开 展精神文明活动,援助贫困山区孩子读书,开展工作拥军优属活动 家等,都可以写建议书。 建议书是面对群体时,虽然也带有建议,但主要是宣传、鼓动对方 去做,具有一定的号召性。建议书是面对领导和有关部门时,一般 是中肯地提出自己对对方工作的意见和自己的建议,没有要求对方 去做的意思。不具有号召性。建议书的格式和一般书信大体相同: 2、称呼提出的建议希望得到哪些人的响应,称呼就写那些人。要 写在第二行顶格,后面加冒号。 3、正文就是建议的内容,从第三行空两格开始写。先写提出建议 的理由,再写建议的具体内容。如果内容较多,可以分条写。

倡议书的标准格式及范文

倡议书的标准格式及范文 倡议书:是为倡议、发起某项活动而写的号召性的公开提议性的专用书信。 【格式】 倡议书一般由标题、称呼、正文、结尾、落款五部分组成。 (一)标题 倡议书标题一般由文种名独自组成,即在第一行正中用较大的字体写“倡议书”三个字。 另外,标题还可以由倡议内容和文种名共同组成。如“把遗体交给医学界利用的倡议书”。 (二)称呼 倡议书的称呼可根据倡议的对象而选用适当的称呼。如“广大的青少年朋友们:”、“广大的妇女同胞们:”等。有的倡议书也可不用称呼,而在正文中指出。 (三)正文 正文内容一般包括以下一些方面: 1.写倡议书的背景原因和目的 倡议书的发出贵在引起广泛的响应,只有交代清楚倡议活动的原因,以及当时的各种背景事实,并申明发布倡议的目的,人们才会理解和信服,才会自觉的行动。这些因素交待不清就会使人觉得莫名其妙,难以响应。 2.写明倡议的具体内容和要求

这是正文的重点部分。倡议的内容一定要具体化。开展怎样的活动,都做哪些事情,具体要求是什么,它的价值和意义都有哪些均需一一写明。 倡议的具体内容一般是分条开列的,这样写往往清晰明确,一目了然。 (四)结尾 结尾要表示倡议者的决心和希望或者写出某种建议。倡议书一般不在结尾写表示敬意或祝愿的话。 (五)落款 落款即在右下方写明倡议者单位、集体或个人的名称或姓名,署上发倡议的日期。 例文: 节约用电倡议书 电,是一种能源,是我们现代生活的一个重要组成部分。如果没有电,我们的生活将是怎样呢?如果没有电,我们的世界将是一片黑暗,因此,我们在享受电力带来恩惠的同时,要节约用电、安全用电,更要保护电力设施,确保用电秩序,为此,我们向大家发出如下倡议: 1、坚持“少开一盏灯,节约一度电”。 2、夏季开空调时,将温度设置在26℃及以上。 3、家里没人的时候,关闭灯具、空调等的电源。 4、当灯具、电脑等停止使用时,顺手关闭电源。 5、家用电器都应装有漏电开关,确保用电安全。 6、不乱拉线,不使用不合格的花线。

项目建议书格式与范本

项目建议书格式与范本 1、工业类项目类 2、政府机关办公类 3、机关其它建筑类 4、市政道路桥梁类 5、社会事业类 6、科技产业 7、规划发展类 8、设计类 9、涉外资金类 10、项目申请报告

工业项目建议书格式 一、总论 1、项目名称: 2、承办单位概况(新建项目指筹建单位情况,技术改造项目指原企业情况) 3、拟建地点: 4、建设内容与规模: 5、建设年限: 6、概算投资: 7、效益分析: 二、项目建设的必要性和条件 1、建设的必要性分析 2、建设条件分析:包括场址建设条件(地质、气候、交通、公用设施、征地拆迁工作、施工等)、其它条件分析(政策、资源、法律法规等) 3、资源条件评价(指资源开发项目):包括资源可利用量(矿产地质储量、可采储量等)、资源品质情况(矿产品位、物理性能等)、资源赋存条件(矿体结构、埋藏深度、岩体性质等) 三、建设规模与产品方案 1、建设规模(达产达标后的规模) 2、产品方案(拟开发产品方案) 四、技术方案、设备方案和工程方案 (一)技术方案

1、生产方法(包括原料路线) 2、工艺流程 (二)主要设备方案 1、主要设备选型(列出清单表) 2、主要设备来源 (三)工程方案 1、建、构筑物的建筑特征、结构及面积方案(附平面图、规划图) 2、建筑安装工程量及“三材”用量估算 3、主要建、构筑物工程一览表 五、投资估算及资金筹措 (一)投资估算 1、建设投资估算(先总述总投资,后分述建筑工程费、设备购置安装费等) 2、流动资金估算 3、投资估算表(总资金估算表、单项工程投资估算表) (二)资金筹措 1、自筹资金 2、其它来源 六、效益分析 (一)经济效益 1、销售收入估算(编制销售收入估算表) 2、成本费用估算(编制总成本费用表和分项成本估算表) 3、利润与税收分析 4、投资回收期 5、投资利润率 (二)社会效益 七、结论

建议书格式范文(共6篇)

篇一:建议书写作格式及范文 一、建议书的写作格式一般由标题、称呼、正文、结尾、落款几部分构成。 (一)标题标题一般在第一行中间写上“建议书”字样。有的建议书还写上所建议的内容,如“关于暑期中小学补课的建议书”。 (二)称呼建议书称呼要求注明受文单位的名称称呼或个人的姓名,要在标题下隔两行顶格写,后加冒号。 (三)正文建议书正文由以下三部分构成: 第一,要先阐明提出建议的原因、理由以及自己的目的、想法。这样往往可以使受文单位或个人从实际出发,考虑你的建议的合理性,为采纳你的建议打下基础。 第二,建议的具体内容。一般建议的内容要分条列出,这样可以做到醒目。建议要具体明白切实可行。 第三,提出自己希望采纳的想法,但同时也应谨慎虚心,不说过头的话,不用命令的口气。 (四)结尾结尾一般是表示敬意或祝愿的话。同一般书信相同。 (五)落款落款要署上提建议的单位或个人的称呼姓名,并署上成文日期。 二、建议书 建议书是个人、单位和有关方面,为了开展某项工作,完成某项任务或进行某种活动而倡议大家一起做什么事情,或提出合理化的意见、建议时使用的一种文体,也叫倡议书、意见书。 建议书是应用文的一种类型。其内容很广泛,像弘扬雷锋精神,开展精神文明活动,援助贫困山区孩子读书,开展工作拥军优属活动家等,都可以写建议书。 建议书是面对群体时,虽然也带有建议,但主要是宣传、鼓动对方去做,具有一定的号召性。建议书是面对领导和有关部门时,一般是中肯地提出自己对对方工作的意见和自己的建议,没有要求对方去做的意思。不具有号召性。建议书的格式和一般书信大体相同: 1、标题一般只写“建议书”三个字,有时为了突出建议的具体内容,可以写《关于×××的建议书》。题目要写在第一行的中间,字体要大些。 2、称呼提出的建议希望得到哪些人的响应,称呼就写那些人。要写在第二行顶格,后面加冒号。 3、正文就是建议的内容,从第三行空两格开始写。先写提出建议的理由,再写建议的具体内容。如果内容较多,可以分条写。 4、署名在右下角写出建议人的姓名,即提出建议的团体的名称或个人的名字。 5、日期写在建议人姓名的下方。 写建议书具体应该注意以下几点: 从实际出发,实事求是 提意见、写建议要根据具体问题、实际需要和可能的条件,而不能凭空想像,不着边际地提,这样才有助于改进工作方法,开展有益活动。 说话得体,有分寸 首先,所提意见和建议应当比较准确、比较合理,并且要掌握一定的分寸。意欲晓之以理,首先动之以情,这样写,意见容易被接受,从而到达目的。其次,要使意见和建议在现实条件下行得通,不应该说过头话,也不应该提过高的要求,否则就无济于事了。 内容具体、清楚、实在 建议书的核心部分是所提建议的内容。因此,写建议书不管是分条开列,还是不列条款,都应当把建议的内容写具体、写清楚,使人一目了然。这样领导、机关、单位和个人在考虑和采纳的时候才容易落到实处。切记不要说空话、套话,不要抽象、笼统。

数据仓库设计文档模板

数据仓库设计与实现 学号 128302106 姓名江晨婷 成绩 教师张丹平 二O一五年四月

数据仓库建设方案设计与实现 摘要:本文以博士学位调查为基础,创建方案,设计与实现数据仓库,通过对当前各种主流数据仓库软件在性能、价格等方面的对比,充分考虑统计业务、单位数量等实际情况,本系统决定采用SQL Server 2005数据仓库软件来构建综合信息分析系统的数据仓库。 关键词:数据仓库;联机分析;数据挖掘;博士学位 一、概述 数据仓库的设计一般从操作型数据开始,通常需要经过以下几个处理过程;数据仓库设计——数据抽取——数据管理。 1.数据仓库设计 根据决策主题设计数据仓库结构,一般采用星型和雪花模型设计其数据模型,在设计过程中应保证数据仓库的规范化和体系各元素的必要联系。 2.数据抽取 根据元数据库中的主题表定义、数据源定义、数据抽取规则定义对异地异构数据源进行清理、转换、对数据进行重新组织和加工,装载到数据仓库的目标库中。 3.数据管理 数据管理分为目标数据维护和元数据维护两方面。目标数据维护是根据元数据为所定义的更新频率、更新数据项等更新计划任务来刷新数据仓库,以反映数据源的变化,且对时间相关性进行处理。元数据是数据仓库的组成部分,元数据的质量决定整个数据仓库的质量。当数据源的运行环境、结构及目标数据的维护计划发生变化时,需要修改元数据。 二、博士学位授予信息年度数据统计分析 1.按主管部门统计 从主管部门的角度,分析在一个时间段(年)内,各主管部门所授予的博士学位信息统计。可回答如“2008,由某部门主管的,博士学位授予一共有多少,其平均学习年限是多少,脱产学习的有多少人?”等问题。具有表格和图形两种方式来展示分析结果。典型报表格式如表1所示

数据仓库系统建设方案详细

河北省工商银行 数据仓库系统建设方案 建 议 书

北京世纪明日网络科技有限公司 二零零零年三月 河北省工商银行数据仓库系统建设方案 目录 第一章前言 1.1数据仓库发展史 1.2竞争日趋激烈的金融市场 1.3中国专业银行面临的挑战 1.4中国专业银行实施数据仓库的意义 1.5中国专业银行实施数据仓库已具备的条件 第二章数据仓库总体概述 2.1 数据仓库基础 2.2 数据仓库技术概述 2.3 一个可扩展数据仓库的基本框架

2.4 一个数据仓库实施流程 第三章系统体系结构设计 3.1系统设计指导思想 3.2 方案总体框架图 3.3 系统体系结构设计 3.4 系统方案的组成 第四章银行数据仓库的建设 4.1 面向应用的OLTP系统和面向主题的OLAP系统 4.2 个性化服务的定义 4.3 业务探索/业务发掘 4.4 建立市场客户信息基础 4.5 利用数据仓库实现的基本模块 4.6 更高层次的开发应用 4.7 综合信息发布 第五章方案实施建议 5.1 开发模式 5.2 组织机构 5.3 项目实施进程

5.4 项目进度计划 第六章产品报价 6.1 软件产品报价 6.2 硬件产品报价 6.3 项目开发实施费用 第一章前言 1.1 数据仓库发展史 相对于许多行业而言,信息处理技术还是一门新兴的技术,但是其发展速度却几乎是最快的。随着计算机硬件技术的飞速发展,软件技术也是日新月异。 许多企业和机构已经建立了相对完善的OLTP(联机事物处理)系统。随着时间的推移,这些系统中积累了大量的历史数据,其中蕴含了许多重要的信息。通过对这些历史数据的分析和综合处理,可以找到那些对企业发展至关重要的业务信息,从而帮助有关主管和业务部门作出更加合理的决策。70年代中期出现的MIS(管理信息系统)实际上就是在这种背景下产生的。 但MIS具有极大的局限性。首先,它是按预先定义好的流程对数

数据仓库建设步骤

数据仓库建设步骤 1.系统分析,确定主题 确定一下几个因素: 操作出现的频率,即业务部门每隔多长时间做一次查询分析。 在系统中需要保存多久的数据,是一年、两年还是五年、十年 用户查询数据的主要方式,如在时间维度上是按照自然年,还是财政年。 用户所能接受的响应时间是多长、是几秒钟,还是几小时。 2.选择满足数据仓库系统要求的软件平台 选择合适的软件平台,包括数据库、建模工具、分析工具等。有许多因素要考虑,如系统对数据量、响应时间、分析功能的要求等,以下是一些公认的选择标准: 厂商的背景和支持能力,能否提供全方位的技术支持和咨询服务。 数据库对大数据量(TB级)的支持能力。 数据库是否支持并行操作。 能否提供数据仓库的建模工具,是否支持对元数据的管理。 能否提供支持大数据量的数据加载、转换、传输工具(ETT)。 能否提供完整的决策支持工具集,满足数据仓库中各类用户的需要。 3.建立数据仓库的逻辑模型 具体步骤如下: 1)确定建立数据仓库逻辑模型的基本方法。 2)基于主题视图,把主题视图中的数据定义转到逻辑数据模型中。 3)识别主题之间的关系。 4)分解多对多的关系。 5)用范式理论检验逻辑数据模型。 6)由用户审核逻辑数据模型。 4.逻辑数据模型转化为数据仓库数据模型 具体步骤如下: 1)删除非战略性数据:数据仓库模型中不需要包含逻辑数据模型中的全部数据项,某些用于操作 处理的数据项要删除。 2)增加时间主键:数据仓库中的数据一定是时间的快照,因此必须增加时间主键。 3)增加派生数据:对于用户经常需要分析的数据,或者为了提高性能,可以增加派生数据。

4)加入不同级别粒度的汇总数据:数据粒度代表数据细化程度,粒度越大,数据的汇总程度越高。 粒度是数据仓库设计的一个重要因素,它直接影响到驻留在数据仓库中的数据量和可以执行的 查询类型。显然,粒度级别越低,则支持的查询越多;反之,能支持的查询就有限。 5.数据仓库数据模型优化 数据仓库设计时,性能是一项主要考虑因素。在数据仓库建成后,也需要经常对其性能进行监控,并随着需求和数据量的变更进行调整。 优化数据仓库设计的主要方法是: 合并不同的数据表。 通过增加汇总表避免数据的动态汇总。 通过冗余字段减少表连接的数量,不要超过3~5个。 用ID代码而不是描述信息作为键值。 对数据表做分区。 6.数据清洗转换和传输 由于业务系统所使用的软硬件平台不同,编码方法不同,业务系统中的数据在加载到数据仓库之前,必须进行数据的清洗和转换,保证数据仓库中数据的一致性。 在设计数据仓库的数据加载方案时,必须考虑以下几项要求: 加载方案必须能够支持访问不同的数据库和文件系统。 数据的清洗、转换和传输必须满足时间要求,能够在规定的时间范围内完成。 支持各种转换方法,各种转换方法可以构成一个工作流。 支持增量加载,只把自上一次加载以来变化的数据加载到数据仓库。 7.开发数据仓库的分析应用 建立数据仓库的最终目的是为业务部门提供决策支持能力,必须为业务部门选择合适的工具实现其对数据仓库中的数据进行分析的要求。 信息部门所选择的开发工具必须能够: 满足用户的全部分析功能要求。数据仓库中的用户包括了企业中各个业务部门,他们的业务不同,要求的分析功能也不同。如有的用户只是简单的分析报表,有些用户则要求做预 测和趋势分析。 提供灵活的表现方式。分析的结果必须能够以直观、灵活的方式表现,支持复杂的图表。 使用方式上,可以是客户机/服务器方式,也可以是浏览器方式。 事实上,没有一种工具能够满足数据仓库的全部分析功能需求,一个完整的数据仓库系统的功能可能是由多种工具来实现,因此必须考虑多个工具之间的接口和集成性问题,对于用户来说,希望看到的是一致的界面。 8.数据仓库的管理

建议书格式范文

建议书格式: 建议书是书信的一种,格式与一般书信大致相同: 1、有题目。可以写:“建议书”或“关于×××的建议书”。 2、开头顶格写称呼。 3、正文(正文由以下三部分构成:第一,要先阐明提出建议的原因、理由以及自己的目的、想法。这样往往可以使受文单位或个人从实际出发,考虑你的建议的合理性,为采纳你的建议打下基础。第二,建议的具体内容。一般建议的内容要分条列出,这样可以做到醒目。建议要具体明白切实可行。第三,提出自己希望采纳的想法,但同时也应谨慎虚心,不说过头的话,不用命令的口气) 4、在右下方写提出建议人的名称或名字。 5、在名称或名字下写日期。 注意:在写名称是要与正文隔几行,在右下边写上 范文:保护环境建议书 广大市民们: 地球,这位人类的母亲,曾是那样的美丽壮观,和蔼可亲。但是,由于我们的滥砍滥伐,由于我们的乱丢乱扔,由于我们随意毁坏自然环境,地球那头美丽的秀发变的稀稀疏疏,地球那饱满的身躯变的骨瘦如柴,地球那容光焕发的面孔变的皱皱巴巴,一条条“皱纹”刻在了“母亲”的脸上!为了让地球母亲展开那久违的笑容,我们应该注意我们身边的一些小毛病,一些大问题!为此,我想向大家发出一些保护环境的建议: 1、不乱丢乱扔,不随地吐痰,不在公共场所吸烟。 2、节约水电,出门时不要忘记关灯,洗完手请立即关水龙头。 3、要爱护树木花草,不要随便砍伐绿色树木,践踏草地。 4、不要使用塑料袋,减少白色污染。我们这个城市如果每天每人使用一个塑料袋,每天将产生5吨塑料垃圾! 5、不使用一次性筷子。或许你不曾想过,哪怕我们每一个人这辈子只用一双一次性筷子,全国也得砍掉15万棵生长了20年的大树。我国每年因生产一次性筷子消耗的林料就达200万立方米,这足以引发长江洪水泛滥! 以上是我提出的不大成熟的建议,这仅仅是我对保护环境尽一份微薄的力量。但是,如果我们大家每个人都为环保尽自己所能尽一份微薄之力,那么,世界将是多么的美好!行动起来吧,从我做起,从身边小事做起,让我们为建设一个环境优美的家园而共同努力! 五(1)中队全体队员 2012年07月9日

合作建议书范本

项目合作建议书 致:xxxxxx有限公司 首先感谢贵公司领导能在百忙之中阅读我公司的这份《项目合作建议书》,其次我谨代表 我公司全体员工,向贵公司已跨入全球五百强企业表示祝贺。 经我公司多方考察了解,贵公司现有主厂房汽机屋面做法为:汽机房钢屋架—檩条—压 型钢板底模—浇筑钢筋砼—找平层—保温层—找平层—防水层,每平方造价约为870元;化 水车间屋面做法为:现浇框架结构—吊装双t板—灌缝—找平层—保温层—找平层—防水层, 每平方造价在1300元-1500元;而且施工难度大、工期长。 我公司经长时间考察发现,近几年泡沫混凝土在建筑行业使用较为广泛,泡沫混凝土防 火保温板在各种大型厂房屋面中的使用越来越频繁。经我公司了解分析发现泡沫混凝板有如 下优点:①屋面板做法为:汽机房钢屋架—泡沫混凝土板(含檩条)—找平层—防水层。施 工工艺简单、工期短。②泡沫混凝土板容重较小,100mm厚的板容重约为0.6∽0.8kn/㎡,而 100mm厚钢筋砼板容重约2.5kn/㎡,泡沫混凝土板重量约为钢筋砼板重量的1/3.1∽1/4.2。 ③泡沫混凝土板导热系数小,屋面无需再做保温层。④经核算泡沫混凝土板每平方造价约为 300元(含檩条,不含屋架、防水层造价),现有汽机房砼屋面做法造价约为870元/㎡(不 含屋架、防水层造价),即一个4×330mw机组电厂汽机房屋面采用泡沫混凝土板(不含钢屋 架减少的钢量)可节省(870-300)×310.5×27=477.9万元。化水车间屋面每平方可节省1000 元左右。所以贵公司车间厂房采用泡沫混凝土板是十分经济的。 我公司经过长期努力,已于中国建筑材料科学研究院取得联系,并达成有关泡沫混凝土 技术秘密转让合作意向;中国建筑材科学研究院将长期为我公司提供关于泡沫混凝土技术服 务。因此,我公司准备 采购高科技、高性能设备,大批量生产泡沫混凝土板材。 我公司希望能得到贵公司支持,与贵公司达成长期合作意向,为贵公司提供泡沫混凝土 屋面板材及相关的技术服务。从而达到互利共赢,共同发展的目的。 再次感谢贵公司领导能认真阅读完我公司的这份《项目合作建议书》,希望贵公司能给我 公司这次机会,我公司全体员工将全力以赴,为贵公司提供最高质量的产品和最优质的服务。 祝:贵公司业绩蒸蒸日上,再创辉煌! 此致 敬礼! 2012年8月26日篇二:项目建议书范本 xxx“xxxx”市场项目 项目建议书 xxxxxxxxx 年月日 目录 一、项目总论 (2) (一)项目背景 (2) (二)项目介绍 (2) 二、项目分析 (3) (一)项目建设必要性 (3) (二)项目建设有利条件 (5) (三)项目建设思路 (5) (四)项目经营理念 (6) 三、项目改扩建规划及实施方案 (7)

关于建议书的格式

关于建议书的格式 【篇一:建议书写作格式及范文】 一、建议书的写作格式一般由标题、称呼、正文、结尾、落款几部 分构成。 (一)标题标题一般在第一行中间写上“建议书”字样。有的建议书还 写上所建议的内容,如“关于暑期中小学补课的建议书”。 (二)称呼建议书称呼要求注明受文单位的名称称呼或个人的姓名, 要在标题下隔两行顶格写,后加冒号。 (三)正文建议书正文由以下三部分构成: 第一,要先阐明提出建议的原因、理由以及自己的目的、想法。这 样往往可以使受文单位或个人从实际出发,考虑你的建议的合理性,为采纳你的建议打下基础。 第二,建议的具体内容。一般建议的内容要分条列出,这样可以做 到醒目。建议要具体明白切实可行。 第三,提出自己希望采纳的想法,但同时也应谨慎虚心,不说过头 的话,不用命令的口气。 (四)结尾结尾一般是表示敬意或祝愿的话。同一般书信相同。 (五)落款落款要署上提建议的单位或个人的称呼姓名,并署上成文 日期。 二、建议书 建议书是个人、单位和有关方面,为了开展某项工作,完成某项任 务或进行某种活动而倡议大家一起做什么事情,或提出合理化的意见、建议时使用的一种文体,也叫倡议书、意见书。 建议书是应用文的一种类型。其内容很广泛,像弘扬雷锋精神,开 展精神文明活动,援助贫困山区孩子读书,开展工作拥军优属活动 家等,都可以写建议书。 建议书是面对群体时,虽然也带有建议,但主要是宣传、鼓动对方 去做,具有一定的号召性。建议书是面对领导和有关部门时,一般 是中肯地提出自己对对方工作的意见和自己的建议,没有要求对方 去做的意思。不具有号召性。建议书的格式和一般书信大体相同: 2、称呼提出的建议希望得到哪些人的响应,称呼就写那些人。要 写在第二行顶格,后面加冒号。 3、正文就是建议的内容,从第三行空两格开始写。先写提出建议 的理由,再写建议的具体内容。如果内容较多,可以分条写。

数据仓库与数据挖掘课程设计报告书

目录 1. 绪论 (2) 1.1项目背景 (2) 1.2 提出问题 (2) 2 数据库仓库与数据集的概念介绍 (2) 2.1数据仓库 (2) 2.2数据集 (3) 3 数据仓库 (3) 3.1 数据仓库的设计 (3) 3.1.1数据仓库的概念模型设计 (3) 3.1.2数据仓库的逻辑模型设计 (3) 3.2 数据仓库的建立 (4) 3.2.1数据仓库数据集 (4) 3.2.2建立维表 (4) 4.数据挖掘操作 (5) 4.1数据预处理 (5) 4.1.1描述性数据汇总 (5) 4.2决策树 (5) 5、实验心得 (13) 6、大总结 (14)

1. 绪论 1.1项目背景 在现在大数据时代,各行各业需要对商品及相关关节的数据进行收集处理,尤其零售行业,于企业对产品的市场需求进行科学合理的分析,从而预测出将来的市场,制定出高效的决策,给企业带来经济收益。 1.2 提出问题 对于超市的商品的购买时期和购买数量的如何决定,才可以使销售量最大,不积压商品,不缺货,对不同时期季节和不同人群制定不同方案,使企业收益最大,通过数据挖掘对数据进行决策树分析,关联分析,顺序分析与决策分析等可以制定出最佳方案。 2 数据库仓库与数据集的概念介绍 2.1数据仓库 数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。 数据仓库是决策系统支持(dss)和联机分析应用数据源的结构化数据环境。

数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。 2.2数据集 数据集是指一种由数据所组成的集合。Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。 3 数据仓库 3.1 数据仓库的设计 3.1.1数据仓库的概念模型设计 概念模型的设计是整个概念模型开发过程的三阶段。设计阶段依据概念模型分析以及分析过程中收集的任何数据,完成星型模型和雪花型模型的设计。如果仅依赖ERD,那只能对商品、销售、客户主题设计成如图所示的概念模型。这种模型适合于传统的数据库设计,但不适合于数据仓库的设计。 3.1.2数据仓库的逻辑模型设计 逻辑建模是数据仓库实施中的重要一环,因为它能直接反映出各个业务的需求,同时对系统的物理实施有着重要的指导作用,它的作用在于可以通过实体和关系勾勒出企业的数据蓝图,数据仓库的逻辑模型设计任务主要有:分析主题域,确定要装载到数据仓库的主题、确认粒度层次划分、确认数据分割策略、关系模式的定义和记录系统定义、确认数据抽取模型等。逻辑模型最终设计成果包

相关文档