文档库 最新最全的文档下载
当前位置:文档库 › 基于神经网络集成的电信客户流失预测建模及应用_唐东波

基于神经网络集成的电信客户流失预测建模及应用_唐东波

基于神经网络集成的电信客户流失预测建模及应用_唐东波
基于神经网络集成的电信客户流失预测建模及应用_唐东波

2010年3月

(总第111期)

大众商务

Popu l a r Business

N o .3,2010(Cu m ulati v ely ,NO.111)

基于神经网络集成的电信客户流失预测建模及应用

唐东波

(华南理工大学,广东广州510640)

作者简介:唐东波(1983-)女,华南理工大学理学院概率论与数理统计专业,研究方向:数理统计及其应用

=摘 要>针对客户关系管理中对企业利润影响最大的客户流失问题的核心内容)))客户流失预测,利用数据挖掘技术,提出一种基于神经网络集

成算法的客户流失预测模型,并将实用的神经网络集成算法应用到电信客户的实际数据中,取得了很好的效果,并对结果进行了深入的分析与讨论。

=关键词>客户流失预测;数据挖掘;神经网络集成

Abstract :Cu sto m er chu rn p red icti on t hat is t he m ost i m portan t i ssues i n Custo m erR el ationsh i p M an age m en t .U si ng datam i n i ng m ethodology ,a custo m er chu rn

pred i ction m odel based on neu ral net work en s e m b l e w as pu t f or w ard and appli ed to t he actual data i n t h e tel eco mmun ications custo m ers ,and ach i eved very good re -su l ts ,and the resu l ts of t he i n -d epth anal ysis and d iscussion .

K ey w ords :custo m er chu rn pred icti on ;dat a m i n i ng ;neu ral net work en s e m b l e

中图分类号:F626 文献标识码:A 文章编号:1009-8283(2010)03-0152-02客户频繁流失是电信企业发展中所面临的一个严重问题,随着行业中的竞争愈来愈激烈和获得一个新客户的开支愈来愈大,保持原有客户的工作也愈来愈有价值,特别是如何挽留那些会发生流失的、给企业带来高额利润的客户。目前较为常用的一个解决此问题的方法是利用数据挖掘技术,它的分析方法是利用已知的数据通过建立数学模型的方法找出隐含的业务规则,对客户流失行为做出预测,分析出的影响流失属性更利于下一步的客户挽留工作。

用数据挖掘为工具分析客户流失问题,是我们研究客户流失问题所采取的角度。国内外在这方面所进行的研究工作比较多。应用到的主要算法包括回归分析[1],决策树[2]、神经元网络[3]、贝叶斯网络[4]、支持向量机[5]等。以决策树为基础的相关的算法可以揭示一些潜在的分类规律,因为决策树的每一次分裂都会直接用到一个分类变量。但是决策树对分类问题无法赋予每个样本不同的归属度,许多不同的样本却只能得到相同的归属度。回归分析与神经网络相关的算法可以计算出每个样本对于分类结果的归属度,但是分类过程对于使用者来讲却是一个/黑箱0。贝叶斯网络模型需要人为确定变量输入顺序和网络的初始结构,加入了人为的因素和先验知识的影响。

基于数据挖掘技术的客户流失分析由于起始的时间不长,大部分都只是试探性地建立简单的模型,有的还处于调研和可行性分析阶段,没有实际投入应用的产品。在实际应用中,这些模型并不具备很强的健壮性,准确率也不是很高,而且,随着数据量的激增,对模型的性能开销也越来越大。本文提出一种基于神经网络集成算法的客户流失预测模型,经实验验证,本方法适用于电信行业客户流失预测。

1研究方法

1.1客户流失的定义

大多数流失的定义为客户中断与公司的关系。文献[7]指出账户余额流失75%即为流失。本文从用户品牌、消费层次、流失方式等多个维度来将客户流失预测分析划分为多个模型,流失的定义为客户的账户余额减少75%(部分流失)或客户中断与公司的关系(全流失,如销户等)。确定模型的划分如图1所示(树型结构中的非叶节点为维度,分支为各个维度上的取值,叶节点为客户流失模型模型

):

图1 客户流失预测模型的划分

1.2神经网络集成方法介绍

1990年,H ansen 和S al a m on 开创性的提出了神经网络集成方法。1996年,S ollich 和K rogh[8]为神经网络集成下了一个定义,即/神经网络集成是用有限个神经网络对同一个问题进行学习,集成在某输入示例下的输出由构成集成的各神经网络在该示例下的输出共同决定0。神经网络集算法主要流程如图2所示

图2 神经网络集成算法流程示意图

1.2.1个体神经网络的生成

BP 神经网络的学习过程由两部分组成:正向传播和反向传播。当正向传播时输入信息经隐单元层处理后传向输出层,每一层神经元状态只影响下一层神经元状态。比较输出层的实际输出与期望的输出,若不同,则进入误差的反向传播阶段。将误差信号由原来的神经元连接通路返回,返回过程中逐层修改各层神经元连接的权值。权值不断调整以实现BP 神经网络的学习训练。

1.2.2Bagg i ng 技术

Bagg i ng 通过产生样本的重复Bootstrap 实例作为训练集,每回运行Bagg i ng 都随机地从大小为n 的原始训练集中抽取m 个样本作为此回训练的集合。Baggi ng 通过重新选取训练集增加了分量学习器集成的差异度,从而提高了泛化能力。

Bagg i ng 算法的原理如下:

给定一数据集L ={(X 1,y 1),,(X m ,y m )},基础学习器为h (X,L)。如果输入为X ,就通过h (X ,L)来预测y 。现在,假定有一个数据集序列{L k },每个序列都由m 个与L 从同样分布下得来的独立观察组成。任务是使用{L k }来得到一个更好的学习器,它比单个数据集学习器h (X,L )要强。这就要使用学习器序列{h (X,L k )}。对于分类问题,h (X,L )预测一个类j :{1,,,J},于是综合h (X ,L k )的一种方法是通过投票法。

Bagg i ng 算法的伪码描述如下:

输入:训练集S={(X 1,y 1),,,(X n ,y n )},,神经网络分类器M,训

152

练的最大轮数T 。

输出:集成预测模型(l )S ='Bootstrap s amp le fro m S //从初始的训练集中采用Bootstrap 方法抽取出m 个训练例组成子集S '

(2)C allM,get back a hypothesis h t :X v y//在S '上训练弱学习器,得到第t 轮的预测函数h t

(3)若t

(4)将各预测函数h 1,,,h I 集合使用投票法生成最终的预测函数h A (X)。

1.2.3投票法

投票法的基本思想是/少数服从多数0。对于输入X,M 个分量学习器会有M 个输出e i (x)=j i ,i=1,,,M 将每个分量学习器看成一票,e j (x)=j 表示第i 个分量学习器投标号j i 一票。投票规则为:若M 个学习器的结果在有超过a *M (0

成学习器的输出结果为,j 否则拒识。本文采用a=1

2

时,该投票规则为

多数投票。

2应用实例及结果分析

本文选取国内某地市电信运营商2008年8,9,10月份客户的特征属性数据作为神经网络输入变量。包括用户个人信息数据(入网时间、客户类型等)和用户行为数据(通话时长、通话次数、漫游次数、主叫网内对端号码数等)。2008年12月份的流失情况作为神经网络的输出,其中采用70%实际数据来训练神经网络建立模型,剩下30%的数据用于检验模型的效果。

为考察模型的效果,使用的用户个人信息和行为数据作为神经网络的输入变量,通过Baggi ng 技术和不同训练算法产生16个神经网络个体,对其简单加权平均建立神经网络集成模型,分别对前70%样本拟合和对30%后续样本预测,比较结果用来检验预测模型的效果。根据数理统计的基本原理,我们采用3个指标来检验模型的拟合和预测效果。引入以下3种统计指标:

1.命中率,即匹配记录的比例。其计算方式为(分位数中的匹配/分位数中的记录)@100%,即命中率=提取的客户中流失的数目/提取的人数。如下图3所示。

2.提升图,将每个分位数中匹配记录的百分比与在全部训练数据中匹配的百分比进行比较。其计算方式为(在分位数中的匹配/在分位数中的记录)/(全部匹配/全部记录),即提升率=命中率/总体的流失率。L ift 值是评估一个预测模型是否有效的一个度量。如下图4所示。

3.覆盖率=提取的客户中流失的数目/总体的流失的人数

图3 模型命中率曲

线

图4 模型L I FT 值曲线

从模型评估结果可以看出,模型的预测前5%的命中率为37.46%,提升率为 4.58,覆盖率为22.88%。从行业标准来看,模型已经达到了要求,可以投入使用。

4结语

客户流失数据最大的特点就是极不平衡。数据集中的流失客户只占总客户的5%左右,预测分类器可能会将只占很小部分的流失客户忽略,因为在训练数据集中同样占极少数的流失客户数据可能无法在训练分类器的过程中给分类器标识出来。本文通过集成学习算法的优势,重采样的策略,解决了这一问题,实例计算结果表明,该方法预测精度高,稳定性好。基于神经网络集成的客户流失预测模型在应用中,为了保证模型的正确性,还将定期对模型进行评估,当模型退化严重时必须重新建模。

参考文献:

[1]H arol d C ass ab,Doug l as L.M ac Lach lan .Interacti on fluen cy :a cus -to m er perf or m an ce m eas u re of m u l ti ch annel s erv i ce .I n ternational Jou rnal of Produ cti v i ty and P erf or m an ceM anage m en t ,2006,55:555-568

[2]CP W e,i IT Ch i u.Turn ing tel eco mm un i cati on s call det a il s t o churn

pred i cti on :a d at a m i n i ng approach .E xp ert Syste m s W it h App li ca -ti on s ,2002,23:103-112

[3]M ozer ,M.C.,W oln i e w icz ,R .,Gri m es ,D .B .,etc .C hurn redu c -ti on i n the w ireles s i ndu stry .Advan ces i n N eura l Infor m ati on Pro -cess i ng Syste m s ,2000,12:935-941

[4]郭明,郑惠莉,卢毓伟.基于贝叶斯网络的客户流失分析.南京

邮电学院学报,2005,25:79-83

[5]Y Zhao ,B L,i X L ,i W Li u,S Ren .Cu st om er C hurn Pred i cti on Us i ng

I m proved On e -C las s Support V ector M ach i ne .Lecture Notes i n C o m puter Science ,2005,3584:300-306

[6]HWANG H,J UNG T ,SUH E.An LTV m odel and cu sto m er seg -m entati on based on custo m er val u e :a case st udy on t he w irel ess t e-l eco mmun icati on i ndu stry [J ].Expert Syste m s w it h App li cati on s ,2004,26(2):181-188

[7]王伟钧,杨承师,杨晋浩.企业的知识发现与经营模式重组

[J].决策咨询通讯,2002,(50):25-26。[8]So lli ch P .K rogh A .

Learn i ng w i th E nse m b l es :H ow Overfitti ng

C anbe U s efu l [M ]//A dvan ces i n N eural In f or m ati on Processi ng Sys -te m s 8.C a m bridge ,M A :M I T P ress ,1996:190-196.

[9]B re i m an L.B aggi ng Perd icators .m ach i ne l earn i n g ,1996,24(2):

123-140

153

第四篇-电信客户流失影响因素与预测分析

电信客户流失影响因素与预测分析 一、引言 目前电信运营商面临着激烈的市场竞争。对电信运营商来说,客户即生命,如何保持现有客户是企业客户管理的重中之重。因此,电信运营商拥有的客户越多,作为主要成本的前期投资就会越大,企业的利润也就越大。客户资源对于电信运营商来说其意义不言而喻,电信运营商之间的竞争实际上就是对客户资源的竞争。可以说,未来的电信行业,得客户者得天下。 当今电信市场竞争激烈,运营商每月客户流失率在1%~3%,挽留将要流失客户,降低客 户流失率是近年来热门的研究领域。而数据挖掘技术是解决这一问题的有效途径,本文使用IBM Spss Clementine(IBN SPSS Modeler)进行数据挖掘与分析,深入了解电信客户流失的关键,以对该类客户的行为特性进行预警分析,采取针对性的措施改善客户关系,避免客户流失或者挽留客户。 二、问题分析 根据已有的结果——流失客户(在数据中直接有判别数据有没有流失的字段churn),寻找他们流失的原因,即流失客户的特征。通过数据处理,统合数据,根据以前拥有的客户流失数据建立基本属性、服务属性和客户消费数据与客户流失可能性的数据模型,找出其潜在的关系,分析出客户流失的因素,计算出客户流失的可能性,预测客户是否流失的可能性。 对于客户的基本数据、客户行为数据及消费数据,进行数据挖掘,研究已流失客户数据,从中找出先前未知的、对企业决策有潜在价值的知识和规则,发掘潜在流失客户,让企业适时把握住市场及客户动态,掌握客户流失的规律。 三、算法简介 3.1分类分析 分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构建模型,一般用规则或决策树模式表示。分类是数据挖掘的主要方法,分类模型能很好地拟合训练样本集中属性集与类别之间的关系,也可以预测一个新样本属于哪一类。分类技术已经在很多领域得到成功应用,如医疗诊断,客户流失预测,信用度分析,客户分群和诈骗侦测。常见的分类方法有贝叶斯分类(Bayesian),神经网络(neural networks),遗传算法(genetic algorithms)和决策树分类器(decision trees)。在这些

Logit模型预测客户流失 - 软件测试,数据分析

Logit模型预测客户流失 - 软件测试,数据分析Logit模型预测客户流失 一、logit模型 二、logit模型应用 三、案例说明 1. 案例背景 2. SAS实现 3. Spss Clementine实现 (1)装载数据 (2)数据清理 (3)模型建立 (4)模型评价 (5)预测 4.CLEMENTINE与SAS结果比较 一、logit模型 在一般线性模型中,因变量为一个连续变量,如建立一个GDP与进出口的线性模型,GDP为一个连续变量。但在实际工作中,因变量常常为分类变量,比如性别,要么是男性、要么是女性,又如本文要解决的,对电信客户是否流失的预测。这时可以用事件的发生概率P为因变量,以影响因素作为自变量,进行线性回归分析,那么此时因变量P的取值就必须是0-1之间,一般的线性回归分析就不能满足了,logit回归可以解决这个问题。

Logit回归属于概率非线性回归,假设在自变量作用下,某事件发生的概率为P,则该事件不发生的概率为1-P,P/(1-P)为发生于不发生概率之比,记为“优势”(odds),若对odds取自然对数,得 Logit(p)=ln(odds)=ln() 称为P的logit变换,则logit回归模型为 Logit(p)=ln()= 可以看出,当P在(0,1)之间变化时,对应的logit(p)在之间变化,这样自变量可在任意范围内取值。 自变量对因变量的作用大小常用“优势比”(odds ratio,简称OR)来描述。所谓优势比 是指两个优势之比。对于某些发生率很低的事件来说,优势比可以作为相对危险度(relative risk,RR)的近似估计,即 OR= 二、logit模型应用 Logit模型全称logistic模型,主要针对定性变量(分类、有序变量)进行建模。广泛应用在医学、通信、金融业,如客户分类、客户流失预测、寻找发病因素等。 三、案例说明 1. 案例背景

利用数据挖掘实现客户流失分析

利用数据挖掘实现电信行业客户流失分析 利用数据挖掘实现电信行业客户流失分析随着世界经济的全球化、市场的国际化和我国加入 WTO 步伐的加速,国际化的市场环境要求国内的公众电信运营企业在经营管理上向国外先进的电信运营企业看齐,以迎接电信运营业的国际化竞争。同时随着国家改革的深化,国内电信业的市场环境已渐趋合理且竞争将日益加剧。国内、国际电信业的如此态势,对公众电信运营企业的服务内容、服务方式、服务质量、经营管理以及服务意识,已提出了严峻的挑战。企业的经营模式和服务体系正以客户的价值取向和消费心理为导向,真正体现“创造需求”、“引导消费”的现代客户服务意识与理念。 在电信企业面向市场,面向国内外众多的竞争者,努力创造更高价值的同时,客户流失的不断增加,客户平均生命周期的不断缩短严重影响了电信企业的发展。那么,在激烈的市场竞争和不断变化的市场需求面前,如何最大程度的降低客户的流失率呢?常用的方法之一就是利用数据挖掘技术。 数据挖掘技术是目前数据仓库领域最强大的数据分析手段。它的分析方法是利用已知的数据通过建立数学模型的方法找出隐含的业务规则,在很多的行业已经具有成功的应用。在电信行业的应用领域主要有客户关系管理,客户欺诈分析,客户流失分析,客户消费模式分析,市场推广分析等。 那么,在客户流失分析系统中,如何应用数据挖掘技术呢?主要方式是根据以前拥有的客户流失数据建立客户属性、服务属性和客户消费数据与客户流失可能性关联的数学模型,找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系,并给出明确的数学公式。只要知道客户属性、服务属性和客户消费数据,我们就可以计算出客户流失的可能性。市场/销售部门可以根据得到的数学模型随时监控客户流失的可能性。如果客户流失的可能性过高,高于事先划定的一个限度,就可以通过多种促销手段提高客户的忠诚度,防止客户流失的发生,从而可以大大降低客户的流失率。基于严格数学计算的数据挖掘技术能够彻底 改变以往电信企业在成功获得客户以后无法监控客户的流失,无法实现客户关怀的状况,把基于科学决策的客户关系管理全面引入到电信企业的市场/销售工作中来。通常一个完整的数据挖掘过程由业务问题定义,数据选择,数据清洗和预处理,模型选择与预建立,模型建立与调整,模型的评估与检验,模型解释与应用等多个步骤组成。这里我们以个人客户流失为例说明各个步骤的功能。 1.业务问题的定义 业务问题的定义要求非常明确。任何不明确的定义都会严重影响模型的准确和应用时的效果。例如:在客户流失分析系统中,需要明确客户流失的定义。在客户流失分析中,主要有两个核心的变量: 1.财务原因/非财务原因; 2.主动流失/被动流失。客户的流失利用数据挖掘实现电信行业客户流失分析类别根据这两个核心变量可以分为四种。其中自愿的、非财务原因的流失客户往往是高价值的、稳定的客户。他们会正常的支付自己的服务费用,并对市场活动有所响应。所以这种客户才是我们真正想保持的客户。而真正在分析客户流失的状况时,我们还必须区分公司客户与个人客户,不同服务的贡献率,或者是不同客户消费水平流失标准的不同。举例来说,对于用一种新服务替代原有服务的客户,是否作为流失客户?又或者,平均月消费额为 2000

车险客户流失分析方法

车险客户流失分析预测 通过建立一个关于保险客户流失的预测模型,可以分析出主要有哪些因素导致他们想要退保并可以有针对性的挽留那些有退保倾向的客户,进而节约开支。客户流失预测考虑的主要因素如下: (1)客户购买频率:客户购买保单的频率越高,说明流失率低;反之流失率高; (2)客户付费历史:交纳保费方式,有没有过欠费历史,欠费多久才补缴保费等对客户流失都具有影响; (3)客户自然属性:教育程度,职业,家庭人口,收入等等; (4)客户工作的变化:包括工作性质的变化,工资的变化,职位的变化等等; (5)客户理赔处理情况:理赔的迅速、准确就会降低客户流失率,反之会提高客户流失率; (6)竞争对手促销策略:如果竞争对手采取新的促销策略,那么就会提高客户流失率。

利用数据挖掘中的分类方法建立客户流失分类预测模型对潜在流失客户进行分析预测。分类方法是一种有监督的学习方法,它通过在客户样本数据集上建立预测模型,得到区分客户是否具有流失倾向的预测模型,预测客户未来的流失倾向。 该类研究主要应用了以下分类方法:支持向量机、人工神经网络、Logistic回归、贝叶斯网络、决策树等。 决策树模型 决策树模型 保险客户流失预测考虑主要因素可以选择决策树的方法进行客户流失的预测,选择这种方法的原因是因为这种方法得出的模型可以很容易的被人们理解。尽管其他的一些数据挖掘技术,比如神经网络也可以产生很好的预测模型,但是这些模型很难理解。当用这些模型作预测分析的时候,很难对客户流失原因有深入的了解,更得不到任何对付客户流失的任何线索。如果附加其他算法,过程会比较复杂。 在客户流失趋势的预测上,利用信息论中的信息增益赖寻找数据库中具有最大信息量的字段,作为决策树的一个节点,再根据字段的不同取值建立树的分支;再每个分支子集中重复建立树的下算法是相同的,不过在运用的场景上不同而已。通过决策树预测,可以发现特征客户群的流失比例,从而对具有相似特征的客户预测其流失趋势。为了挽留那些客户,保险公司可以有针对性的采取措施,保护自己的客户,有效的防止客户流失。基本原理是这样的,数据挖掘工具会先根据保险公司客户的基本资料进行划分,产生若干细分群,每个细分群都会有一些特征,比如客户持有的保单类型、客户教育背景等等。根据历史记录,某个细分群中,会有三个客户数。一个是该群中的客户总数T,一个是现在还活动的客户数A,最后一个是已经离去的客户数L。那么该群的客户流失率就可以用I=L/A来计算获得。 这样通过客户特征将他们分属于不同的决策树树叶中,就可以估算出他们的流失率,即流失趋势,同时,可以找出关于客户流失的主要特征。 C4.5算法的决策树构造和剪枝方法 此方法分为了两个部分:第一部分是决策树的建造过程,第二部分是决策树的剪枝过程。

第四篇-电信客户流失影响因素与预测分析教学教材

第四篇-电信客户流失影响因素与预测分析

电信客户流失影响因素与预测分析 一、引言 目前电信运营商面临着激烈的市场竞争。对电信运营商来说,客户即生命,如何保持现有客户是企业客户管理的重中之重。因此,电信运营商拥有的客户越多,作为主要成本的前期投资就会越大,企业的利润也就越大。客户资源对于电信运营商来说其意义不言而喻,电信运营商之间的竞争实际上就是对客户资源的竞争。可以说,未来的电信行业,得客户者得天下。 当今电信市场竞争激烈,运营商每月客户流失率在1%~3%,挽留将要流失客户,降低客户流失率是近年来热门的研究领域。而数据挖掘技术是解决这一问题的有效途径,本文使用IBM Spss Clementine(IBN SPSS Modeler)进行数据挖掘与分析,深入了解电信客户流失的关键,以对该类客户的行为特性进行预警分析,采取针对性的措施改善客户关系,避免客户流失或者挽留客户。 二、问题分析 根据已有的结果——流失客户(在数据中直接有判别数据有没有流失的字段churn),寻找他们流失的原因,即流失客户的特征。通过数据处理,统合数据,根据以前拥有的客户流失数据建立基本属性、服务属性和客户消费数据与客户流失可能性的数据模型,找出其潜在的关系,分析出客户流失的因素,计算出客户流失的可能性,预测客户是否流失的可能性。 对于客户的基本数据、客户行为数据及消费数据,进行数据挖掘,研究已流失客户数据,从中找出先前未知的、对企业决策有潜在价值的知识和规则,发掘潜在流失客户,让企业适时把握住市场及客户动态,掌握客户流失的规律。

三、算法简介 3.1分类分析 分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构建模型,一般用规则或决策树模式表示。分类是数据挖掘的主要方法,分类模型能很好地拟合训练样本集中属性集与类别之间的关系,也可以预测一个新样本属于哪一类。分类技术已经在很多领域得到成功应用,如医疗诊断,客户流失预测,信用度分析,客户分群和诈骗侦测。常见的分类方法有贝叶斯分类(Bayesian),神经网络(neural networks),遗传算法(genetic algorithms)和决策树分类器(decision trees)。在这些分类方法中,决策树分类器在大规模的数据挖掘环境中已经获得了最为广泛的应用。 3.2决策树演算法 决策树演算法是在进行数据挖掘时经常使用的分类和预测方法。 一个决策树的架构,是由三个部分所组成:叶节点 (Leaf Node)、决策节点 (Decision nodes) 以及分支。决策树演算法的基本原理为:通过演算法中所规定的分类条件对于整体数据进行分类,产生一个决策节点,并持续依照演算法规则分类,直到数据无法再分类为止。 3.3决策树演算法的比较 决策树演算法依据其演算原理以及可适用分析数据类型的不同延伸出多种决策树演算法。在 IBM SPSS Modeler 中,主要提供了四种常用的决策树演算法供使用者选择,分别为:C5.0、CHAID、QUEST 以及 C&R Tree 四种。使用者可依据数据类型以及分析需求的不同,选择适当的决策树演算法进行分析。虽

水土流失预测的常用计算方法

浅谈水土流失预测的常用计算方法 朱荣华 (乐清市水利水电建筑勘测设计院) 摘要:水土流失作为一项世界性的研究课题,一直受到世界各国的重视,长期以来,在其基础理论方面开展了大量的研究,并取得了有益的成果。水土流失预测是水土流失问题研究中很重要的内容,其预测方法也很多,常用的有通用土壤流失方程法、类比法、分类分级法、流失系数法等。在我省由于各地方自然条件、地理环境等存在很大差异,采用各种预测方法对水土流失进行预测时,必须确定该方法是最符合本地区实际情况的,这将直接影响到水土流失量数据的精确性,因此对预测方法和计算公式的选择至关重要。 关键词:水土流失预测计算公式侵蚀模数 水土流失与当地自然条件和人类活动密切相关,水土流失的影响因素包括自然因素和人为因素两个方面,其中自然因素主要有气候(降雨强度)、地形(坡长、坡度)、植被状况、地质构造和土壤类型等诸因素,人为因素主要表现为在工程建设过程中改变原有地形(坡长、坡度),破坏原有植被,使地表裸露,削弱其原有的蓄水保土功能,并产生新的水土流失,从而增加水土流失量。 水土流失作为一项世界性的研究课题,一直受到世界各国的重视,长期以来,在其基础理论方面开展了大量的研究,并取得了有益的成果。水土流失预测是水土流失问题研究中很重要的内容,其预测方法也很多,常用的有通用土壤流失方程法、类比法、分类分级法、流失系数法等。在我省由于各地方自然条件、地理环境等存在很大差异,采用各种预测方法对水土流失进行预测时,必须确定该方法是最符合本地区实际情况的,这将直接影响到水土流失量数据的精确性,因此对预测方法和计算公式的选择至关重要。 1水土流失预测常用计算公式 1.1通用土壤流失方程

SPSS Modeler 预测电信客户流失案例

Modeler 帮助电信运营商预测客户流失案例 本文主要通过运用IBM SPSS Modeler 中C5.0 节点所具有的特殊算法对电信客户的属性特征进行分析,得出流失客户的基本特征,以帮助企业管理者对该类客户的行为特性进行预警分析,采取针对性的措施改善客户关系,避免客户流失或者挽留客户,达到亡羊补牢的效果 引言 目前电信运营商面临着激烈的市场竞争。对电信运营商来说,客户即生命,如何保持现有客户是企业客户管理的重中之重。因此,电信运营商拥有的客户越多,作为主要成本的前期投资就会越大,企业的利润也就越大。客户资源对于电信运营商来说其意义不言而喻,电信运营商之间的竞争实际上就是对客户资源的竞争。可以说,未来的电信行业,得客户者得天下。 数据挖掘在电信领域有着广泛的应用:计费分析、客户细分、电话欺诈、客户流失预警分析等等。客户流失预警分析是通过数据挖掘,发现和分析出客户的许多属性特性和行为特征,从而找到流失客户的特征,为企业挽留这类客户提供决策参考。 本文主要通过运用IBM SPS Modeler 中C5.0 节点所具有的特殊算法对电信客户的属性特征进行分析,得出流失客户的基本特征,以帮助企业管理者对该类客户的行为特性进行预警分析,采取针对性的措施改善客户关系,避免客户流失或者挽留客户,达到亡羊补牢的效果。 数据准备 读入数据源 读入电信客户数据,数据有多达42 个字段,其中包含一些客户个人信息,例如年龄、婚姻状况、地址、收入、教育程度、行业、退休、性别、居住地和客户类别,还包含一些客户使用电信服务信息,例如使用电信服务时间,是否开通无线服务,是否开通语音信箱服务,是否开通亲情号服务,以及上月基本话费,上月长话费,上月上网费,累计基本话费,累计长话费,累计上网费等等。将流失字段churn 角色设置为目标。将所有其他字段的角色设置为输入。 图 1.数据源

移动运营商的客户流失管理案例分析报告

移动运营商的客户流失管理案例分析 发布时间:20070427 作者:转载出处:C114 录入:雷 1. 问题的提出: 近十年来我国电信业以3倍于GDP的速度增长,成为国民经济支柱产业中增长速度最快的行业之一。电信业的急速增长在很大程度上是由电信服务业中移动通讯市场的急速发展所推动的。但是,随着市场的拓展和竞争,移动通讯业也遇到了一些问题,如代理费用的升高和宣传费用的升高,这使发展新客户的难度增加、收益率下降。 价值客户不仅是电信企业的宝贵资源,也是其竞争对手不断争取的对象。电信企业的客户流失非常严重。据某运营商的统计,该运营商的移动客户在2004年1-10月平均每月离网400万户,月平均流失率达4.7%。其他运营商的客户流失率也居高不下。 根据美国市场营销学会顾客满意手册的统计数据表明,吸引一个新顾客所耗费的成本大概相当于保持一个现有客户的5倍。 这使得移动运营商不得不关注客户流失管理,以采取有力措施防止客户流失。 2.中国移动-客户流失管理的支撑系统和策略 中国移动通信主要经营移动话音、数据、IP电话和多媒体业务,其网络规模和客户规模列全球第一。截止到2006年11月底,客户总数已达2.964亿户。 2.1.支撑系统 中国移动已经形成了完整的业务支撑体系,由BOSS系统、经营分析系统(数据仓库)和支撑网网管系统三部分组成。经营分析系统已经成为市场经营过程(包括客户流失管理)的重要支撑环节。

2.1.1.经营分析系统建设概述 从2001年开始规划,2005年底建成世界最大的数据仓库(超过842TB容量),2006年7月容量已达1614TB;应用了OLAP、数据挖掘技术;提高了企业内部数据的标准化程度,有统一的逻辑模型、统一的指标解释;方便指标、报表、即席查询;与BOSS系统进行了互动。 中国移动数据仓库系统的分级结构 2.1.2.经营分析系统的意义 分析内部数据资源,理顺企业管理流程,提升管理模式;提升中国移动的精细化营销能力,降低营销成本(客户营销/服务从地毯式轰炸转向精确式打击)。例如:某地区真实流失人数190人(总样本的6.13%),不用模型就要对1455人(6.13%)做市场活动;采用了流失模型后,仅需要对712人(3.00%)做市场活动。 2.1. 3.经营分析系统的经济效益 中国移动经营分析系统取得了较为显著的经济效果,某个单项的应用就可以带来显著的经济效益:

基于商务智能的客户流失预测模型与算法研究

基于商务智能的客户流失预测模型与算法研究客户流失管理是许多行业关注的一个重要问题,近年来,以传统统计学方法和人工智能方法为基础,客户流失预测研究取得了丰富的研究成果,但尚存许多值得研究的问题。商务智能的崛起为客户流失预测的研究提供了新的思路。本文在商务智能理论和客户关系理论框架下,对现有客户流失预测模型结构进行修订,提出了新的预测模型结构。然后,以新的预测模型结构为基础建立了客户流失策略管理模型、客户流失特征提取与属性选择方法、客户流失预测模型,对电信业的客户流失预测问题进行了实证考察,从一个新的角度加深了对客户流失的规律理解。 最后,对控制客户流失的策略进行了研究。现总结如下一、提出一种新的客户流失预测模型结构,以一种崭新的思路研究客户流失问题。根据客户数据的特点和现用预测方式的不足,采用特征提取、属性选择、预测模型设计的预测新思路来研究客户流失问题。通过对新模型结构实现算法和实证的研究,证明了新模型结构比现用模型结构更加有效。 二、应用基于企业竞争的Delta策略模型,提出一种用于电信业的客户流失管理策略模型(CMSM)。通过使用某电信企业客户流失数据集,对CMSM进行了验证。其结果表明,该模型描述了客户流失的原因且包含了与企业竞争策略相关的主要预测因子,从而使其实际应用更易控制。三、利用特征提取和指标属性选择方法,对电信业客户流失预测进行实证分析。 主要结论是1、将核主成分分析(KPCA)引入到客户流失预测中,提出了相应的特征提取算法,将KPCA与Logistic回归结合,设计了预测模型。对某电信公司客户流失预测的实证结果表明,该方法获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度区间和Kappa,高于原始属性集和主成分分析(PCA)特征提取法。这表明KPCA能提取客户数据的非线性特征,是研究客户流失预测问题的有效方法。2、将信息增益(IG)引入到客户流失预测中,提出了相应的属性选择算法,将IG与神经网络(NN)结合,设计信息增益神经网络(IGNN)预测模型。 对某电信公司客户流失预测的实证结果表明,该方法获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度

顾客流失的预测分析

5 您能预测哪些客户有可能流失吗? 本章中,我们将阐述可预测哪些客户在不久的将来可能会从您公司流失的数据挖掘方 法,电信业务常将这种方法称为客户流失预测。 如今,电信业务市场日渐成熟,电信公司也意识到主动性客户关系管理的重要性,从而 非常关注对现有客户服务,即如何维系重要客户,以及怎样使之为公司带来更丰厚的利 润? 通过数据挖掘,您可以根据客户历史数据获得数据挖掘模型,从而生成公司很可能流失 的客户列表。最终,这将为您制订有效的市场营销战略提供有价值的业务洞察力,以防 止公司客户的流失。 本章所阐述的客户流失预测过程是以采用数据挖掘方法的预测建模为基础的,包括对每 个客户的流失可能性的预测,以及对可能流失客户及不会流失客户的分类。 73

5.1 业务需求 客户流失预测通常因其市场饱和度和动态市场变化等典型市场特征而成为电信公司首 要考虑的问题。由于电信市场日趋饱和,所以获取新客户的成本比留住现有客户群要昂 贵得多,并且竞争对手、技术,以及法律法规等动态市场变化更容易使客户流失到其他 公司。 5.1.1 数据挖掘的作用何在? 客户流失管理要求对客户行为具有良好的了解。首要问题是要弄清楚哪些客户将会从公 司流失,以及哪些客户会给公司带来利润。为防止客户流失,公司需要采取的首要措施 是在客户流失到其他公司前掌握客户行为,并努力找到客户流失的行为模式,这样公司 就可以提前采取一些规避措施。您可以通过简单的查询方式、OLAP 分析,或仅根据经 验来了解客户行为。但是,在把握与客户流失相关的客户行为的过程中,数据挖掘起着 极其重要的作用,而这些客户行为隐藏在诸如呼叫事务等庞大的数据集中。应当建立合 适的数据挖掘模型来识别客户流失行为模式,并为客户提供适当的产品和服务以防止流 失。在以下章节中,我们将阐述如何应用数据挖掘方法来防止电信企业的客户流失现象, 以及如何将其应用到您的 CRM 系统中。 5.1.2 起点? 该通用方法的第一步是把您要提出的业务需求转换成一个或多个可通过数据挖掘解答 的问题。 客户流失预测是一种不断变化的过程,而非单一事件。客户流失预测与公司的客户保持 过程密切相关。客户保持过程涉及三个方面: 明确哪些客户可能会流失。 确定可能流失的客户中您需要保留哪些客户。 开发客户保持策略(开展客户保持活动)以防止好这些客户流失。 作为客户保持过程的基础,客户流失预测对公司而言是一件非常有意义的工作。然而, 客户流失预测所面临的挑战在于,如何预测未来的客户行为,以及如何根据这一预测针 对客户采取相应的措施。 74

一种确定客户流失的方法和系统

一种确定广电客户流失的方法和系统 作者:胡玉婷袁昊程 版本:v1.0 文档创建日期:2013年9月11日 最后修改日期:2013年9月11日 1.本发明要解决的技术问题是什么? 进入21世纪以来,随着电信与信息技术的飞速发展,在“三网融合”的大趋势下,广电运营商面临着重大挑战,同时也是一次重大机遇。与其它运营商相比,有线运营商在视频传播领域具有资源、技术等全方位的优势,但随着时间的推移和科技的发展,这种优势将会不断弱化,全面的竞争将不可避免。而且对于广电运营商而言,注册客户数动态增长,在大量客户入网的同时,又有大批客户离网流失,业务与收入总量增长相对趋缓,导致出现“增量不增收”现象。从传统意义上讲,发展一个新客户所支出的费用是保留一个老客户的五倍。因此,分析客户流失原因,吸引潜在客户入网,增加现有客户满意度,减少客户流失概率,提高客户消费水平,充分占有市场,是广电运营商在激烈市场竞争中制胜的关键。那么如何保留当前客户资源,采取措施挽留将要流失的客户,降低客户流失率,并为之提供有差别的服务,已成为广电行业目前亟需解决的问题。 2.详细介绍技术背景,并描述已有的与本发明最相近似的技术方案 广电行业中,客户流失是指客户在连续一段时间内发生不同程度的停止贡献价值,甚至拖欠应收费用的行为。客户流失分析是指使用多角度的客户数据进行分析,提炼出已流失和预流失客户的行为特征,利用数据挖掘技术建立客户流失模型,并将流失模型应用在实际运营中,对客户在未来一段时期发生流失的概率进行预测,并输出流失可能性较大的客户清单,从而能提供给CRM 等相关系统做事前的维系挽留工作,降低客户的离网率,减少企业的损失。目前已经有诸多解决客户流失分析的数据挖掘技术方案,主要分为如下几类: 1.决策树算法,这样的系统架构相对简单,系统整体运行效率易于保障。 2.神经网络算法 3.逻辑回归算法

电信企业客户流失及忠诚度分析

东华大学研究生课程论文封面 教师填写: 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的课程论文,是本人独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。 论文作者签名: 注:本表格作为课程论文的首页递交,请用水笔或钢笔填写。

目录 1 引言 (1) 2 数据理解 (1) 3 数据准备 (4) 4 预测模型的建立 (5) 5 模型评估及客户特征分析 (6) 6 客户忠诚度的分析 (8) 7 结论 (12)

电信企业客户流失及忠诚度分析 王丹丹 (东华大学,管理科学与工程,2150863) 摘要:近年来国内电信业的分割、电信体制的激烈变革,竞争的急速加剧使得各电信企业在开拓市场、发展客户的同时,同样注重对老客户的挽留,预测客户流失因素,如何保持现有的客户吸引更多的潜在客户,是电信企业面临的重要问题 本文主要在已知数据的基础上利用数据挖掘中的决策树、神经网络以及Logistic 回归算法具体在电信业客户流失分析中的应用。 关键词:客户流失、决策树、神经网络、客户忠诚度 1 引言 2001年开始,中国电信行业就开始规划和实现经营分析系统,初衷就是建立数据仓库及基于数据仓库之上的数据分析和应用,其中主要包含两个主题——流失分析和交叉销售,而之前的相关杂志也发表了很多技术文章,但当时整个电信行业主要以中国移动为主,竞争压力并不大,业务人员更关注的是开拓市场和发展客户,对客户流失问题的关注很少。但2011年之后,电信行业不断竞争,所以各大公司反过头来又做客户流失,意识到挽留一个老客户要比吸引一个新客户对公司的价值会更大。因此,现在移动、联通等电信行业都会付出很大努力来尽量防止客户流失增加客户忠诚度。本文的工作正是基于此为背景通过分析客户的基本数据、交易数据和行为模式,通过spss modeler14.0利用决策树、神经网络、等数据挖掘技术,建立客户流失预测模型,并在此基础进行初步的流失原因分析和客户流失特征,给企业以有效的建议,并利用因子分析对客户的忠诚度进行分析。本文主要以下几个方面来展开:数据理解和准备、建立流失预测模型和模型的验证评估,最后是客户忠诚度分析。 2 数据理解 由于数据信息量比较大,变读入电信客户数据telco.sav,数据有多达42 个字段,我们有必要对原始数据进行探索,找出影响客户流失的最重要的因素,数据探索不是一个一次性的工作,它是一个分布的,需要反复试探和观察的过程。可以通过观察每一个变量与目标变量之间的相互关系作为变量选择和变量衍生的依据之一,并同时评估数据的质量,如检查空值、异常值、缺失值、噪声数据等。随着下面数据准备过程的不断进行。在数据探索中使用SPSS Modeler中的数据

客户流失预测数据挖掘方法对比分析

客户流失预测数据挖掘方法对比分析

客户流失预测数据挖掘方法对比分析 随着市场竞争的加剧,新技术的不断涌现,数据仓库、数据挖掘技术在客户关系管理的应用日益广泛和深入,其中客户行为分析、客户满意度评价、客户细分等是数据挖掘技术在客户关系管理的典型应用。近年来,客户挽留成为客户关系管理的重要内容,在诸多行业,保持高的客户挽留率对于公司利润的增长,超过公司规模、市场份额、单位成本等竞争因素的影响。学术界、企业界提出了以客户关系管理、关系营销为营销模式,以客户需求为核心价值,采用数据挖掘技术对客户流失行为进行分析建模,以期增强客户忠诚度、降低客户流失率。 1客户流失预测常用技术 客户流失分析与建模是应用数据挖掘技术新的应用。简言之,预测模型是从数据库中发现模式,用于对未来的预测。客户流失预测模型简单的说就是从客户数据仓库中提取一定量的训练样本,经过预处理后形成训练集,通过数据挖掘方法形成预测模型,通过预测模型对新样本进行分类,预测出客户是否具有流失可能性。 学术界开发、应用了基于数据挖掘方法与技术的客户流失预测模型,其中,最常用的有回归分析、决策树和神经网络。近两年,SVM,贝叶斯网络,粗糙集等也被用于客户流失预测建模,取得了不错的效果。 1.1回归分析 回归分析是一种广泛应用的预测技术,回归分析的目的是找出数值型变量间的依赖关系,并通过函数关系表现1

出来。回归分析的预测效果仅仅依赖于预测的变量与其他变量的关系,即模型的精确度取决于自变量和因变量的分布符合模型的程度,自变量与因变量的分布适合所选取的模型,则预测效果好,反之,预测效果差。根据自变量和因变量的函数关系,分为线性回归和非线性回归。客户关系研究中广泛应用的模型有Linear, Logistic等回归方程。 文献[1]应用Logistic回归对商业银行客户流失进行了分析预测,并以真实数据对模型进行了校验,结果表明模型具有良好的预测效果。文献[2]应用Logistic模型研究了客户生命周期价值及客户流失,研究发现,相比决策树和神经网络技术而言,Logistic模型更适合对客户流失的分析和预测,但同时作者也指出,预测性能受诸多参数因素的影响,比如神经网络参数的设置及训练集的选择,只能表明他们的训练样本更适合Logistic来建模。文献[3]指出,回归分析在客户流失预测中的主要缺点是对训练样本的要求,并且不能以符号化或易于理解的形式直观地表现隐含的模式。 1.2决策树 决策树是一种流行的分类算法,具有学习快速块、分类准确率高、分类结果表现直观等特点。决策树的构造包括两个阶段:通过训练集生成决策树;对生成的决策树进行剪枝。应用决策树对新样本进行分类时,从树根节点开 1

客户流失预测数据挖掘方法对比分析

客户流失预测数据挖掘方法对比分析 随着市场竞争的加剧,新技术的不断涌现,数据仓库、数据挖掘技术在客户关系管理的应用日益广泛和深入,其中客户行为分析、客户满意度评价、客户细分等是数据挖掘技术在客户关系管理的典型应用。近年来,客户挽留成为客户关系管理的重要内容,在诸多行业,保持高的客户挽留率对于公司利润的增长,超过公司规模、市场份额、单位成本等竞争因素的影响。学术界、企业界提出了以客户关系管理、关系营销为营销模式,以客户需求为核心价值,采用数据挖掘技术对客户流失行为进行分析建模,以期增强客户忠诚度、降低客户流失率。 1客户流失预测常用技术 客户流失分析与建模是应用数据挖掘技术新的应用。简言之,预测模型是从数据库中发现模式,用于对未来的预测。客户流失预测模型简单的说就是从客户数据仓库中提取一定量的训练样本,经过预处理后形成训练集,通过数据挖掘方法形成预测模型,通过预测模型对新样本进行分类,预测出客户是否具有流失可能性。 学术界开发、应用了基于数据挖掘方法与技术的客户流失预测模型,其中,最常用的有回归分析、决策树和神经网络。近两年,SVM,贝叶斯网络,粗糙集等也被用于客户流失预测建模,取得了不错的效果。 1.1回归分析 回归分析是一种广泛应用的预测技术,回归分析的目的是找出数值型变量间的依赖关系,并通过函数关系表现出来。回归分析的预测效果仅仅依赖于预测的变量与其他变量的关系,即模型的精确度取决于自变量和因变量的分布符合模型的程度,自变量与因变量的分布适合所选取的模型,则预测效果好,反之,预测效果差。根据自变量和因变量的函数关系,分为线性回归和非线性回归。客户关系研究中广泛应用的模型有Linear, Logistic等回归方程。 文献[1]应用Logistic回归对商业银行客户流失进行了分析预测,并以真实数据对模型进行了校验,结果表明模型具有良好的预测效果。文献[2]应用Logistic模型研究了客户生命周期价值及客户流失,研究发现,相比决策树和神经网络技术而言,Logistic模型更适合对客户流失的分析和预测,但同时作者也指出,预测性能受诸多参数因素的影响,比如神经网络参数的设置及训练集的选择,只能表明他们的训练样本更适合Logistic来建模。文献[3]指出,回归分析在客户流失预测中的主要缺点是对训练样本的要求,并且不能以符号化或易于理解的形式直观地表现隐含的模式。 1.2决策树 决策树是一种流行的分类算法,具有学习快速块、分类准确率高、分类结果表现直观等特点。决策树的构造包括两个阶段:通过训练集生成决策树;对生成的决策树进行剪枝。应用决策树对新样本进行分类时,从树根节点开始对样本进行测试,根据测试结果确定下一个节点,直至到达也节点,叶节点所属类别就是新节点的预测类别。决策树算法有ID3,4.5,C5.0,CART等。 由于基于C4.5算法的决策树有良好的性能并且能够自动产生分类规则,文献[4]应用C4.5算法对保险客户基本信息进行了分类,分析出了客户流失的特征,通过此模型,保险公司提高了客户挽留率。Kitayama通过基于决策树的方法对客户档案进行了分类,首先把客户群体划分为首选客户(Preferred customers)和一般客户,首选客户指那些对公司最有价值的客户,接着应用决策树根据客户特征分类,识别高价值客户,以达到挽留高价值客户的目的。为了克服决策树固有的缺点,提高客户流失预测模型的精确度和可解释性,文献[5]结合了AD Tree模型与Logistic回归方程的优点,提出了TreeLogit模型。 1.3神经网络 神经网络是一组连接的输入/输出单元,其中每个连接都有一个加权值。神经网络的分类知识体现在网络连 1

【参考1】用户流失模型

前面谈到了客户细分,这里说下流失分析吧 流失分析是客户细分大框架里面的一部分最重要的标签。切割用户有很多角度(例如性别、年龄等自然属性;成长状况等生命周期属性;贡献情况等价值属性;问题倾向等风险属性;消费特性等行为属性),我觉得最重要的特征是价值和风险,也就是说切割用户的头两刀应该是分开不同价值、风险倾向的用户 流失分析是获得用户风险倾向的分析,分析的结果是按照业务定义的风险类型,给用户打上不同的风险分值和风险分群 有了客户细分模型后,我们可以尝试在做更复杂模型是,进行模型的交叉,也就是说把细分等一些初等模型的结果成为重要模型的输入变量,这有利于提高精确度,最重要的是给模型的解释和实施代理很大的帮助(试想下,我们知道一个人有问题,但如果知道了这个人的细分标签,就意味着我们可以动手拯救他,而不是卧在桥头看水流) 说说流失分析的过程吧 step1-流失的界定:流失的界定是整个流失分析的重要环节,需要结合业务目的和数据状况界定流失(一般来说业务方界定的流失和技术上界定的流失不一致)。如何才算好的流失界定呢个 1、有业务含义,围绕着用户的业务目的来界定流失,例如:目的是促成用户消费,则xx天前有消费,当前没有消费的界定为流失;目的是促成用户提升价值,曾xx天前比当前消费降低50%以上的用户界定为流失 2、有稳定性:可以引入流动性分析,看用户在什么样的流失界定下,自然回复率低,也就是说如果我们不管他,他一般就挂了 3、操作性:回忆下人生(其实我也很年轻,那就回忆别人的吧,呵呵),最大的流失莫过于失去生命,如果到用户死了后再抢救有效果么??呵呵,所以我们界定的用户流失,一定是在发现流失后,有可以行动的方案 3、churn级别设定:详细分开,用户有几种阶段(好-有点问题-有问题-问题过大),我们需要在数据上给每个用户在churn中打一个级别,这对于模型学习有意义,最终使用好用户和有问题的用户对比建模,而不是用有点问题和问题过大的用户。这样有些复杂,但我对比尝试过,虽然对模型准确率没太大提升,但对模型的解释性有帮助,在稳定性上也会好一些吧 5、可以考虑定义多个流失,分别做模型:有多少种业务情况,就有多少种流失,最终可以考虑再做一个大模型,把所有的流失再封装一层 step2-变量列表:重复我个人的观点,变量列表的设计是以了解业务为基础的,每个变量都应该有业务猜测和原因。常把“变量是否有效要模型结果说了算”挂在嘴边的人,不知道技术如何,模型应用上肯定是傻子,尝试着说服他们更多的关注业务吧 1、尽量选择已有的变量,会使得变量准备的工作量小 2、按照业务内容把变量分类,综合考虑业务需要和计算量选择合适的变量;同时可以衍生一些从数据加工角度看冗余,但建模需要的变量(例如把入网时间->在网月份数) 3、确认变量获取的时间长度是否足够:对于消费总量的纯增量数据,只要系统最近没有大割接问题都不大;对于用户等级等快照变量,要想回溯快照可不是件容易的事情,要想好哦 4、已有的模型结果变量,可以作为准备变量交叉参与模型 step3-数据加工和检验:检验比加工更重要 1、数据加工不说了,有些用数据库,有人用c,有人用sas或climenting挖掘工具处理数据,都可以,没有哪个好,只有熟不熟 2、数据检验非常重要(会决定项目的成败),分成3类:单指标验证(每个指标的数据分布状况)、多指标交叉验证(指标间的大小、量级、加和等关系,需要穷举)、时间序列检验(在时间上的稳定性)--我曾经写了大约2000行代码的sas数据检验程序,可以配置的生成html 报告,感觉对效率提升很大

客户流失案例分析

客户订单流失案例分析 我是做游泳产品的,有一个葡萄牙的客户,去年做了45W。客户关系维护的也很好。08年底时,走了一单,之后客户没有不良反应。 今年过完春节,我回来工作后,曾发送过邮件给客户,向她问好。邮件只有回执,没有回复。当时以为客户忙,没有时间回复。况且根据客户往年的销售记录,2月份到3月份不是出货季节。就没有太在意。 4月初的时候,是该客户下单了,之前每年都有一张30W的单在5月份出货。该下单了,就再发送邮件,有回执没回复;传真,没反应。又过了两周,我急了,就打电话了,前台接的,说跟我司联系的客户请假回家,生小孩去了!我当时就懵了,赶快问是谁接替她的工作。前台回复说客户五月份就回来上班了。 我着急5月份的单啊,就再追问这几个月谁帮她做的工作。前台说是经理。我就请她帮忙接了经理的电话。经理接到后,我询问了客户今年上半年的销售情况,然后就直接了当的谈到了5月份的订单。经理说货已经到仓库了,等待铺货。还反问不是从我司采购的吗?我差点吐血!我说没有啊,一直联系不上她。经理突然明白过来了,说是让另一个人负责的这件事情…… 我这个客户今年的销售计划,就这样泡汤了……

教训: 1.要主动询问客户的休假计划,特别是长假; 2.要跟客户随时保持联系,一旦联系不畅通,要提高警惕; 3.要有客户尽可能多的联系方式,甚至是她同事的联系方式; 4.要有敏锐的洞察力!这一点对外贸人太重要了。 2、服务案例介绍 客户存款金额与柜台机核点金额不符 7月中旬,深圳市民余先生从家里携带2.4万元,来到北大医院后面的某银行莲花北支行的自助存取款一体机前存钱。在柜台机前一番操作后,余先生发现总款数已由2.4万元变为21800元。余先生当即拨通了该银行客服热线。银行方面当晚回复:柜台机未见差错,拒绝担责任。8月27日下午,羊城晚报记者陪同余先生前往银行,调取了当日余先生存款流水账单及柜台机监控录像查看。经对比,流水账单显示的余先生第二次存款操作所放入柜台机的款数与监控录像所显示的款数明显存在偏差。对此,银行方面却表示,“眼见不一定为实”,坚持以柜台机数据为准。

客户流失分析及应对措施(2012)

流失用户分析 从近年来我司在全省流失率排名来看,年度平均流失率保持3%以下,绝对值处在全省最后,用户稳定性良好。但随着市场竞争环境的改变,如何稳定存量客户,降低流失率将关系到公司营销成本的有效使用和后期市场经营竞争能力的持续领先。特对近年来流失整体状况作简要盘点,并以2011年8-10月流失数据为样本,从资费、时长等维度进行了简要分析,现将具体分析汇报如下,由于没有流失客户的详细调查资料,仅限系统中的一些流失用户数据为基础,不妥之处敬请领导批评指正。 一、近年来流失情况整体趋势简析 从2008年1月至2011年11月逐月流失用户数趋势(详见图1,数据来自经营分析系统)来看,伴随着公司总体用户规模的增长,每月流失用户绝对值也呈现出上升趋势,从2008年的2.5万左右上升到2009年3.68万,尤其是2009年3月行业重组以来,流失用户呈现较明显的上升趋势;2011年以来,流失用户数波动幅度增大,截止2011年11月资阳分公司流失总用户数达到50.31万户,与2010年同期39.1万户相比增加11.21万户,增长幅度28.68%。 图1:08年以来逐月流失用户绝对值趋势图

图2:2011年各月流失用户数据图 从上图2可以看出,2011年4月因旺季营销和节后效应影响,流失用户突破5万户,而从8月以来,分公司流失用户数出现较高幅度的增长(9月有一定回落)。反观当期竞争对手市场策略,联通无大的市场促销策略,主要影响因素预判为8月以来电信开展了高补贴的存量用户迁移、天翼0元机和集团策反促销活动,经过我司同期针对性的开展0元心机和座机促销应对、校园促销和大规模存送活动,在9月份抵挡了电信的发展势头,稳定了一定的存量用户,我司流失用户数呈现出下降态势;但随着电信存量用户迁移工作的全面铺开,仍然导致了我司部分中低端用户离网加剧。2011年11月流失用户达到了5.92万户11月的流失率达到3.85%,为2009年以来三年同期最高值。 从图3的逐月流失率来看,伴随着市场竞争环境的加剧,用户流失率

相关文档
相关文档 最新文档