文档库 最新最全的文档下载
当前位置:文档库 › 浅谈游戏数据的积累、挖掘与分析

浅谈游戏数据的积累、挖掘与分析

浅谈游戏数据的积累、挖掘与分析
浅谈游戏数据的积累、挖掘与分析

天之虹:浅谈游戏数据的积累、挖掘与分析

Posted by Gamelook on 六月21st, 2009

文/九城研发中心天之虹

编者按:游戏数据整理和分析是一项繁琐而枯燥的工作,急性子很难处理好这样的事情。而本文作者以“挖矿”主线向大家生动而形象地介绍了数据的获取、积累、整理、分析等数据处理的全过程。文中时不时会有一些形象而生动的例子,相信你会觉得这一篇让人感觉轻松愉快而又十分有价值的文章。欢迎更多的游戏人就相关问题和小编一起讨论。比如道具种类分布和相关数值设定,游戏规则的修改等。

摘要

本文从数据出发,以实战的角度谈数据的积累、挖掘和分析,通过这三步的不断迭代,借此发现游戏中设计合理和不合理的地方,并以此进一步改良游戏,改善玩家在游戏中的体验。

一、引子:数据积累、挖掘与分析ABC

(一)、从游戏中的数据谈起

从某种程度上来说,游戏是由数据组成的——如果把游戏归入到软件类的话,一种通用的说法认为软件是数据(结构)+算法的成品。在下只是一个小小的策划,无从站在程序的角度谈精深的算法,因此我们这篇文章就先从游戏的另一部分——数据谈起。

什么是游戏中的数据呢?——或许我们可以把游戏中的数据分为静态数据和动态数据。

所谓静态数据是数值策划用精巧复杂的公式精心计算的各种游戏属性,这些属性是一套固有的数据,在游戏运行和运营过程中都是固定不变的——例如武器装备的属性、怪物的属性、人物每级固定分配的属性、技能每级固定的攻击和消耗等相关的属性。

动态数据是指游戏运行和运营过程中不断变动的数据,这些数据会随着玩家在游戏世界中执行各种行为的不同而发生改变——例如玩家背包里的物品、玩家的经验和等级、玩家身上的游戏币乃至游戏各个地图里不断变化的怪物数量等等。

动态数据在游戏中就如繁密的流星雨那样一闪而过,不留意的人可能会让它们如同流水般在指尖流过。然而这些动态数据却是一座深埋大山里的金矿,若善加利用——用它们来不断地改造静态数据,那势必能让玩家的体验不断得到改善,从而延长游戏寿命并增加收益。

(二)、为什么要利用数据

或许很多人会对上面的话不屑一顾:

要谈为什么要利用数据,首先不得不提起游戏。

游戏,尤其是网络游戏,其本身就是一个玩家行为的集合。玩家的行为都是由玩家心理衍生的,而网络游戏就像是玩家心理和玩家行为的聚合品。人心本是很难猜测的事,但成功的网络游戏却必须成功地揣测出玩家的心理,打造出满足玩家心理需求的游戏机制和游戏内容,这就不得不从错综复杂的玩家心理和玩家行为世界中寻找规律和分析结论了。

所幸网游玩家是一个大规模的群体,即使一个不成气候的游戏也有几千玩家曾经在游戏里逗留过,这大量存在的样本总是存在不少可以抓住规律的共性的,而唯一能总结出这些规律和对比出其共性的途径就是数据了。

或许有人说经验和感觉也可以,那我们来看看如下的一个例子:

经验、感觉与现实的差距

为什么会频频发生这样的事呢?左边的是游戏设计制作过程中和过程后的纯感觉,而右边的事实无疑是靠纯数据(实际完成任务的人数、购买道具的人数、进出副本的人数)证实的。可见只有数据才能真正地反映出游戏的设计和玩家的行为现状。(编者注:理想和现实总是有差距的,多看看现实对自己没坏处,至少能让自己在今后的游戏生活中的心情落差不会越来越大。)

图02:数据vs感觉+经验

(三)、“尿布与啤酒”的故事数据的积累、挖掘和分析

如果说游戏中的动态数据如金矿般宝贵,数据积累就相当于在这时光流逝的银河中把这些矿石积累并沉淀下来,数据挖掘就像在千万年以后从矿床里把这些矿石挖掘出来,而数据分析就像把挖出来的矿石进一步加工提炼,成为真正有用的金属。这三者是对游戏数据进行更有效的利用的三个步骤和手段,而把这些手段运用得很出色的例子源自于沃尔玛。

沃尔玛的数据仓库是把积累、挖掘和分析运用得很成功的例子。沃尔玛在成立之初就建立了一个庞大的数据仓库,把每一位客人在采购时产生的数据(动态数据)都记录下来。它们包括订单的详细内容、购买时间、客人资料、当时的店面情况和商品情况……随后不定时地对这些数据进行统计分析,掌握到各方面的规律,把销售服务改善得越来越好,从而成为了全球最大的连锁零售企业。

这里不得不顺便提一下沃尔玛在数据挖掘方面的一件轶事:

类比于现代超市这种以服务一争长短的行业,网络游戏又何尝不是。通过数据的积累、挖掘和分析以后,借用分析的结果去改良游戏机制,那一定能取得势不可挡的结果的。(编者注:“尿布和啤酒”背后的故事不是拍脑袋想出来的。而是沃尔玛对相关数据积累、挖掘、分析、判断后得出来的结果。这个故事也让我们更清楚地了解了数据采集和分析的意义。一款道具的消费能否引起玩家对其他道具的消费欲望?几种道具之间的消费有着怎样的联系呢?相信大家已经应对良策了。)

开篇引子谈得很长,接下来我们就从矿床谈起吧,谈谈数据的积累。

二、从矿床谈起——数据的积累

(一)、我们该积累哪些数据

要积累出有价值的数据,我们首先要搞懂动态的数据有哪些。

我们首先能想到的自然是游戏运行过程中自然而然产生的数据,也就是前面所说的由玩家各种行为而产生的游戏动态数据。

如果说游戏的面向对象是玩家,那数据分析所要研究的对象也自必然是玩家,推而广之,有价值的积累数据应该是由玩家的各种行为所产生的所有数据,而不仅仅是游戏中的动态数据。

如图03所示,概括而言,有积累价值的玩家动态数据包括四类:

四类有积累价值的动态数据

游戏中不断变化的玩家动态数据:这些数据一部分是会存储在数据库里的(例如玩家的金钱、等级、经验等),另一部分是游戏运行过程中短暂停留在服务器内存里的(例如某个时刻地图上的怪物数量、玩家数量,例如怪物掉落但玩家没有捡起的掉落物),无论是前者还是后者都,它们都是十分有用的动态数据。

论坛上的玩家回帖:论坛上玩家的回帖也是一种数据,这些回帖包括玩家的建议、责骂、求助、讨论热点等玩家关注的内容。把这些玩家关注和提及的数据都积累起来,是日后分析和用于改良的有用矿石。

玩家来电/求助GM:玩家打电话的通话内容以及每次求助GM的内容也是很有意义的数据。这些内容多反映了玩家在游戏中遇到的困难,积累和分析以后能对游戏的体验作出很好且很有针对性的改良。

玩家消费记录:对于出售道具或者出售服务的游戏来说,玩家的消费记录包括玩家兑换价值币的量和频率,玩家购买道具/服务的数量、时间和频率,玩家购买道具/服务的途径、各类道具/服务的出售情况等等。这些消费记录很大程度上类似于零售行业所苦心积累的数据,而对于架设在电子网络上的网游来说,积累这些数据要比传统行业容易多了。

所有的这四类数据都是和玩家行为密切相关的,通过积累、挖掘和分析后能很大程度上把玩家的行为模式乃至心理模式还原出来——这些还原的成果即使找到一批忠实且忠厚的玩家也是说不清道不明的。

(二)、如何积累矿床

根据上面的内容,此时我们已经掌握了哪些是对我们有用的矿石了,那接下来我们该如何把这些矿石积累下来呢?这里笔者谈谈第一类数据,也就是游戏中不断变化的玩家动态数据的积累方式,同理,其他三种数据的积累也是一样的。

前面谈到了玩家动态数据分为数据库中存储更新的和游戏运行中在服务器内存里短暂存放的两类数据,这两类数据的积累方式也各有不同:

数据库中存储更新的数据本身就被数据库如实地记录起来了,但如果不对这些数据进行及时处理的话,那最终也只能一直反映着当前一刻的数据而已——比较行之有效的办法是对部分有用的库进行快照式的备份:在固定的时间点把相应的库进行备份,留一份快照。一段时间后把这些快照都聚集起来,进行有意义的统计或者是把部分数据制作成图表,又或者是把这些快照一直存留着,不断积累成越来越具价值的快照库,留待日后的数据挖掘和数据分析。

服务器内存中暂留的数据都是稍纵即逝的,一不留意数据就不见了。例如某个时刻中地图的玩家数量:玩家不断地进进出出地图,可能仅仅过了几分钟,整个格局又全然不同了;又例如地图上掉落的物品:玩家过一阵子不捡,服务器就自动把怪物尸体销毁了。对于这些暂留的动态数据都需要即时的把握,而这种即时的把握又分为两种手段:消息驱动的被动型积累和规则驱动的主动型积累。(编者注:“人生如白驹过隙”,但人生是由很多细节组合来完成的。稍纵即逝的细节需要我们用心去捕捉,数据的捕捉同样需要有心人去留意和思考。)

图04:玩家动态数据的积累方式

消息驱动型的积累方式是被动的,当玩家的行为产生服务器和客户端相互通知的事件消息时,我们可以借这个时机把变动的动态数据积累起来。这种方式又分为两种常见的做法:Log机制和消息驱动型累加变量。

Log的意思是指把行为如实地记录下来,常见的Log的做法是为每种行为定义好固有的记录格式,当发生这种行为并产生事件消息时,就把该行为按这种规定好的格式记录下来。例如在玩家与城里杂货店的NPC交易时,可能会产生如下的Log记录:

[09:28:14]玩家[楚留香][uid=1103301]在NPC[npcid=110032]处购入[迷迭香][itemid=1102] 50 个,花费游戏币5000

[09:29:34] 玩家[楚留香][uid=1103301]在NPC[npcid=110032]处售出[槟榔][itemid=3221] 30 个,获得游戏币300

由此可见,Log机制是把玩家在某一类行为中的每个行为,以及行为过程中牵涉到的过程和数据都事无巨细地记下来的。其优点在于它毫无遗漏地记下你感兴趣以及潜在感兴趣的所有相关数据,但也有它的缺点:这种事无巨细的记录方法每天会带来极庞大的数据量积累,久而久之就真的如一座天然矿床那样,需要很费劲才能从中挖出你要的矿石了。

消息驱动型的另一种积累方式是消息驱动型累加变量。这种方式是在服务器数据库和内存中设立一堆一样的累加变量,当相关的消息产生时,服务器对内存中的这些变量累加入相对应的数值,而后定时地(每天或者每周)把这些累加变量的值存入库里并清0,随后建立快照作为历史性的积累。

光是这么说有点抽象,我们来看一个具体的例子。游戏中金钱的产出量是数值人员很关心的一个数据,然而这个数据靠数据库的历史快照所统计到的信息是不准确的(统计玩家所得金钱的增长量只能反映出真正进入玩家手里的金钱量而已,但这金钱量远远少于游戏中实际的产出量(因为在实际情况中,经常有玩家为了诸如加快练级效率一类的目的,只杀死怪物却不去拾取掉落物品),这时就需要用到消息驱动型累加变量了。

我们可以设立一个称作MoneyDailyProduce的累加变量,并为其设立如下的累加规则:

MoneyDailyProduce的累加变量

如表02所示,我们把每一个有可能在游戏中从无到有(例如玩家之间交易游戏币就不是金钱产出了)地产生金钱的时刻都记录到触发时机里,并把该时刻产出的金钱量累加到变量里。如此一天下来得到的变量值就是当天游戏里的实际金钱产出量了。每天把这个值存入库里并建立快照,一个月或者一年下来就能看到整月或者整年的游戏金钱产出曲线图了。

虚构的游戏金钱产出年度曲线图

诚然,消息驱动型累加变量的做法的优点是很显著的:首先,它得到的是你真正关心的数据,这些数据完全可以是已经加工好的矿石了——至少已经无需去花时间挖掘;其次,这种做法很擅长捕捉那些稍纵即逝的动态数据,因为累加操作是发生在事件触发的时机,所以无论数据逗留的时间有多短暂,在发生的那一刻就已经被捕捉下来了。

但这种做法也有明显的缺点,或者说是压力所在:其一在于服务器压力。要在消息产生时额外分担精力来累加、同时管理这么多在内存里的变量、定时把这些变量转发到另一台统计和Log的服务器上,这些处理、管理和转发压力是或多或少存在的;其二在于系统设计的工作量。系统策划在设计每个系统时,需要构想好该系统所需要使用的累加机制,汇聚成表后递交给开发人员,连同系统一并实现;最后一点在于代码结合程度。如果说Log机制是可以基于主服务器做一台LogServer来处理的话,那消息驱动型的累加机制和主服务器的结合就要紧密得多了。在每个系统模块中处理玩家行为的同时进行数据累加,两类代码是紧密结合的。代码结合程度高也意味着加入消息驱动型累加机制的时机不能太晚,不然对原来的代码的改动可能就很大了。

谈完了消息驱动的被动型积累,接下来我们谈谈规则驱动的主动型积累。

规则驱动的主动型积累是在服务器中建立一套规则去主动地统计和积累出设计者关心的数据。这种主动的机制可能会是定时轮询的机制,每隔一段较长的时间段去主动统计出数据,存放到特定的内存区域或者转发到Log服务器中。例如设定让服务器每隔一个小时统计出每张地图上此刻的玩家人数并转发到Log服务器,一天下来就能得到当天各个地图在24小时里的人数走线图了。

图06:规则驱动的主动型积累

主动型积累最大的优势是弥补了前面两种消息驱动型机制中的很大不足,很多重要的数据是无法产生消息的(例如前面说到的特定时刻中地图的人数,虽然可以靠log的机制在玩家进出地图的时候写下log记录,但这进进出出的log下来的数据量是很大的,并且事后要统计回这些数字也很费劲,且统计完以后这部分中大量的log记录就可以丢掉了。这性价比实在很低)。

把前面的被动型积累机制配合上主动型积累机制能完全把所有关心的数据都覆盖掉,不会因为“mission impossible”而漏掉任何宝贵的矿石。

但这种主动机制的缺点无疑在于对服务器平添的压力,服务器需要定时地依照规则去轮询、统计和转发数据,这无是一笔服务器运算、内存、带宽和机制开发上的开销,无论放到哪个项目都是需要掂量掂量的事情。其次这种机制和前面的消息驱动型累加变量机制的缺点一样,也会有较高的代码结合度,需要在前期就把这个机制考虑进去,如此才有实现的可能

性,或者至少能通过合理的系统设计来在开销上提早优化好性能。(编者注:对待双刃剑,我们需要做的是权衡利弊,然后扬长避短。)

三、把矿石挖出来——数据挖掘

通过主动和被动两种机制把数据积累起来了,随着年月的流逝,这个矿床必然会越来越丰厚,宝贵的矿石也必然会埋得越来越深,接下来我们就必须知道如何把我们需要的矿石挖出来了。

数据挖掘可以说是数据分析前的准备,这提炼矿石前的准备其实包含了两个步骤:有些矿石由于前面在积累的时候用了较聪明和较花成本的方法。它们已经浮在矿床之上了,我们只要把它们拿起来,清理一下上面的脏污,让其更显光彩就可以了;另外的一些矿石会藏得很深,我们需要用合理的手段把它们挖起来才可以用。

这里,前者说的是累加变量机制和主动统计机制所得到的数据,这些数据(快照)已经在积累时直接积累成矿石了,我们所需要做的工作只是把它们转化为图表,或者做一定的计算和统计就可以了。例如把每天得到的数据按月变成月曲线图,把各地图分布的数据做成饼形图;又例如统计了某个任务的累计完成次数和累计接取次数,那把两个数字相除以后就能得到该任务的任务完成率。类似这些处理只是相当于建立一个规则表,把不同类型的矿石用不同手法去掉脏污,如此就能得到闪闪发亮的可提炼的原材料了。

而Log机制记录下来的大量记录就真像深埋的矿床那样,需要人为花功夫去开采矿石了。这需要建立一套明细的Log统计工具,从Log记录中解析并分拆出关键属性,然后把属性进行累加统计或者图表转化,如此才能完成提炼前的准备工作。

例如对于一个极为庞大的玩家与NPC商店交易的Log记录,要统计各商品的售出情况,那必须先建立一张明细的商品表,随后通过一个遍历程序去解析Log记录,分门别类地累加到不同商品的售出次数上。对Log记录的数据挖掘工作其实有点像被动型消息驱动累加机制,只不过前者是先Log下来再作处理,后者是让数据在产生的时候就自动跳出来。两种做法,在选择上,笔者更偏向于消息驱动的累加机制的做法,当然这种做法需要更早地考虑和规划。(编者注:我们终于开挖了,但挖之前,我们需要好好了解一下各矿层之间的埋藏特点。另外,我们还需要找到一个适合个人特色的方法是必要的。不同的方法就如同不同的工具,或许你更擅长用铁镐来挖,而我更适合用敲锈锤,总之挑个合适工具准备开工了。)

四、矿石的提炼——数据分析

(一)、据分析能带来什么

在这里我们需要再次重申一下,前面花这么大的功夫去积累下如此庞大的数据,再颇加周折地辛苦挖掘出有用的数据,做的这么多都是为了什么?——最主要的用途是用数据说话,利用游戏运营过程中玩家真实行为(而不是设计时的主观猜测)产生的数据去还原出玩家的行为模式和行为倾向,以此改良游戏机制,提供更受欢迎的游戏内容,而这么做通常也能为游戏带来更多的收益。

基于这个目的,前面完成的所有数据在这一步都需要进行仔细的分析,从数据中找到玩家行为的规律。我们先来看看表03,看看分析了前面积累和挖掘到的数据以后能看出什么端倪:

这么说好像在吹嘘积累、挖掘和分析的作用,那我们分别换一些实际的例子来看看如何通过对数据分析来得到上表右边的结果:

玩家的倾向

? ·例如统计出各地图一天中各时段的玩家人数,我们能了解:

"玩家更喜欢逗留在哪张地图

"玩家在不同时段更喜欢逗留在哪里

"借此结合性推断可能可以了解到为什么玩家更喜欢某张地图或者为什么玩家不喜欢这张地图

"通过玩家重心在不同级段地图上的迁移,可以了解当前服务器的衰老程度

? ·例如统计出各种NPC商店商品的出售情况,我们能了解:

"玩家更喜欢哪种消耗品,更喜欢哪套装备

"哪类道具在游戏中消耗最多

"哪些物品不受玩家欢迎

"从而推断出为什么会发生以上情况

数值的平衡

? ·统计出游戏每天的金钱产出量(或者每天的实际金钱产出量——真正进入到玩家包里的钱)和每天的金钱消耗量,如此能大致了解到游戏中经济是否平衡

? ·统计出每天任务的经验产出和每天打怪的经验产出能大致了解到任务奖励的合理情况

系统和内容的合理性

? ·玩家的喜好其实很大程度上就反映着系统和内容在设计上的合理性了

? ·统计出任务的完成率、放弃率能了解到任务设计的合理性以及奖励的合理性

销售方面的倾向性

? ·统计出各种虚拟商品和虚拟服务的出售情况能了解到

"哪些商品和服务是热销的,哪些商品和服务是无人问津的

"促销商品是否达到了热销的程度

"产生以上情况的原因

一些我们难以了解到的原因

? ·通过对长期不在线的玩家的各项数据的统计,能推断出造成玩家离开游戏的原因

? ·通过结合怪物消耗量、地图各时段人数量能推断出任务不受欢迎乃至玩家放弃任务的原因

【/特殊显示】

"凡此种种不再多加列举了。

"倘若把前面积累和挖掘的数据进一步处理成图表的话,在分析的时候就能得到更直观的材料了,如此得到的分析会更加准确,而到了接下来一步的改良工作也会更加可靠。(编者注:没白干!)

(二)、如何分析

或许实际地举几个实例会来得更清晰,接下来我从三个例子去看看如何分析前面积累和挖掘出来的结果:

1.通过玩家账号表结合角色数据表来分析原因(数据库快照的分析方法)

查阅玩家账号表,我们发现表04中出现这么几行信息:

玩家账号表信息

从上表看来,发现账号11033、14897~14899的玩家都已经很长时间没上游戏了,到底是什么原因导致他们离开呢?

对于11033的玩家,注册游戏(或许可以称作玩了这个游戏)已经有3年的时间长度了,这么一个老玩家又是因为什么离开游戏呢?

14897~14899三个玩家是同一天注册游戏的,也是同一天离开游戏的,这是什么原因呢?

对这些玩家进一步根据账号ID来查找他们的角色表的情况,发现后三个玩家的角色在当天都被查封了。这需要进一步分析当初是为什么查封这些角色的;而对照账号11033的角色发现该玩家的角色已经是93级的角色了,的确是老玩家,这时就需要进一步对这个老玩家的角色的其他信息(例如完成任务的情况——是不是给某些任务卡住了;例如背包的Log 记录——是不是被盗号了;等等)进行分析,看看为什么离开游戏了。(编者注:矿石开始发光了,他们的价值将在我们的分析与研究中发出耀眼的光芒。)

2.从玩家与玩家交易的Log记录中寻找漏洞

玩家与玩家交易的Log记录一般都是如下的格式的:

[09:08:11]玩家[楚留香] [uid=1103301]把[迷迭香][itemid=1102] 50 个交易给玩家[梅兰芳][uid=1104411];

对如上的Log记录进行道具的交易统计(数据挖掘)后能统计出各类道具的交易次数,发现迷迭香的交易量比其他道具的交易量要大得多,有可能迷迭香这个道具在交易系统中存在一定漏洞。

又进一步追踪迷迭香在NPC商店中的出售量(消息驱动型的累加变量机制),发现迷迭香的出售量也远少于它在玩家之间的交易量,由此,我们可以看出这无中生有的多出来的数量一定存在问题。

从Log记录中追寻(数据挖掘)和迷迭香这个道具相关的玩家(例如经常交易这类道具的玩家,大批量购买这类道具的玩家,以及最初进行这些大批量交易和大批量买卖的玩家)的行为,或许能发现该道具在系统中存在的漏洞。

3.从道具销售统计中扩大销售(累加变量机制)

通过前面数据积累步骤中的累加变量机制能得到游戏商城里的虚拟道具销售情况表,该表可能如表05所示:

游戏商城里的虚拟道具销售情况表

从表05看来,30瓶装的双倍经验药水明显比单瓶装的双倍经验药水的销售多很多,通常我们都是鼓励玩家买更大捆的道具的,因此从结果看来是价格的对比促使30瓶装的双倍经验药水热销;但99瓶装的双倍经验药水的销售看来也不怎么样,这又是什么原因呢?

在这样的情况下,我们可以从其他的累加变量统计中寻找蛛丝马迹。例如双倍经验药水的使用量甚至是使用时段,同时分析99瓶装的双倍经验药水的定价是否不够合理,其定价是否也和单瓶装的双倍经验药水一样成为了烘托陪衬品。

我们可以通过这样的分析来进一步改进99瓶装的双倍经验药水的定价和功能,以此扩大整类双倍经验药水道具的总体销量。

以上三个例子分别对三类数据积累手段积累下来和数据挖掘精修出来的数据演示了对其进行进一步分析的方法,类似以上的分析完成后,我们会得到方方面面的猜测和结论,接下来就需要把这些猜测和结论用到游戏里了。(编者注:游戏中的异常现象往往是游戏身体里的肿瘤,要是长期无视它们的存在,游戏生命将被大大缩减。我们需要对相关的数据进行分析,对游戏进行定期的身体检查,及早发现肿瘤的位置,在它朝着恶性方向发展之前就根除掉它。只有这样,游戏才会健康长寿。)

五、把宝石用到装备和武器上——分析结果的利用

当分析完成后,不合理的地方都需要进一步改良,这种改良一方面可以是创新性的改良,另一方面也可以借鉴游戏中合理或大卖的地方作参考性的改良(例如A道具卖得不好,B 道具大卖,参考性地结合B道具的情况改良A道具的功用或价格就好了——当然前提是你没打算用A道具去烘托B道具)。

另一方面,经过分析、判断,合理的地方或者设计得好的地方要更加发扬光大。例如一个大卖的道具在分析出其大卖的原因后可以推而广之地推出系列套餐或者“子母型”的增值服务,甚至是改头换面地包装出一个新的系统……凡此种种,只要当你确认了A是大卖的,并且A的大卖是有理由的,并且这种理由是你确认的,那大可放手把它推而广之,因为那是玩家喜欢的。

分析后的改良会是一个渐进的试探性过程,毕竟突然的改头换面是充满风险的。把坏的东西改成好的那还说得过去,把好的不慎突然改成坏的就会遗臭万年了。建议是渐进地试探性改良,在改良后再通过前面的数据积累、挖掘和分析步骤来观看结果,根据结果再来步步推进。(编者注:得出来的成果是有价值的,利用调查结果来付诸行动则需要更加的谨慎。挖出来的好矿别乱用,不然砸着自己的脚不说,还伤害了玩家的感情。)

六、小结

数据的积累、挖掘和分析是一个需要不断迭代的过程,这个过程是在开发周期里规划和实现,在运营开始的时候开启并开始迭代的。

这个过程中的每一次迭代都会为你衍生出一些有意义的分析结果,利用这些分析结果去改良游戏,然后再借用下一次的迭代去观察、调整和扩大战果,如此用户的体验一定会不断地得到改良的,而对开发商和运营商得到的也自然是越来越大的收益。

游戏中的数据是如金矿般宝贵的,把数据积累起来、挖掘出来,再进一步分析和思考,别让你手中的金沙再不断流走了。(编者注:保护并扩大成果的最好办法是持之以恒。好人不难做,难的是一辈子做好人,这里套用一下,好矿不难挖,难的是一辈子都挖出好矿来。加油吧,游戏同仁们!)

Friday Forum

Friday Forum是TDC精心打造的信息交流平台,在这个平台上研发人员能充分的进行专业技术的交流、研发成果的分享、职业发展的规划、生活态度的展示等,既是一个信息交流的平台,也是一个展示个人风采的平台,成为构建TDC学习型组织的特色组成部分。

经营数据分析报告

经营数据分析报告 导读:本文经营数据分析报告,仅供参考,如果觉得很不错,欢迎点评和分享。 经营数据分析报告 一、确定分析目标 分析目标主要包括以下三个方面: 分析目的。 分析范围。 分析时间。 如下图所示,分析目标除了主要包括三个方面外,还有备注一栏,这里备注的是计算周期问题。强调一点,我们做运营数据分析的时候通常都会拿更新前和更新后的数据进行比较,因此我们的设定的分析周期一般都会跟着游戏实际的更新情况走。 二、分析综述 分析综述主要包括两方面的内容 1、上周/本周充值数据对比 充值总额 充值人数 服务器数 服务器平均充值 服务器平均充值人数

针对上述内容进行差额对比以及增减率对比,如游戏有特殊要求,可以适当增加其它数据内容。 2、上周/本周更新内容对比 主要陈列两周内分别更新的活动内容或一些重大调整。 三、一周运营数据分析 1、本周收入概况 日均充值金额,环比上周日均充值金额 用户ARPU值,环比上周ARPU值 简述与上周或之前的充值情况的比较,如上升还是下降、影响充值的较大的因素。 2、新用户概况 新用户就是新进游戏的玩家,这里主要介绍这些新玩家的动态数据,一般以两个月为总时长进行陈列比较,具体周期数据仍以周为单位。 新用户数据主要包括:安装下载数、创建角色数、安装→角色转化率、付费人数、创建角色→付费转化率、ARPU值、次日留存、三日留存、七日留存等,可根据游戏实际情况进行添加。 3、活跃用户概况 活跃用户概况主要包括三部分内容: 日均在线人数,环比上周实时在线人数,提升/下降百分比 日均付费用户登陆人数,环比上周付费登陆数,提升/下降百分比

日均活跃玩家数,环比日均活跃玩家数,提升/下降百分比 4、道具消费概况 道具方面的消费概况主要包括: 产出活动类别 道具分类 单类道具消费元宝,消费占比,环比上周 日均消费元宝,总消费元宝,环比上周下降/上升 简述活动效果较好/较差的道具分类 5、当前元宝库存 当前元宝库存是指玩家充了元宝还没花出去的存量,以及游戏中额外获得的元宝存量。例如,我充了1000块,拿了1w元宝,花了8K,我造成的存量是2K,当平台各服的元宝存量不断上涨,就代表消费点不够了,要不补新消费系统,要不上消费类的运营活动。 6、重点商业活动付费玩家参与情况 活动参与情况主要考虑以下几点: 付费群体类别,活跃付费玩家数 付费玩家的参与比例 付费玩家在活动中消费的元宝数 付费玩家在活动中消费的元宝占周消费元宝总数的比例 付费玩家的人均消费元宝数 根据活动的这些付费玩家的相关数据,判断该活动产生的效益以及玩家的接受程度。

数据分析报告范例

竭诚为您提供优质文档/双击可除 数据分析报告范例 篇一:数据分析报告 数据分析报告 今年年初以来公司在总经理的领导下,积极生产,各项工作都取得了 一定的成绩,特别是通过坚持贯彻Iso9001:20XX标准,使公司的管理更上了一个台阶,现将我们收集的部分数据进行分析以供领导决策。 20XX年签订了项目合同13项,完成11项,2项项目在进行中,验收工程一次合格率100%,完成的11项工程项目顾客满意率超过95%。 系统集成部多次组织技术人员和项目经理、施工人员学习国家标准和行业规范,严格按照程序文件和作业指导书的要求组织设计和施工。 工程项目的实施都严格按照国家标准规范进行,确保为用户提供满意的、高质量的工程项目和优质的售后服务。从部门负责人到项目经理以至每一位员工都自觉地将分解到

的质量目标融入到日常工作之中,涉及到的每一个环节都得到较好的控制,由不理解到形成自觉的行动,按程序文件要求做已经在尉然成风,发现问题不遮、不掩、不护,采用自检、互检和专检活动,促进质量意识和企业文化深入人心,调动了每一位员工的积极性,上下形成一个共识,我们的工程要做成为顾客最满意的工程。 中国建设银行辽中近海支行综合布线系统项目、中国建设银行辽宁省分行、后台处理中心综合布线系统项目、中国建设银行沈阳彩霞支行综合布线系统项目、中国建设银行沈阳三好街支行综合布线系统 项目、建行大东支行莱茵河畔自助银行综合布线系统项目都是一次验收合格交付的,工程项目符合用户和行业标准的要求,得到了用户的赞扬和好评,提高了公司的经济效益和企业现代管理水平,至今没有发生顾客投诉等问题。 华汇人寿保险股份有限公司办公设备采购项目、中国建设银行辽宁省分行网点网络设备采购项目都是一次验收合 格交付,客户对我们公司提供的服务十分满意。 交付的大连泰山热电有限公司网络信息安全整改项目,提高了泰山热点系统运行效率,保证了系统的安全性,为系统正常运行发挥了重要作用。 部门采购人员今年按要求对供方进行了评价,确定了合格供方,到目前为止这些供方提供的产品、原材料质量稳定,

游戏数据分析基础知识

时间 2015-1-31 数据分析——基础知识 一、新登用户数 日新登用户数 每日新注 并登录游 的用户数 周新登用户数 本周7天日新登用户数累计之和 新登用户数: 本 30天日新登用户数累计之和 可解决的问题: 1)渠道贡献的新用户份额情况 2)宏 走势,是否需要进行投放 3)是否存在渠道作弊行 二、一次会话用户数 日一次会话用户数 即新登用户中只 一次会话,且会话时长 于规定阈值 周一次会话用户数: 本周7天日一次会话用户数累计之和 一次会话用户数: 本 30天日一次会话用户数累计之和 可解决的问题: 1) 广渠道是否 刷量作弊行

2)渠道 广 量是否合格 3)用户导入是否存在障碍点,如 网络状况 载时间等; 4)D步SU 于评估新登用户 量,进一 分析则需要定 活跃用户的 一次 会话用户数 三、用户获取 本 CAC 用户获 本义 广 本/ 效新登用户 可解决的问题: 1)获 效新登用户的 本是多少 2)如何选择 确的渠道优化投放 3)渠道 广 本是多少 四、用户活跃 Activation 日活跃用户数 DAU :每日登录过游 的用户数 周活跃用户数 WAU 截至当日,最 一周 含当日的7天 登录游 的用户数,一般按照自然周进行计算

活跃用户数 正AU 截至当日,最 一个 含当日的30天 登录过游 的用户数,一般按照自然 计算 可解决的问题: 1)游 的 心用户规模是多少 游 的总体用户规模是多少 2)游 产品用户规模稳定性 游 产品周期 化趋势衡量 3)游 产品老用户流失 活跃情况 渠道活跃用户 存周期 4)游 产品的粘性如何 正AU结合 广效果评估 备注 正AU层级的用户规模 化相对较小,能够表现用户规模的稳定性,但某个时期的 广和版本更新对正AU的影响也可能比较明显 外游 命周期处于 同时期,正AU的 化和稳定性也是 同的 五、日参与次数 DEC 日参 次数 用户对移 游 的使用记 一次参 ,即日参 次数就是用户每日对游 的参 总次数 可解决的问题: 1)衡量用户粘性 日 均参 次数

数据挖掘与分析心得体会

正如柏拉图所说:需要是发明之母。随着信息时代的步伐不断迈进,大量数据日积月累。我们迫切需要一种工具来满足从数据中发现知识的需求!而数据挖掘便应运而生了。正如书中所说:数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做出贡献。 1、数据挖掘 数据挖掘应当更正确的命名为:“从数据中挖掘知识”,不过后者显得过长了些。而“挖掘”一词确是生动形象的!人们把数据挖掘视为“数据中的知识发现(KDD)”的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤! 由此而产生数据挖掘的定义:从大量数据中挖掘有趣模式和知识的过程!数据源包括数据库、数据仓库、Web、其他信息存储库或动态地流入系统的数据。作为知识发现过程,它通常包括数据清理、数据集成、数据变换、模式发现、模式评估和知识表示六个步骤。 数据挖掘处理数据之多,挖掘模式之有趣,使用技术之大量,应用范围之广泛都将会是前所未有的;而数据挖掘任务之重也一直并存。这些问题将继续激励数据挖掘的进一步研究与改进! 2、数据分析 数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 数据分析有极广泛的应用范围。典型的数据分析可能包含以下三个步: 1、探索性数据分析:当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。 2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。 3、推断分析:通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。 数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各

数据分析报告范例

数据分析报告范例 XX年中国手游市场年度数据分析报告 一、XX年手游市场基本概况 1、XX年中国游戏市场份额分布:客户端游戏仍是游戏市场主导,移动游戏暂时无法取代。 2、XX年移动游戏用户规模:XX年年底,手机游戏用户规模超过5亿,近半数中国人在玩手游 3、XX年移动游戏市场实际销售收入:XX年移动游戏销售收入超过200亿,销售收入是XX年的2倍以上 4、XX年手机游戏各类型占比分布:休闲游戏数量超过6成 5、各游戏类型留存率水平:动作类游戏留存率最高 二、用户行为透析 1、端游与手游之间用户重合度分析:端游与手游用户重合度达到%,端游用户转化为手游用户的空间较大 2、XX年智能移动游戏操作系统分析:安卓成手机游戏主要操作系统,苹果手机用户更愿意花钱玩游戏 3、玩家付费行为分析:休闲射击类游戏付费人数多,重度手游单次付费金额较高 4、玩家付费时间分析:玩家的付费高峰习惯趋于稳定,付费高峰发生在午饭后和晚上睡觉前 5、支付方式对比:61%玩家首选支付宝

三、地域分布 1、60%手游用户聚集在三线城市,三线城市成手游蓝海市场 2、各游戏类型下载量占比最高的城市分布 四、手游发展趋势预测 1、手机游戏重度化、端游化 2、端游IP手游化 3、支付方式、支付渠道的变革 数据分析报告格式 分析报告的输出是是你整个分析过程的成果,是评定一个产品、一个运营事件的定性结论,很可能是产品决策的参考依据,既然这么重要那当然要写好它了。 我认为一份好的分析报告,有以下一些要点: 首先,要有一个好的框架,跟盖房子一样,好的分析肯定是有基础有层次,有基础坚实,并且层次明了才能让阅读者一目了然,架构清晰、主次分明才能让别人容易读懂,这样才让人有读下去的欲望; 第二,每个分析都有结论,而且结论一定要明确,如果没有明确的结论那分析就不叫分析了,也失去了他本身的意义,因为你本来就是要去寻找或者印证一个结论才会去做分析的,所以千万不要忘本舍果; 第三,分析结论不要太多要精,如果可以的话一个分析

游戏数据分析维度、方法

游戏数据分析维度、方法 1通过网上,收集关于游戏数据分析方面的资料。对各资料进行整理,并提出对游戏行业有价值的专题分析内容。欢迎拍砖! 2数据分析的维度、方法 2.1常规数据分析(设定指标,定期监测) 2.1.1常规数据分析维度 2.1.1.1宏观方面 对宏观指标进行监控(小时、天、周、月、季度、年等),发现异常(人数掉线、新增用户增长异常、ARPU升高等),给公司提供客观的数据来衡量和判断游戏的运营情况 2.1.1.1.1用户数量 注册用户 在线人数(最高在线人数;日、周、月活跃人数;活跃用户平均在线时间、平均在线人数) 2.1.1.1.2 ARPU 每个(平均在线人数、付费用户、活跃用户)每月贡献人民币

运营成本(服务器、带宽、客户服务、推广成本) 产品毛收益 时间卡模式的固定ARPU 增值模式的动态ARPU 时间卡+增值模式的动态ARPU 付费率 2.1.1.1.3 推广力度 推广成本(宣传成本、人力成本、时间成本) 推广效果(各个路径的转化率:看广告人数—目标用户看广告人数—目标用户记住人数—目标用户感兴趣人数—目标用户尝试人数) 2.1.1.1.4 流失率 前期流失率 自然流失率 游戏流失率重要节点分布(初始化页、选线+创建角色、1级、5级、6级、7级、累计) 一般流失率(日、周、月) 2.1.1.1.5 用户自然增长率

2.1.1.1.6病毒性 发送邀请人数、发送率 接受邀请人数、比例接受率 K-Factor=感染率*转化率 2.1.1.2微观方面 对微观指标进行监控(小时、天、周、月、季度、年等),发现异常(道具销量异常等),并指导开发团队修正游戏版本,为新版本和新功能提供决策依据。 2.1.1.2.1 MMORPG游戏: 职业等级分布 任务统计(每个任务参加、完成和取消次数或人数) 经济系统统计 { 总剩余金钱、背包存放金钱总量、仓库存放金钱总量、邮件存放金钱总量经济产出:任务产出金钱、玩家卖给NPC物品获得金钱、打工获得金钱 经济消耗:(任务消耗、NPC购买消耗、道具合成消耗、道具加工消耗、道具打孔消耗、道具镶嵌消耗、装备升级消耗、装备炼化消耗、兑换家族声望消耗、家族升级消耗、修理装备消耗) }

手机游戏市场分析报告

中国手机游戏市场分析报告 (含预测数据) 2011-2014年 本报告 针对市场:国内外手机游戏市场; 针对类型:单机游戏、网络游戏、社交游戏; 数据来源:艾瑞咨询、游戏邦、清科研究、海纳;

一、概述 、手机游戏行业现状 随着智能手机的迅速普及,与3G网络的快速发展,移动互联网的相关业务,已逐渐成为国内各厂商关注的焦点,中国手机游戏市场目前仍然以单机版游戏为主,网游版产品所占比重较低。从整体行业来看,中国手机游戏行业处于快速发展期,近两年来,在电信运营商和手机游戏开发商的联合推动下,中国的手机游戏行业,取得了较快的发展。 目前的手机游戏数量众多,但是质量和内容无法满足现有玩家需求,国内手机游戏开发商自主开发能力与国外开发商比较,力量相对薄弱。目前的手机游戏大多来自于国外,日、韩、欧美等地开发的游戏几乎占据了中国手机游戏市场80%的游戏内容。据相关统计数据显示,手机游戏开发商在我国已经有上千家,但真正上规模的也不过数十家。目前常见的手机平台有Android,塞班,java,IOS。孰优孰劣没有绝对的界限。

、手机游戏未来发展趋势 手机游戏与其他创意型产业相互融合,呈现“多元娱乐”发展趋势 手机游戏在与其他创意产业融合,优势体现在两个方面:一方面,将汲取融合优秀的动漫、影视、网络游戏、文学作品等相关创意产业特色内容资源,弥补本行业内容单一、创意不足的缺势;另一方面,融合发展将使手机游戏产品多样化,在进一步融合网络游戏、网页游戏、SNS等娱乐应用特色的同时,成长为“多元娱乐”产品,进一步提升用户体验。 手机游戏市场参与主体的多元化,竞争日趋激烈 手机游戏行业的参与者逐渐多元化,除原有的手机游戏厂商以外,中国移动、中国电信相继通过手机游戏基地化模式全面切入,传统影视行业厂商通过并购或联合运营方式、互联网游戏厂商通过产品外延方式等,均已加速在手机游戏领域进行布局。手机游戏的盈利模式多样化发展,主体仍借鉴PC网游盈利模式 手机游戏盈利模式多样化,借鉴性的引入网络游戏的盈利模式,如按时收费、包月收费、道具收费、广告内置收费等模式,

数据清洗、数据分析、数据挖掘

数据清洗 1.基本概念 数据清洗从名字上也看的出就是把"脏"的"洗掉",指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为"脏数据"。我们要按照一定的规则把"脏数据""洗掉",这就是数据清洗。而数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。数据清洗是与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 ?残缺数据 这一类数据主要是一些应该有的信息缺失,如供应商的名称、分公司的名称、客户的区域信息缺失、业务系统中主表与明细表不能匹配等。对于这一类数据过滤出来,按缺失的内容分别写入不同Excel文件向客户提交,要求在规定的时间内补全。补全后才写入数据仓库。 折叠错误数据

这一类错误产生的原因是业务系统不够健全,在接收输入后没有进行判断直接写入后台数据库造成的,比如数值数据输成全角数字字符、字符串数据后面有一个回车操作、日期格式不正确、日期越界等。这一类数据也要分类,对于类似于全角字符、数据前后有不可见字符的问题,只能通过写SQL语句的方式找出来,然后要求客户在业务系统修正之后抽取。日期格式不正确的或者是日期越界的这一类错误会导致ETL运行失败,这一类错误需要去业务系统数据库用SQL 的方式挑出来,交给业务主管部门要求限期修正,修正之后再抽取。 折叠重复数据 对于这一类数据--特别是维表中会出现这种情况--将重复数据记录的所有字段导出来,让客户确认并整理。 数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题, 解决问题。对于是否过滤,是否修正一般要求客户确认,对于过滤掉的数据,写入Excel文件或者将过滤数据写入数据表,在ETL开发的初期可以每天向业务单位发送过滤数据的邮件,促使他们尽快地修正错误,同时也可以做为将来验证数据的依据。数据清洗需要注意的是不要将有用的数据过滤掉,对于每个过滤规则认真进行验证,并要用户确认。 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结 论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实 用中,数据分析可帮助人们作出判断,以便采取适当行动。 类型 在统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的

数据分析报告范文

数据分析报告范文 数据分析报告范文 篇一: 数据分析报告范例 201X年中国手游市场年度数据分析报告 一、201X年手游市场基本概况 1、201X年中国游戏市场份额分布: 客户端游戏仍是游戏市场主导,移动游戏暂时无法取代。 2、201X年移动游戏用户规模: 201X年年底,手机游戏用户规模超过5亿,近半数中国人在玩手游3、201X年移动游戏市场实际销售收入: 201X年移动游戏销售收入超过200亿,销售收入是201X年的2倍以上4、201X年手机游戏各类型占比分布: 休闲游戏数量超过6成 5、各游戏类型留存率水平: 动作类游戏留存率最高 二、用户行为透析 1、端游与手游之间用户重合度分析: 端游与手游用户重合度达到2 6.3%,端游用户转化为手游用户的空间较大 2、201X年智能移动游戏操作系统分析: 安卓成手机游戏主要操作系统,苹果手机用户更愿意花钱玩游戏 3、玩家付费行为分析: 休闲射击类游戏付费人数多,重度手游单次付费金额较高

4、玩家付费时间分析: 玩家的付费高峰习惯趋于稳定,付费高峰发生在午饭后和晚上睡觉前 5、支付方式对比: 61%玩家首选支付宝 三、地域分布 1、60%手游用户聚集在三线城市,三线城市成手游蓝海市场 2、各游戏类型下载量占比最高的城市分布 四、手游发展趋势预测 1、手机游戏重度化、端游化 2、端游IP手游化 3、支付方式、支付渠道的变革 篇二: 数据分析报告格式数据分析报告格式分析报告的输出是是你整个分析过程的成果,是评定一个产品、一个运营事件的定性结论,很可能是产品决策的参考依据,既然这么重要那当然要写好它了。我认为一份好的分析报告,有以下一些要点: 首先,要有一个好的框架,跟盖房子一样,好的分析肯定是有基础有层次,有基础坚实,并且层次明了才能让阅读者一目了然,架构清晰、主次分明才能让别人容易读懂,这样才让人有读下去的欲望; 第二,每个分析都有结论,而且结论一定要明确,如果没有明确的结论那分析就不叫分析了,也失去了他本身的意义,因为你本来就是要去寻找或者印证一个结论才会去做分析的,所以千万不要忘本舍果; 第三,分析结论不要太多要精,如果可以的话一个分析一个最重要的结论就好了,很多时候分析就是发现问题,如果一个一个分析能发现一个重大问题,就达到目的了,不要事事求多,宁要仙桃一口,不要烂杏一筐,精简的结论也容易让阅者接

分析报告、统计分析和数据挖掘的区别

分析报告、统计分析和数据挖掘的区别 关于数据挖掘的作用,Berry and Linoff的定义尽管有些言过其实,但清晰的描述了数据挖掘的作用。“分析报告给你后见之明 (hindsight);统计分析给你先机 (foresight);数据挖掘给你洞察力(insight)”。 举个例子说。 你看到孙悟空跟二郎神打仗,然后写了个分析报告,说孙悟空在柔韧性上优势明显,二郎神在力气上出类拔萃,所以刚开始不相上下;结果两个人跑到竹林里,在竹子上面打,孙悟空的优势发挥出来,所以孙悟空赢了。这叫分析报告。 孙悟空要跟二郎神打架了,有个赌徒找你预测。你做了个统计,发现两人斗争4567次,其中孙悟空赢3456次。另外,孙悟空斗牛魔王,胜率是89%,二郎神斗牛魔王胜率是71%。你得出趋势是孙悟空赢。因为你假设了这次胜利跟历史的关系,根据经验作了一个假设。这叫统计分析。 你什么都没做,让计算机自己做关联分析,自动找到了出身、教育、经验、单身四个因素。得出结论是孙悟空赢。计算机通过分析发现贫苦出身的孩子一般比皇亲国戚功夫练得刻苦;打架经验丰富的人因为擅长利用环境而机会更多;在都遇得到明师的情况下,贫苦出身的孩子功夫可能会高些;单身的人功夫总比同样环境非单身的高。孙悟空遇到的名师不亚于二郎神,而打架经验绝对丰富,并且单身,所以这次打头,孙悟空赢。这叫数据挖掘。 数据挖掘跟LOAP的区别在于它没有假设,让计算机找出这种背后的关系,而这种关系可能是你所想得到的,也可能是所想不到的。比如数据挖掘找出的结果发现在2亿条打斗记录中,姓孙的跟姓杨的打,总是姓孙的胜利,孙悟空姓孙,所以,悟空胜利。 用在现实中,我们举个例子来说,做OLAP分析,我们找找哪些人总是不及时向电信运营商缴钱,一般会分析收入低的人往往会缴费不及时。通过分析,发现不及时缴钱的穷人占71%。而数据挖掘则不同,它自己去分析原因。原因可能是,家住在五环以外的人,不及时缴钱。这些结论对推进工作有很深的价值,比如在五环外作市场调研,发现需要建立更多的合作渠道以方便缴费。这是数据挖掘的价值。

如何写好一款产品的运营数据分析报告

如何写好一款产品的运营数据分析报告 戏运营期间,我们可以在后台看到一堆游戏相关数据,对于这些数据我们要怎么怎么进行处理分析呢?下面将围绕一份报告实例做详细的分析。内容主要包括分析目标、分析综述、一周运营数据分析、运营数据总体分析四块内容。 一、 确定分析目标 分析目标主要包括以下三个方面: 分析目的。 分析范围。 分析时间。 如下图所示,分析目标除了主要包括三个方面外,还有备注一栏,这里备注的是计算周期问题。强调一点,我们做运营数据分析的时候通常都会拿更新前和更新后的数据进行比较,因此我们的设定的分析周期一般都会跟着游戏实际的更新情况走。 二、 分析综述 分析综述主要包括两方面的内容

1上周/本周充值数据对比 充值总额 充值人数 服务器数 服务器平均充值 服务器平均充值人数 针对上述内容进行差额对比以及增减率对比,如游戏有特殊要求,可以适当增加其它数据内容。 2上周/本周更新内容对比 主要陈列两周内分别更新的活动内容或一些重大调整。 三、 一周运营数据分析 1本周收入概况 日均充值金额,环比上周日均充值金额 用户ARPU值,环比上周ARPU值 简述与上周或之前的充值情况的比较,如上升还是下降、影响充值的较大的因素。 2新用户概况

新用户就是新进游戏的玩家,这里主要介绍这些新玩家的动态数据,一般以两个月为总时长进行陈列比较,具体周期数据仍以周为单位。 新用户数据主要包括:安装下载数、创建角色数、安装→角色转化率、付费人数、创建角色→付费转化率、ARPU值、次日留存、三日留存、七日留存等,可根据游戏实际情况进行添加。 3活跃用户概况 活跃用户概况主要包括三部分内容: 日均在线人数,环比上周实时在线人数,提升/下降百分比 日均付费用户登陆人数,环比上周付费登陆数,提升/下降百分比 日均活跃玩家数,环比日均活跃玩家数,提升/下降百分比

游戏运营数据分析

任何一款游戏运营,都是以UED、数据分析为导向,如何开发、运营好一款成功的全球社交游戏,是每个社交游戏产品经理头等大事。用数据说话,是一个简单明快的操作方式,但社交游戏的数据如何分类海内外关注点有何区别相信作为每个社交游戏产品经理是非常关心的话题,那么我们就从基础知识入手,逐步梳理出符合运营需求的核心数据环节,抛弃冗长复杂的多类数据,为自己的成功打下扎实的基础。 付费率=付费用户÷活跃用户x100 活跃率=登陆人次÷平均在线人数 ARPU值=收入÷付费用户 用户流失率=游戏当前活跃用户规模÷历史注册总量 同时在线峰值=24小时内同时在线最高达到人数 平均在线=24小时每小时同时在线相加总和÷24小时 中国大陆运营游戏平均同时在线用户=ACU 【有称ACCU】 采用道具收费模式游戏活跃付费用户=APC 活跃付费账户=APA 付费用户平均贡献收入=ARPU 当日登录账号数=UV 用户平均在线时长=TS 最高同时在线人数=PCU 【有称PCCU】 同时在线人数=CCU 付费人数一般是在线人数2~4倍。 活跃用户(玩家):是指通过你的推广代码注册,不属于小号或作弊情况、正常进行游戏一个月以上未被官方删除的用户视为活跃用户。 您推广的两个用户目前还没有通过至少1个月的审查时间,您可以在您的推广纪录中查看您推广用户的注册时间。且这两个用户需要满足上述对活跃玩家的定义才能称为活跃玩家!

活跃付费账户=APA。 每个活跃付费用户平均贡献收入=ARPU。 【活跃天数计算定义】 活跃天指用户当天登陆游戏一定时间、认定用户当天为活跃、活跃天数加1天。 当天0:00-23:59登陆游戏时间2小时以上用户当天为活跃天、活跃天数累积1天。当天0:00-23:59登陆游戏时间小时至2小时、活跃天数累积天。 当天0:00-23:59登陆游戏时间小时以下、不为其累积活跃天数。 每日: ---------用户数量描述 在线人数:(取的当日某个时刻最高在线,一般发生在9:30左右) 新进入用户数量:(单日登录的新用户数量) 当日登录用户数量: 每日登录/在线: ---------盈利状况描述 每日消耗构成:(根据金额和数量做构成的饼状图) 每日消耗金额: 每日消费用户数量: 每日充值金额: 每日充值用户数量: 每日充值途径: ---------产品受关注程度描述 官网首页访问量:

数据分析报告范文

数据分析报告范文各位读友大家好,此文档由网络收集而来,欢迎您下载,谢谢 一、2014年手游市场基本概况 1、2014年中国游戏市场份额分布:客户端游戏仍是游戏市场主导,移动游戏暂时 无法取代。 2、2014年移动游戏用户规模:2014年年底,手机游戏用户规模超过5亿,近半数中国人在玩手游 3、2014年移动游戏市场实际销售收入:2014年移动游戏销售收入超过200亿,销售收入是2013年的2倍以上 4、2014年手机游戏各类型占比分布:休闲游戏数量超过6成 5、各游戏类型留存率水平:动作类游戏留存率最高 二、用户行为透析 1、端游与手游之间用户重合度分析:端游与手游用户重合度达到%,端

游用户转化为手游用户的空间较大 2、2014年智能移动游戏操作系统分析:安卓成手机游戏主要操作系统,苹果手机用户更愿意花钱玩游戏 3、玩家付费行为分析:休闲射击类游戏付费人数多,重度手游单次付费金额较高 4、玩家付费时间分析:玩家的付费高峰习惯趋于稳定,付费高峰发生在午饭后和晚上睡觉前 5、支付方式对比:61%玩家首选支付宝 三、地域分布 1、60%手游用户聚集在三线城市,三线城市成手游蓝海市场 2、各游戏类型下载量占比最高的城市分布 四、手游发展趋势预测 1、手机游戏重度化、端游化 2、端游IP手游化 3、支付方式、支付渠道的变革 数据分析报告格式

分析报告的输出是是你整个分析过程的成果,是评定一个产品、一个运营事件的定性结论,很可能是产品决策的参考依据,既然这么重要那当然要写好它了。 我认为一份好的分析报告,有以下一些要点: 首先,要有一个好的框架,跟盖房子一样,好的分析肯定是有基础有层次,有基础坚实,并且层次明了才能让阅读者一目了然,架构清晰、主次分明才能让别人容易读懂,这样才让人有读下去的欲望; 第二,每个分析都有结论,而且结论一定要明确,如果没有明确的结论那分析就不叫分析了,也失去了他本身的意义,因为你本来就是要去寻找或者印证一个结论才会去做分析的,所以千万不要忘本舍果; 第三,分析结论不要太多要精,如果可以的话一个分析一个最重要的结论就好了,很多时候分析就是发现问题,

数据分析与挖掘在金融方面的应用

数据挖掘在操作风险的量化和管理中的应用 根据《新巴塞尔资本协议》()给出的定义,“操作风险是指由于不正确的内部操作流程、人员、系统或外部事件所导致的直接或间接损失的风险。”这一定义侧重于从操作风险的成因包括法律方面的风险,但将策略风险和声誉风险排除在外。随着世界经济和银行业的发展,多种可供分析的操作风险管理方法正在逐渐的形成,商业银行多年来一直试图对它进行一定程度的控制,定性并尝试测量这一风险,作为非金融机构的财务公司也不例外。在量化模型技术的推动下,操作风险量化测评和管理的技术获得了相当大的发展。操作风险管理能通过减少风险、改善服务质量和降低经营成本,从而形成一种竞争优势并在股东价值中得到相应体现。本文拟从数据分析与挖掘角度入手,对财务公司操作风险的量化测评和管理进行初步探讨和简要分析。 一、解决问题的整体思路 财务公司要实现科学且合理的对操作风险进行量化测评与管理,一般要进行以下几个步骤的工作:数据挖掘→数据分析→模型构建→模型检验。其具体思路如下图所示: 图:操作风险量化测评和管理的整体思路

分类梳理,明确其业务流程,找出关键节点,并在关键节点处科学设置风险监测指标,通过对风险监测指标的观测来纵向监控各业务模块的操作风险。需要注意的是,依据对操作风险模型构建的要求,财务公司在设置风险检测指标时,将这些指标划分为操作风险事件发生频率指标(以下简称为“频率指标”)和操作风险事件损失指标(以下简称为“损失指标”)。在完成风险指标设置的工作后,财务公司对上述指标进行横向分类,即按照人员、系统、流程和外部事件所引发的四类风险,将上述风险监测指标分别归类于七种表现形式:内部欺诈,外部欺诈,聘用员工做法和工作场所安全性,客户、产品及业务做法,实物资产损坏,业务中断和系统失灵,交割及流程管理。财务公司通

大数据、数据分析和数据挖掘的区别

大数据、数据分析和数据挖掘的区别 大数据、数据分析、数据挖掘的区别是,大数据是互联网的海量数据挖掘,而数据挖掘更多是针对内部企业行业小众化的数据挖掘,数据分析就是进行做出针对性的分析和诊断,大数据需要分析的是趋势和发展,数据挖掘主要发现的是问题和诊断。具体分析如下: 1、大数据(big data): 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产; 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)Veracity(真实性) 。 2、数据分析:

是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。 数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。 3、数据挖掘(英语:Data mining): 又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 简而言之: 大数据是范围比较广的数据分析和数据挖掘。 按照数据分析的流程来说,数据挖掘工作较数据分析工作靠前些,二者又有重合的地方,数据挖掘侧重数据的清洗和梳理。 数据分析处于数据处理的末端,是最后阶段。 数据分析和数据挖掘的分界、概念比较模糊,模糊的意思是二者很难区分。 大数据概念更为广泛,是把创新的思维、信息技术、统计学等等技术的综合体,每个人限于学术背景、技术背景,概述的都不一样。

数据分析与挖掘实验报告

数据分析与挖掘实验报告

《数据挖掘》实验报告 目录 1.关联规则的基本概念和方法 (1) 1.1数据挖掘 (1) 1.1.1数据挖掘的概念 (1) 1.1.2数据挖掘的方法与技术 (2) 1.2关联规则 (5) 1.2.1关联规则的概念 (5) 1.2.2关联规则的实现——Apriori算法 (7) 2.用Matlab实现关联规则 (12) 2.1Matlab概述 (12) 2.2基于Matlab的Apriori算法 (13) 3.用java实现关联规则 (19) 3.1java界面描述 (19) 3.2java关键代码描述 (23) 4、实验总结 (29) 4.1实验的不足和改进 (29) 4.2实验心得 (30)

1.关联规则的基本概念和方法 1.1数据挖掘 1.1.1数据挖掘的概念 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。在最近十几年里,数据库中存储的数据急剧增大。数据挖掘就是信息技术自然进化的结果。数据挖掘可以从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的但又是潜在有用的信息和知识的过程。 许多人将数据挖掘视为另一个流行词汇数据中的知识发现(KDD)的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤。知识发现过程如下: ·数据清理(消除噪声和删除不一致的数据)·数据集成(多种数据源可以组合在一起)·数据转换(从数据库中提取和分析任务相关的数据) ·数据变换(从汇总或聚集操作,把数据变换和统一成适合挖掘的形式) ·数据挖掘(基本步骤,使用智能方法提取数

据模式) ·模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) ·知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。 1.1.2数据挖掘的方法与技术 数据挖掘吸纳了诸如数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成等许多应用领域的大量技术。数据挖掘主要包括以下方法。神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield 的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art 模型、koholon模型为代表的,用于聚类的自组

关于手机游戏的问卷调查报告

关于手机游戏的问卷调查报告

《中国特色社会主义理论与实践研究》调研报告 关于手机游戏使用情况的问卷调研报告 摘要:随着4G时代的普及,中国手机市场日益繁荣。而随着移动互联网强势崛起,手机游戏慢慢成为市场主流。手机游戏作为手机应用软件中的一匹黑马凸现在人们的眼前,手机游戏也成为业界高度关注的新领域之一。跟电脑游戏相比,手机游戏对硬件要求低,受众更广,用户也更多,所以倍受青睐。智能手机为我们的生活带来许多方便,然而,越来越多的人却因此“成瘾”。各大游戏厂商专注于手机市场后,手游游开始占据人们更多的时间。为此,对于手机游戏的讨论也成为社会的关注点,对于手机游戏的调研分析是了解当今手机游戏现状必不可少的途径。本文在对手机游戏使用情况进行调研之后,分析了手机游戏上瘾的原因,进而提出了戒除手机游戏的方法途径。 关键词:手机游戏4G 上瘾 专业: 学号: 姓名: 2017年4月

一、调查方案 (一)、调查背景 手机游戏从诞生开始就被誉为中国互联网行业的下一个金矿。自2001年网络游戏成功之后,手机游戏也成为业界高度关注的新领域之一。如今,随着4G 时代的普及,中国手机市场也日益繁荣。而随着移动互联网强势崛起,手机游戏慢慢成为市场主流。2017年3月24日,全球领先的移动互联网第三方数据挖掘和整合营销机构iiMedia Research(艾媒咨询)权威发布《2016-2017中国手机游戏市场研究报告》。报告显示,2016年中国手游用户规模达5.23亿人,市场规模783.2亿元,增长速度持续放缓。中国通信产业向4G升级促进了手机网游的增长,网络、多媒体表现、平台融合等促成了手机网游的崛起。受到以中国移动为代表的运营商的推广以及无线网络的进一步建设,手机游戏虽然现在不能像传统网络游戏般强健,但也开始发展的如火如荼。iiMedia Research(艾媒咨询)数据显示,手游用户渗透率提升,超七成用户玩过手游,其中有48.1%玩家有为手游付费的经历,而付费的主要原因在于购买游戏道具装备。 随着中国手机游戏市场的发展,用户认知将逐步提升,产业链各环节应在进行市场营销推广的同时充分重视终端及手机游戏的更新发展,以不断完善的产品服务满足用户需求,在用户认知的基础上,实现手机游戏商业价值的提升,充分挖掘手机游戏的商业价值。而学生作为最具潜力的消费群体,其对手机游戏的了解和需求对手机游戏未来的发展趋势具有重大影响。 (二)、调查目的 1、研究人们使用手机游戏的基本情况。 2、研究影响人们使用手机游戏的原因。 3、研究人们对手机游戏的的认识和看法。 4、提出戒除手机游戏原因和方法。

游戏数据分析:转化率的四种形式

公司简介商业计划书创业计划书节日庆典新品发布会创业融资项目介绍模板策划项目汇报市场营销活动策划工作计划策划书营销管理节日策划推广策划策划方案商务策划工作汇报企业报告企业宣讲校园宣讲总结报告总结汇报个人总结工作总结工作报告模板教育教学教育培训教学课件主题教育班会育人教学计划班会课件教学研究模板家长会思想教育小学教学中学教学大学教学幼儿教学 数据分析:转化率的 四种形式 2020-20XX版 内部资料注意保管

在数据分析中我们经常会使用各种类型的转化率分析,在游戏数据分析中,我们对于转化率的使用更为频繁,比如渠道分析,玩家购买流程转化率等等。在实际使用过程中,总结出来了四种转化率的形式,这里简单说说。 回炉型转化率 所谓回炉型转化率指的是在转化的第一步到第二步的转化过程中就出现了较大的障碍,从第一步到第二步,转化率变化比较大,这种转化率形式的出现,就需要回炉进行问题分析和处理,这种类似的转化率比如在渠道用户推广时可以作为一个渠道用户质量把控的分析方法,同时,也是检测游戏本身在新用户导入时的新手引导等功能的检测。 常规型转化率 如上图所示,整体来看,不同步骤之间的转化率的变化是比较缓慢的,并没有出现某一个步骤的大幅下滑,且整体的转化率趋势保持的还是相对平稳的,此种就是常规型的转化率。一般来说达到这种类型的标准就很不错了。由于转化率的这种模型结构在很多地方都能用到,所以这里不具体举例子来说明这个问题。 优质型转化率 所谓优质型转化率就是在常规型转化率的基础上表现的更好一点,只是在几步之间的转化损失更小一点,即下降速度更加缓慢,在很多涉及到转化率的分析上,这种类型的转化率属于优质型的转化率。但是一般而言是达不到的。 问题型转化率 如上图所示,所谓问题型转化率,往往问题都是出现的比较怪异的,一般而言,都是前几步转化率都比较理想,但是这其中后续的某一步出现了问题,这种落差都会比较明显,在转化率表现上,就是突然某一步的转化率下滑较大,这种形式的转化率一般会出现在购买流程转化率分析,某一个事件的转化过程中也会出现这种下滑。 这样的转化率问题定位其实比较快速和直接,能够马上进行修补,不同于回炉型的转化率,这种转化效果只是需要针对某一步进行优化就可以了,而不是全局性的优化。

《大数据时代下的数据挖掘》试题和答案及解析

《海量数据挖掘技术及工程实践》题目 一、单选题(共80题) 1)( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到 和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法? (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型:(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作:( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法: (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是: (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法? (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方 法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年 级110人。则年级属性的众数是: (A) A.一年级 B.二年级 C.三年级 D.四年级

相关文档