原标题:想成为数据产品经理,先掌握这些数据分析方法论

本文根据GrowingIO创始人&CEO张溪梦与产品经理在线交流问题整理编辑,希望对产品经理提升数据分析能力有较好的帮助。

何谓数据产品

一个优秀的数据产品经理必须要具备各种技能,
要了解自己的用户,明晰用户的核心需求,而最重要的是一定要掌握数据分析技能、会用数据分析工具。让我们通过文章来看看:有哪些实用的数据分析方法吧。

▶如何获取数据,获取什么样的数据?

不知道这是不是印证了若不是找工作也不会跟数据产品结梁子呢,呵呵!言归正传,数据产品这个词目前看起来还是来自职位描述,至于什么叫数据产品,大约业界还没有定论。姑且引用老读悟的定义“数据产品是可以发挥数据价值去辅助用户更优的做决策(甚至行动)的一种产品形式。它在用户的决策和行动过程中,可以充当信息的分析展示者和价值的使能者。从这个角度讲,搜索引擎、个性化推荐引擎显然也是数据产品。狭义范畴的数据产品,比如大家熟知的淘宝数据魔方、百度指数、电商的CRM平台、各种公司内部的数据决策支持系统等都是数据产品。”搜索引擎、推荐引擎代表了当今数据挖掘领域最成功的商业案例,而魔方、指数、CRM等产品也是数据分析和决策的典型应用,因此老读悟的这个定义我还是相当认同的,或者更简单的说,凡是以数据价值驱动为核心的产品形式都是数据产品,说得更艺术一点,
the art of turning data into product 。

永利游戏网址 1

Q1:一个电商平台,应该着重关注什么数据,怎样设计数据后台?


产品经理的概念在不断泛化。近些年来,随着互联网行业的发展,越来越多的企业意识到了大数据和精细化运营的重要性,为了更好地挖掘数据的价值,指导业务的优化和发展,数据产品经理应运而生,他们基于数据分析方法发现问题,并提炼关键要素,设计产品来实现商业价值。

A1:电商数据的核心指标一般有:GMV,Transations(交易数量),ASP(均价),购物车大小,用户的复购率,购买频次,年度复购率。这样的指标很多。:我觉得有三类的指标需要关注,第一:交易数据,第二:用户行为数据,第三:用户来源数据。

方法论

虽为产品经理,但要真正解决核心问题,不免要在前期和中期进行大量的数据分析工作,那么,实用的数据分析方法有哪些呢?

这里面,我觉得您可以根据自己的资源状况来设优先级。最直接的就是交易数据,然后最重要的是行为数据,因为所有的电商提供的是“互联网产品”而不仅仅是“所销售的产品”。第三就是流量的数据的分析,因为这里涉及到获取客户的成本。


一、业务分析类1.1 杜邦分析法

Q2 :
如何收集自己需要的数据,面对杂乱无序的数据该如何分析,如何保证数据的准确性

这里主要探讨一下,如何设计或者评价数据产品?也就是方法论的问题。说到数据产品,不能不提一下数据分析和数据挖掘。常碰到某牛人对着报表鄙视的说这叫数据分析,根本算不上数据挖掘,但是在我的理解里,数据分析其实也是数据挖掘,只是一种浅层次但是非常简洁有效的数据挖掘形式而已,因此后文不再使用数据分析这个词,而是围绕数据挖掘来思考数据产品的本质。

杜邦分析法目前主要用于财务领域,通过财务比率的关系来分析财务状况,其核心要点是将一个大的问题拆分为更小粒度的指标,以此了解问题出在了哪儿,从而对症下药。

A1:不同行业,不同业务会有相同宏观的指标,也有细化到本行业,本业务的指标。需要从宏观到微观的拆解指标。大量的数据如何为我们所用?需要了解产品业务,明确问题的本质,大量的深入的产品实践。大胆的提出假设,然后通过数据理性的验证。我们还会有更多的线下线上活动帮助大家拆解数据分析指标。

《Data Mining
Techniques》这本书里对数据挖掘的定义是:数据挖掘是一项探测大量数据以发现有意义的模式和规则的业务流程。“发现有意义的模式和规则”也就是我理解的价值驱动与业务目标,进一步的这些任务又可归纳为分类和预测、评估、关联规则、聚类、孤立点等,而为了解决上述任务所需要的方式方法则包括各种统计学模型、决策树、聚类算法、人工智能等等数学和计算机技术。

以电商行业为例,GMV(网站成交金额)是考核业绩最直观的指标,当GMV同比或环比出现下滑时候,需要找到影响GMV的因素并逐一拆解。

关于数据准确性可以不同的工具去验证。比如同时安装多个数据统计工具。比如比较客户端和服务端的数据统计差异。

数据挖掘的方法论有很多种定义,有DMAIC模型,CRISP-DM模型,SEMMA模型等等,虽然细节不一,但是大体流程并无差异。我个人比较喜欢简洁的DMAIC模型,一个是因为Kaushik的经典《Web
Analytics2.0》里遵循的思想便是这个,更重要的是它引入了循环控制的理念,而不是简单的线性流程。DMAIC模型包括:

永利游戏网址 2

Q3: 做内容的网站,如何结合业务判断需要获取哪些和用户相关的数据?

Define定义需求,即把业务问题转化为数据挖掘问题

GMV下降如果是因下单用户减少所造成的,那么是访客数(流量)减少了,还是转化率下降了呢?如果是访客数减少了,那是因为自然流量减少了,还是因为营销流量不足?

A3:最基本的指标是:页面浏览量、访问量、独立访客数、跳出率、页面停留时长、网站停留时长、退出率、转化率,页面退出率……

Measure 测量数据,即理解、收集并加工数据,做好准备

如果是自然流量下降的话,可能需要在用户运营和产品运营端发力,如果是营销流量不足,那么可以通过营销活动或者站外引流的形式增加曝光量。

内容热度:分享次数、推荐次数、点赞次数、评论数

Analyze 分析建模 ,即构建模型、评估模型的过程

同样,如果是转化率的问题,那么需要对用户进行细分,针对不同阶段的用户采取不同的运营策略,关于用户的部分,这里不做赘述,有兴趣的朋友可以关注后面的文章。

用户:新用户、活跃用户、沉寂用户占比的变化,增长的趋势等等

Improve 解决问题,即部署模型来解决目标问题

最后,如果是因为客单价不高,那么需要进行定价及促销的方案优化,比如识别具有GMV提升潜力的商品进行定价优化,评估当前促销的ROI,针对选品、力度和促销形式进行优化。同时通过关联商品的推荐或商品套装促销的形式,激发用户购买多件商品,也可以有效提高客单价。

Q4:
不强制登陆的app,如何定义独立用户。目前我们是获取手机信息,但并不准确

Control反馈控制,即评估结果重新开始循环,不断改进

1.2 同比热力图分析法

A4:不强制登录,可以在app和设备的基础信息在不侵犯用户隐私的情况下,计算一个比较固定的ID。这个ID应该基本上能够判断一个稳定的用户。但是它并不和手机号码或者设备号做深度绑定。在网站上类似cookie的方法。

DMAIC模型

同比热力图分析法这个名称是我自己造的,其实无非是把各个业务线的同比数据放到一起进行比较,这样能更为直观地了解各个业务的状况。

Q5: 若想了解某个行业,有哪些平台可以拿到相对靠谱数据以供分析?

基于数据挖掘的方法论,回头来理清产品设计的方法论。通常对于互联网产品设计,比较一致的观点是《用户体验要素》里面的五层模型,战略层→范围层→结构层→框架层→表现层。我相信对于产品经理来说五层模型属于入门,但是对于不同类型的产品必然有不同的解读,比如SNS产品和电商产品的五层模型关注的问题肯定有差异,因此这里还是以淘宝魔方为例赘述一遍自己对于数据产品的五层模型理解。

永利游戏网址 3

A5:这个部分需要的工具有很多,看您的业务是以App为主,还是Web为主。基本上应该从流量,市场占有率,还有用户交互使用深度、舆情等角度入手。每一个都有不同的工具能够辅助。比如说Alexa,AppAnnie,艾瑞的互联网行业研究报告,Gartner的研究报告,IDC,TalkingData的游戏行业研究等等都是一些好的起点。

战略层,用户需求和产品目标,比如淘宝魔方的目标用户是品牌卖家,那么它到底帮助品牌卖家用户解决什么问题?对于DMAIC来说,相当于解决Define的问题,即数据要实现什么价值。

构建一张同比热力图大致需要三步:

▶数据分析如何驱动产品优化?

范围层,功能规格和内容需要,比如淘宝魔方有哪些功能,这些功能有哪些指标,每个指标反应哪些问题?对于DMAIC来说,相当于解决Measure和Analyze的问题,即价值表现为哪些数据指标,这些指标的来龙去脉如何。

  1. 按照杜邦分析法将核心问题进行拆解,这里仍以电商为例,我们将GMV拆成了流量、转化率、商品均价和人均购买量,即GMV=流量*转化率*商品均价*人均购买量;
  2. 计算每个业务各项指标的同比数据;
  3. 针对每一项指标,对比各业务的同比高低并设定颜色渐变的条件格式,以上图中的转化率同比为例,业务5转化率同比最高,为深橙底色,业务3转化率同比最低且为负值,因此设定为蓝色底色加红色字体。

Q1:2B企业应应用如何做基于数据驱动的产品设计与改进?

结构层,交互设计和产品架构,比如淘宝魔方的各种指标怎么分类组织,不同维度的相互关系如何?

通过同比热力图的分析,首先,可以通过纵向对比了解业务自身的同比趋势,其次,可以通过横向对比了解自身在同类业务中的位置,此外,还可以综合分析GMV等核心指标变动的原因。

A1:SaaS企业的数据驱动产品设计非常重要。首先,最基础的开始是Product
Usage Metrics。因为SaaS产品都要解决一个企业应用的场景。
而这个场景在业务上的被重现频次,决定了SaaS软件的基本交互频次。所以登录批次,使用深度(事件数/访问)等最基本的指标是最粗放的指标。

框架层,界面设计和导航设计,比如流失顾客指标是使用图还是用表格?使用什么类型的图?数据筛选器和图表怎么布局?

除了电商业务的分析以外,同比热力图同样适用于互联网产品数据指标的监控及分析,该分析方法的关键点在于拆解核心指标,在本文后面的产品运营类方法中将会介绍相关指标的拆解方法。

最重要的,是产品每一个功能的使用者数量,使用的频次,转化漏斗,转化率。

表现层,视觉设计,比如子行业趋势图使用什么颜色分类?宝贝列表是否显示图片?上述三层,对于DMAIC来说,相当于解决Improve的问题,即数据以什么样的形式来展现其价值。

1.3 类BCG矩阵

请记住,这些分析必须要在“用户”级别能够做分析,而不是一个单纯流量级别的分析,才有未来的核心意义。然后将usage在客户公司级别进行汇总,比较在公司级别的使用度,使用深度和未来的续约付费率一般呈正相关。

具体的产品设计过程中不断运用上述模型进行思考迭代,最终才成型完整的产品,对于DMAIC来说,这就是Control的内涵。

BCG矩阵大家都非常熟悉了,以市场占有率和增长率为轴,将坐标系划分为四个象限,用于判断各项业务所处的位置。

还有就是整个SaaS页面的优化,比如说注册流,注册转化率,注册用户向深度用户的转化率,深度用户向付费用户的转化率。SaaS的数据分析是很深入的话题,我就是分享一些最基本的指标。

可以看到,数据挖掘和产品设计在方法论上是具有内在统一的,这就是我所理解的数据产品设计的方法论。

这里想讲的并非传统的BCG矩阵,而是BCG矩阵的变阵,或者叫类BCG矩阵。

Q2:关于留存率,互联网金融借贷产品是典型的低频,一个人不可能经常上来借钱或者出借,看留存率还有意义么?

数据产品设计模型

根据不同的业务场景和业务需求,我们可以将任意两个指标作为坐标轴,从而把各类业务或者用户划分为不同的类型。

A2:留存率有意义,因为留存是一个普遍的概念。唯一的一个就是您专注“频次”的不同。比如说买汽车,美国的整个汽车购买行为,不可能用天来衡量,而要用年。因此美国的汽车制造商,就持续的按照“月份”给每一个不同的区隔发送不同的营销方案。互联网金融也有他的产品生命周期,这要求您来制定营销策略,找到那个“频次”,以此为开始进行营销产品规划。

具体来说,任何一款数据产品需要先思考这个产品的目标用户是谁,帮它解决什么问题,给它带来什么价值,也就是确定产品的业务目标。继续思考,为了实现业务目标,需要哪些数据指标?这些数据指标是怎么来的?这些指标如何反应解决问题的思路?当我们确定了数据指标后,从技术的角度讲就是数学建模的问题了,从产品的角度讲需要明确第三个环节,就是这些指标以怎么样的形式展示?如何更好的发挥它的价值?这就从抽象概念进化到具体的产品形式。数据产品的设计过程也就是基于上述三点进行不断的循环迭代的过程。

网站地图xml地图