常用数据分析模型与方法

常用数据分析模型与方法

在进行数据分析过程中,通常需要使用各种模型来证明自己的分析观点,一是为了使自己的结论更具备说服力,二是让自己的论证过程更具备逻辑性和条理性。

FineBI 推出部分数据分析方法,帮助用户更好的使用 BI 进行数据分析。

分析类型模型/方法
对外用户分析RFM 分析
对外用户分析ABC分析
对外用户分析波士顿矩阵图
对外用户分析购物篮分析-关联规则
对外用户分析留存分析
对外用户分析用户画像分析
对外用户分析月复购分析
对外用户分析AARRR
对外用户分析用户运营分析
对外用户分析用户流入流出分析
对外用户分析用户生命状态分析
对外用户分析用户粘性分析
内部营运分析需求分析方法-KANO模型
内部营运分析杜邦分析
内部营运分析盈亏平衡分析

1. RFM分析

1.1 概念

RFM 分析是美国数据库营销研究所提出的一种简单实用客户分析方法,发现客户数据中有三个神奇的要素:

  1. 最近一次消费时间(R):客户距离最近的一次采购时间的间隔。
  2. 最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。
  3. 最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。

这三个要素构成了数据分析最好的指标。
在这里插入图片描述

1.2 解决的问题

RFM 分析就是通过三个关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户进行相应的营销策略。

1.3 预期效果

RFM 分析后,将客户划分为了不同分类,数据分析效果如下图所示:
在这里插入图片描述
在这里插入图片描述

1.4 实现思路

创建分析主题对原始数据进行加工。实现思路如下图所示:

1)创建分析主题,选择 RFM 分析所需字段。

2)对数据进行加工,求得 3 个关键指标及其平均值。

3)通过和平均值比较,向量化三个指标。

4)根据特征向量客户分类。
2.5 划分客户类型
已经得到客户的特征向量值,根据以下表格可将客户划分分类

客户特征客户分类
重要价值客户 (111)最近消费时间近、消费频次和消费金额都很高(VIP)
重要发展客户(101)最近消费时间较近、消费金额高,但频次不高,忠诚度不高,很有潜力的用户,必须重点发展。
重要保持客户(011)最近消费时间较远,消费金额和频次都很高。
重要挽留客户(001)最近消费时间较远、消费频次不高,但消费金额高的用户,可能是将要流失或者已经要流失的用户,应当基于挽留措施。
一般价值客户(110)最近消费时间近,频率高但消费金额低,需要提高其客单价。
一般发展客户(100)最近消费时间较近、消费金额,频次都不高。
一般保持客户(010)最近消费时间较远、消费频次高,但金额不高。
一般挽留客户(000)都不高。

2. 帕累托分析

1)概述

  • 帕累托分析又叫 ABC 分析,分类的核心思想:少数项目贡献了大部分价值。
  • ABC 分类法全称应为 ABC 分类库存控制法。又称帕累托分析法或巴雷托分析法、柏拉图分析、主次因分析法 、ABC分析法、ABC 管理法,平常也称之为「80 对 20」规则。
ABC 分类
A 类物品非常重要数量占比少,价值占比大
:B 类物品比较重要没有A类物品那么重要,介于 A、C 之间
:C 类物品一般重要数量占比大但价值占比很小

分类的核心思想:少数项目贡献了大部分价值。
以款式和销售量为例:A 款式数量占总体 10% ,却贡献了 80% 的销售额。
在这里插入图片描述

注:二八分析与 ABC 分类法大致相同,都是少数项目贡献了大部分价值。不同之处是ABC 分类法将对象分三类,而二八分析则为 A、B 两类,A
类品牌商品占总体的一小部分,贡献了 80%的销售额。

把产品或业务分为A、B、 C三类,用于分清业务的重点和非重点,反映出每类产品的价值对库存、销售、成本等总价值的影响,从而实现差异化策略和管理。
在这里插入图片描述

2.2 解决的问题

根据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式。它把被分析的对象分成 A、B、C 三类,三类物品没有明确的划分数值界限。

2.3 预期效果

在「商场销售帕累托分析」的组件「商品销售帕累托图」中,可以查看各品牌商品销售额及对应的销售额累计占比。根据 ABC 分析法,将品牌商品按销售量降序排列,依次分成销售额占比为 80% ,10%,10% 对应 A 类, B 类, C 类三类品牌,用不同颜色的柱形图展示出来,如下图所示:

在这里插入图片描述

2.4 实现思路

创建分析主题对已有的数据进行数据加工或者在组件制作时利用公式添加计算指标,求出累计占比指标,并在制作组件时,根据累计占比将对象进行 ABC 占比划分(二八分析则将对象进行二八占比划分),最后通过不同颜色的柱形图体现分析结果。数据处理思路如下图所示:
在这里插入图片描述
实现 ABC 占比划分的关键是求出「累计占比」指标,再根据累计占比指标进行划分。本文介绍了两种方法求累计占比。

示例一:是在仪表板内通过添加计算指标,使用公式进行数据加工的出「累计占比」指标。

示例二:直接在主题数据中计算得出「累计占比」指标。得出的指标可方便在多个组件中反复使用。

2.5. 结论分析

创建仪表板得出以下结论:

品牌名称商品品牌数量占比商品品牌销售额占比
A 类品牌ZIPPO(之宝)、PAW IN PAW、NEW BALANCE(新百伦)、HANG TEN40%80%
B 类品牌SINOMAX(丝梦露)、O.C.T.MAMI(十月妈咪)20%10%
C 类品牌WHO.A.U、RACB JJQN、LESPORTSAC、X.ZHINING40%10%

3. 波士顿矩阵

1)概述

波士顿矩阵通过销售增长率(反映市场引力的指标)和市场占有率(反映企业实力的指标)来分析决定企业的产品结构。

波士顿矩阵将产品类型分为四种,如下图所示:
在这里插入图片描述

3.2 解决的问题

波士顿矩阵通过销售增长率(反映市场引力的指标)和市场占有率(反映企业实力的指标)来分析决定企业的产品结构

3.3 实现思路

通过设置警戒线,将区域分成四块象限,进而观察数据。

同时设置钻取目录,挖掘更细粒度的数据。

3.5. 结论分析

根据散点图,可以大致分析出这个公司的客户画像:

  1. 消费次数超过平均值,每次消费力度也超过平均水平的客户:判定为明星客户,这类客户需要重点关注,并给予最高的礼遇;
  2. 消费次数超过平均值,但每次消费力度未达到平均水平的客户:被判定为现金流客户,这类客户通常消费频次比较频繁,能给企业带来较为稳定的现金流,这类客户是企业利润基石;
  3. 消费未达到平均值,但每次消费力度超过平均水平的客户:是问题客户,这类客户最有希望转化为明星客户,但是因为客户存在一定的潜在问题,导致消费频次不高,这类客户需要利用客服进行重点跟进和长期跟踪;
  4. 消费未达到平均值,消费力度也未达到平均水平的客户:属于瘦狗客户,这类客户通常占企业客户的大多数,只需要一般性维护,不需要投入重点维系。

4.购物篮分析

1. 概述

1.1 概念
通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,即「购物篮分析」。

使用本文可计算出「提升度」,若提升度>1,则证明两种商品关联度高,两种商品的组合方式有效,可以考虑放在一起售卖。

注:本文计算中的左右合并会产生笛卡尔积,造成数据里 N 倍膨胀,建议用户在实际使用时取小部分数据进行购物篮分析,以免造成数据过量膨胀。若需要对较多数据进行商品关联分析,建议使用:购物篮之计算连带率

1.2 解决的问题

找出顾客购买行为的模式:

比如用户买了A商品,是否会对B商品产生什么影响?

不同的用户是否具有不同的购买模式?

哪些产品应该放在一起进行捆绑销售?

1.3 预期效果

在这里插入图片描述
在这里插入图片描述

1.4 实现思路

关联分析由以下指标进行衡量。

定义概率描述举例说明
支持度支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。物品集A对物品集B的支持度support P(A n B)今天共有10笔订单,其中同时购买牛奶和面包的次数是6次,那么牛奶+面包组合的支持度就是6/10=60%
置信度置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率物品集B对物品集A的置信度P(B#A)今天共有10笔订单,其中购买A的次数是8,同时购买A和B的次数是6,则其置信度是6/8=75%
提升度先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。L= P(A n B) /[P(A)*P(B)]今天共有10笔订单,购买A的次数是8,购买B的次数是6,购买A+B的次数是6,那么提升度是0.6/(0.8*0.6)>1,因此A+B的组合方式是有效的。
  • 支持度计算公式:同时购买A和B订单数/总购买订单数
  • 置信度计算公式:同时购买A和B订单数/购买A的订单数
  • 提升度计算公式:支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))

需求分析方法-KANO模型

1. 概述

1.1 背景

李雷同学作为一个产品,经常会遇到非常多的产品需求, 开发同学忙的不可开交, 用户又似乎什么都想要。开发产品资源有限,怎么才能捞出真正的用户需求?给真正重要的需求高优先级?

李雷决定引进「KANO模型」,进行系统的需求梳理,对需求进行分析和提炼,提高效率。

1.2 分析过程

KANO模型:是对用户需求分类和优先排序的有用工具,以分析用户需求对用户满意的影响为基础,体现了产品性能和用户满意之间的非线性关系。

李雷对约 100 个用户进行了调研,使用 KANO 模型绘制出四象限图,如下图所示:
在这里插入图片描述
四个象限对应了四种需求类型,它们的优先级排序为:必备型需求>期望型需求>兴奋型需求>无差异需求。

  1. 必备型需求(必须有):即常说的痛点。对于用户而言,这些需求是必须满足的,理所当然的。当不提供此需求,用户满意度会大幅降低。这类是核心需求,也是产品必做功能。
  2. 期望型需求(应该有):当提供此需求,用户满意度会提升;当不提供此需求,用户满意度会降低。通常作为竞品之间比较的重点。
  3. 兴奋型需求(可以有):惊喜型产品功能,超出用户预期,往往能带来较高的忠诚度。不提供也不会降低用户满意度。
  4. 无差异需求(可以没有):用户根本不在意的需求,对用户体验毫无影响。尽量规避做此类型功能。

1.3 分析结果

李雷将自己做好的仪表板分享给了同事,并决定此次功能更新增加「功能2、功能3、功能5、功能8」。有了数据支撑,大家都很认同他的决定,罕见的没有出现以往为增加哪个功能而争得不可开交的局面,提升了效率。

6.杜邦分析

1.1 概念

杜邦分析法利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效。

其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。

1.2 预期效果

详情仪表板请参见:杜邦分析 。用户可点击链接另存仪表板查看仪表板的操作。

某企业 2016 年的财务状况如下图所示:

在这里插入图片描述

1.3 实现思路

净资产收益率=销售净利润率资产周转率权益乘数

净资产收益率受三类因素影响:

指标说明
销售净利润率=净利润/销售收入表明企业的盈利能力
资产周转率=销售收入/总资产表明企业的营运能力
权益乘数=总资产/净资产(权益)=1/(1-资产负债率)财务杠杆:用权益乘数衡量,表明企业的资本结构

在这里插入图片描述

在这里插入图片描述

盈亏平衡分析

1. 概述

1.1 背景

盈亏平衡分析又称保本点分析或本量利分析法,是根据产品的业务量、成本、利润之间的相互制约关系的综合分析,用来预测利润,控制成本,判断经营状况的一种数学分析方法。

张铭是一名服装电商行业的负责人,去年经营情况不佳。张铭希望通过盈亏平衡分析分析控制各项成本的投入,从而使店铺经营利润能达到一个新台阶。

1.2 分析方法

  • 【总成本=固定成本+变动成本】【利润=月销售额-总成本】
  • 固定成本:在一定范围内不随销售额的增减而变动的成本,例如:房租、水电、人工费等。
  • 变动成本:指随销售额的增减大致成正比例关系变化的成本,例如:销售提成,商品进货成本等。

张铭只需要在红色区域填入去年各项成本指标,如下图所示:
在这里插入图片描述
可见去年店铺的盈利为负,以目前各项成本的支出,若要达到盈亏平衡,月销售额需要达到「3509091」

1.3 分析结果

原因分析:

  • 固定成本高,一件商品不卖每月就需要花费 193000 元;
  • 变动成本高,每销售一块钱获得的毛利润低;
  • 盈亏平衡销售额=固定成本/每销售一块钱的毛利润,分子高分母低,所以盈亏平衡要达到的销售额很高。

解决方法:

  • 降低固定成本:电商主要的租金为仓库,可以寻找便宜的仓库更换当前租金高的仓库;
  • 降低变动成本:将定价比例降到 0.65 ,如此商品定价不会提高很多引起客户反感。
  • 寻找折扣与利润之间的平衡关系:虽然加大折扣力度会提高成本,但是会带来销售量销售额的提升。张铭可以对照去年折扣与销售额的关系,通过仪表板计算得出利润最高的折扣,为今年大促活动提供参考。
    手动调整各项成本参数,获得最合理的成本投入方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/448594.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024 RTE行业(实时互动行业)人才发展学习总结

解决方案 人才画像 开发者人才素质要求: 具备多个领域的技术知识注重团队合作,具备协作能力以用户为导向的用户体验意识具备创新思维和解决问题的能力需快速响应行业变化和持续的学习能力具备项目管理能力 学习和吸收新知识的渠道 RTE人才分类

十、Qt三维图表

一、Data Visualization模块概述 Data Visualization的三维显示功能主要有三种三维图形来实现,三各类的父类都是QAbstract3DGraph,从QWindow继承而来。这三类分别是:三维柱状图Q3DBar三维空间散点Q3DScatter三维曲面Q3DSurface 1、相关类的…

卸载Ubuntu双系统

卸载Ubuntu双系统 我们卸载Ubuntu双系统,可能出于以下原因: 1、Ubuntu系统内核损坏无法正常进入 2、Ubuntu系统分配空间不足,直接扩区较为复杂 3、以后不再使用Ubuntu,清理留出空间 123无论出于哪种原因,我们都是要…

TikTok赚钱又有新路子?TikTok选品有什么新秘籍?做对什么才能GMV破千万刀?

这一年,到底发生了什么? 上半年TikTok面临北美的严格审查和信息安全方面的质疑,但总算在9月有惊无险地打开了北美TikTok Shop这个“金匣子”,给跨境电商赛道带来新的增量机会,而东南亚市场虽在短暂停滞后迅速峰回路转…

pnpm安装以及管理多个nodejs版本

官网 https://pnpm.io/zh/ https://www.pnpm.cn/ nodejs安装包 https://nodejs.org/download/release/ windows安装 iwr https://get.pnpm.io/install.ps1 -useb | iex重新打开一个新的控制台,输入pnpm -v ubuntu下安装 curl -fsSL https://get.pnpm.io/insta…

多线程(进阶三:JUC)

一、Callable接口 二、reentrantLock 三、原子类 四、线程池 五、信号量 Semaphore 六、CountDownLatch JUC即java.utill.concurrent,里面放了一些多线程编程时有用的类,下面是里面的一些类。 一、Callable接口 1、创建线程的操作 多线程编程时&a…

Docker应用之daemon.json(一)

目录 问题复现原因分析解决步骤1.创建daemon.json2.国内镜像地址3.保存daemon.json4.重启docker服务5.查看镜像源问题小结官网docs提供的一个示例配置参数背景说明 问题复现 今天在用docker部署springboot项目时,出现JDK8依赖包下载失败, 原因分析 第一…

MySQL-----初识

一 SQL的基本概述 基本概述 ▶SQL全称: Structured Query Language,是结构化查询语言,用于访问和处理数据库的标准的计算机语言。SQL语言1974年由Boyce和Chamberlin提出,并首先在IBM公司研制的关系数据库系统SystemR上实现。 ▶美国国家标…

LNMP环境搭建动态网站

一、环境准备 服务器:openEuler 22.03 Linux IPV4 :192.168.110.144/24 网页服务器:Nginx1.21.0 数据库:MySQL 8.0.36 PHP:8.0.30 1.安装软件 [rootnode3 ~]# yum install php-mysqlnd php php-gd php-fpm php-xml -y…

TRUNCATE TABLE和DELETE FROM对比

相同点:用于删除数据,同时保留表结构. 不同点: TRUNCATE比DELETE更快(数据量小可能体现不出来,单数据量大就很明显了) 原因:TRUNCATE是DDL(数据定义语言)DELETE是逐行删除属于(DML) TRUNCATE 不会产生大量日志,但DELETE删除会产生大量日志 DELETE FROM 可以加WHERE子句指定…

word调整论文格式的记录

页眉的分章显示内容 效果: 步骤: 确保“显示/隐藏的标记”符号打开点亮 前提是章节前面有“分节符(下一页)”,没有则添加,在菜单栏“布局”——》“下一页” 添加页眉,双击页眉,选…

Springboot-SpringCloud学习

文章目录 web项目开发历史 Springboot注解AAspectAutowiredAllargConstructorAround BBeanBuilder CConfigurationConditionalOnMissingBeanComponentComponentScan DDocumentedData EEnableWebSecurityEqualsAndHashCodeExceptionHandler FGGetter HIinterfaceInherited JKLLo…