只要是在可拆卸场景中,就有「坑」身影。本文从「辛普森悖论」从业务中的实际表现场景入手,分析业务中可能踩坑的地方,一起来看看。
今天分享一个分析师的老朋友——「辛普森悖论」,只要是在可拆卸场景中,就有「坑」因此,它也成为数据分析面试的常客。本文主要关注其在业务中的实际表现场景,需要分析学生以保持警惕「坑」,小则忽略改进机会,大则结论直接错误。
既然叫「悖论」,首先,这一定是不正常的。让我们介绍一个简单的案例:
(案例盲编,如果有相似之处,纯粹是巧合)假设一个产品的用户留存率比去年同期有所提高,安卓和IOS都有所提高。市场的留存率一定会提高吗?
经过多年的应试教育锤炼,我们看到了「一定」两个字会觉得一定有玄机。
是的,你没想错,即使我们穷举各个维度,各个维度趋势一致,也未必能反映市场的特点。
为什么?因为我们只关注「比值」而没关心「绝对值」。
让我们展开数据,看看实际的量级:
这个问题能反映出来吗?
虽然双端保留率有所提高,但整体保留率大幅下降。主要原因是iOS用户大量流失,只留下核心用户;Android下个月保留率较低,但用户数量较大,降低了整体保留率。
这是著名的辛普森悖论,用学术语言解释:
「在计算分项的比例(如各种比率)数据时,A方的每个分项数据都高于B方,但当总结每个分项计算总数时,A方低于B方。这种不符合常规认知的“悖论”现象在数据分析领域并不少见;这种“悖论”现象,在小组研究中,有时在每个小组比较中占主导地位,有时在总体评价中被称为辛普森悖论。」
接下来,我们来看看业务中有哪些可能踩坑的地方。
在工作场景中,这样的表达是否似曾相识:
乍一看,似乎没有问题,但实际上经不起推敲。
面对场景1,也许我们根据重度用户和轻度用户拆卸,我们会发现双方的支付率没有明显变化。这种支付率的提高是由于近期重度用户在日常生活中所占比例的增加。支付率的提高是由于支付过程的修订,这似乎有点不对劲。
在后续的分析过程中,我们的重点需要调整为「为什么重度用户在日常生活中的比例增加?」。也许是因为轻用户转化为重用户,好事,不用太担心。也可能是轻用户逐渐流失,只留下一些重用户,所以我们必须进一步分析「为什么轻度用户逐渐流失?」。
数据分析就是这样剥茧的过程。
对于场景2,也和场景一样。忽略量级直接聊天的比例是流氓。假设有10个亲子内容,现在有13个,历史类1000个,现在有1100个。你还能自信地说,内容播放率的提高是由亲子内容播放率的提高引起的吗?
类似地,当一个渠道今天只有100名新注册用户时,明天1000名新注册用户将增长10倍。一个新注册的渠道有1万人,即使只增加10%,也能带来同样的增量。
简单来说,如果我们不做拆解或者拆解不够,只关注整体表现,就会忽略「被平均」有些人或忽略了其他关键维度对数据的影响。数据分析的艺术有时是从各个维度分解的艺术,忽略了关键维度,错过了改进的机会,大错误的结论。
例如,当我们发现材料的投资回报率较低时,我们决定直接停止。但现实世界往往非常复杂,也许这种材料在中国不好,在美国,在美国,在南美。在高收入人群中,在低收入人群中可能会再次发挥作用。
这里引用一个头条面试题进一步解释一下:
投放潜在客户时,30岁以上客户1000人,转化率2%,30岁以下3000人,转化率4%,整体转化率3.5%。因此,分析师得出结论,30岁以上客户价值低,不建议再投放。这个结论合理吗?
我们有几个角度来驳斥这个结论。
首先,没有其他重要维度,可能是样本选择不平衡。首先,30岁以下选择3万人,30岁以上选择1万人。30岁以下用户和30岁以上用户的人口特征是否一致?
假设我们30岁以上的人选择低收入人群,30岁以下的人选择高收入人群,这将不可避免地对结论产生影响。因此,除了30岁以下/30岁以上的拆分外,我们还可以根据人群收入进行拆分。
第二,为了衡量交付效果,我们不仅要关注转化率,还要关注用户生命周期的整体LTV。假设大多数30岁以下的人购买9.9批量产品,30岁以上的人购买999利润产品,你还能说30岁以上的用户毫无价值吗?
辛普森悖论也可以为一些商业现象提供一些合理的解释。「AB实验测试效果好,在线效果一般」原因有很多,比如「新奇效应」或者「显著统计并不意味着业务显著」,但是「辛普森悖论」也是导致翻车的种子选手之一。
例如,虽然我们在AB实验中随机转移用户,我也承认转移足够准确,但测试往往遵循版本迭代,可能是第一个进入AB实验,经常更新用户本身是这个更热衷于应用程序,更活跃的用户。最后,我们根据实验结果发布版本,这可能对一些活动不那么高的用户产生负面影响。
即使在极端情况下,实验版的新用户流程也可能存在bug,但由于新用户在市场中所占比例相对较低,如果我们只看市场数据,我们可能不会注意到实验对新用户体验有不良影响。
因此,在分析过程中,我们不仅要关注主要指标,还要关注重要维度拆除的关键指标。例如,我已经知道用户(如新用户和老用户)在一定维度下的指标性能是不同的,很难确保每组用户在实验层面下的比例完全均匀。除了总指标外,还需要进一步拆卸和分析该指标。例如,支付率不仅取决于整体支付率,还取决于新用户支付率和老用户支付率。
此外,进行足够详细的数据分析也可以使我们更好地最大化实验价值。例如,实验表明,虽然整体支付率只有0.1%,但并不明显。然而,对于特定群体来说,明显的改善可以使30岁以上女性的支付率提高30%,因此该实验仍然具有在线价值。
Reference:
奇奇和蒂蒂关于辛普森悖论的深入分析
森谷蘑菇数据分析-工作中遇到的“辛普森悖论”
了解大厂数据分析面试题「辛普森悖论」,有趣的数据分析
谈论AB测试中常见的辛普森悖论,王叶
本文由 @Ver 每个人都是产品经理,未经许可不得转载原件
题图来自 Unsplash,基于 CC0 协议
本文仅代表作者本人,每个人都是产品经理平台,只提供信息存储空间服务。
数码宝贝新世纪帝皇龙甲兽FM阵容怎么搭配?FM是一个新形态的数码兽,自身伤害非常高,可以作为队伍输出。很多玩家不清楚帝皇龙甲兽FM阵容怎么搭配,下面就来看看攻略分享吧。
数码宝贝新世纪帝皇龙甲兽FM阵容推荐
1、阵容一:甲虫+FM+座天+狐狸+朱庇特。以攻为守,甲虫和FM匹配度极高,甲虫的单体控制以及磁场控制和过载可以大幅提升FM的稳定性和输出能力。朱庇特可以给FM提供恐怖的攻击防御加成。座天使在FM前行动 清楚对面狐狸以及其他增益卡的增益效果,让FM实现一击必杀。狐狸则是容错率保证
2、阵容二:FM+维京+甲虫+座天+炽天。维京甲虫都有稳定控制,甲虫磁场 维京护盾提高生存能力。座天驱散可以配合控制和FM。炽天来增加续航和保证回复。
3、阵容三:杰斯+ 朱庇特 +FM +甲虫 +狐狸。强力三C阵容,这套阵容克制一些抓单C构筑的阵容。该阵容连贯性很重要,朱庇特,狐狸,FM,杰斯 速度差要小于30。
大学生可以自由支配的时间很多,在小编的印象中大部分男生会用来打篮球、打游戏,但如果到了大四还这样挥霍时间的话,那就是对自己未来的人生不负责任了。如果把打游戏的时间用来学习,会发生什么呢?
“热烈祝贺土木DOTA(网游)大神汪越初试431分、复试第一考研成功。”最近,郑州大学一宿舍楼外扯起长15米的横幅,祝贺土木工程学院2010级汪越顺利考上湖南大学研究生。大学期间,汪越把大量时间都“奉献”给了网游和篮球,曾有连续打网游七八个小时的“纪录”。研究生考试前100天,他浪子回头,华丽逆袭,超线111分,梦圆湖南大学。
每天学习近14小时 游戏达人变“学霸”
离研究生考试还有100天时,考研的同学每天都泡在自习室里。当再也找不着好友陪伴打游戏时,汪越内心受到了很大的触动。
“我也该把游戏放一放了,再不复习就来不及了,于是我也像他们一样每天去自习。”郑大水利与环境学院的教学楼是该校的通宵自习室,汪越每天都在那里学习到凌晨1点,平均每天学习近14个小时。
因为回去得晚,他成了室友口中的“外卖哥”,担负起了给室友带宵夜的重任。“刚开始我也坐不住,但是看到哥们儿都那么努力,就逼着自己坚持下来。”他说。
汪越自己还摸索出了做题的“诀窍”:多思考,举一反三。“我对每道题都联想很多,分析全面了才能有所收获。”在坚持学习的同时,他还特别注重心态的调整,自始至终都以一种平和坦然的心态来面对。这也是他能够逆袭的重要原因。
约定:他考研成功好友就挂横幅庆祝
“他的游戏打得很棒,在校级DOTA比赛中几次名列前茅,我们就给他起了个外号‘DOTA大神’。”汪越的好友张亚杰说。
听说汪越在倒计时100天时开始复习考研,不光是张亚杰,连平时一块儿玩游戏的好友都表示不太相信。
于是,他们就约定如果汪越考研成功,就挂横幅为他庆祝。
自从开始备战湖南大学,汪越像变了一个人,几乎没再碰过游戏。3月18日,考研国家分数线公布,汪越超线111分。复试时,他又取得了第一名的好成绩。
听说他考研成功,张亚杰和好友们都很高兴。“我们履行约定,马上给他制作了一条横幅表示祝贺。”
好友在祝贺他考研成功的同时,还希望他早点遇到心仪的对象,遇到了就好好珍惜。于是,就有了横幅的下一句——考研虽易,妹子不易,且遇且珍惜。
武林闲侠九阳神功的强度还有很多玩家们并不了解,也不知道九阳神功应该怎么搭配,下面就由小编为玩家们介绍一下九阳神功强度,想要了解的话就快来这里看看吧!
1.九阳神功:极好,前排必带,反弹效果非常的好用!
2.基础属性:生命+13%,受治疗+4%。
3.技能:当生命首次降低至50%时,反弹150%所受到的伤害,持续8秒,一次伤害最多被反弹两次。
4.这个秘籍也是非常的适合前排来携带这个秘籍!
平台:安卓
类型:扑克棋牌
版本:v2.2.0.0.9.6
大小:7.42MB
更新:2024-07-26
影音播放
43.65MB
61.71MB
生活休闲
29.35MB
摄影图像
22.20MB
实用工具
6.70MB
学教育婴
0KB
社交通讯
40.14MB
新闻阅读
48.13MB
17.29MB
战争策略
453.99MB
113.55MB
休闲益智
7.29MB
推理解谜
158.11MB
17.09MB
动作冒险
99.46MB
角色扮演
1.22GB
41.41MB
45.43MB
渝ICP备20008086号-14 违法和不良信息举报/未成年人举报:dzjswcom@163.com
CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved
安卓辛普森攻略rebelinc攻略
只要是在可拆卸场景中,就有「坑」身影。本文从「辛普森悖论」从业务中的实际表现场景入手,分析业务中可能踩坑的地方,一起来看看。
今天分享一个分析师的老朋友——「辛普森悖论」,只要是在可拆卸场景中,就有「坑」因此,它也成为数据分析面试的常客。本文主要关注其在业务中的实际表现场景,需要分析学生以保持警惕「坑」,小则忽略改进机会,大则结论直接错误。
1.什么是辛普森悖论?既然叫「悖论」,首先,这一定是不正常的。让我们介绍一个简单的案例:
(案例盲编,如果有相似之处,纯粹是巧合)假设一个产品的用户留存率比去年同期有所提高,安卓和IOS都有所提高。市场的留存率一定会提高吗?
经过多年的应试教育锤炼,我们看到了「一定」两个字会觉得一定有玄机。
是的,你没想错,即使我们穷举各个维度,各个维度趋势一致,也未必能反映市场的特点。
为什么?因为我们只关注「比值」而没关心「绝对值」。
让我们展开数据,看看实际的量级:
这个问题能反映出来吗?
虽然双端保留率有所提高,但整体保留率大幅下降。主要原因是iOS用户大量流失,只留下核心用户;Android下个月保留率较低,但用户数量较大,降低了整体保留率。
这是著名的辛普森悖论,用学术语言解释:
「在计算分项的比例(如各种比率)数据时,A方的每个分项数据都高于B方,但当总结每个分项计算总数时,A方低于B方。这种不符合常规认知的“悖论”现象在数据分析领域并不少见;这种“悖论”现象,在小组研究中,有时在每个小组比较中占主导地位,有时在总体评价中被称为辛普森悖论。」
接下来,我们来看看业务中有哪些可能踩坑的地方。
场景一:只注意比例指标,不注意绝对值的变化在工作场景中,这样的表达是否似曾相识:
「我们活跃用户的支付率从3%提高到5%,说明支付流程的修订效果很好,大大提高了用户的支付率。」「最近我们APP的内容播放率提高了,亲子播放率提高了30%,历史播放率提高了10%。因此,亲子内容带来了APP内容播放率的提高。」乍一看,似乎没有问题,但实际上经不起推敲。
面对场景1,也许我们根据重度用户和轻度用户拆卸,我们会发现双方的支付率没有明显变化。这种支付率的提高是由于近期重度用户在日常生活中所占比例的增加。支付率的提高是由于支付过程的修订,这似乎有点不对劲。
在后续的分析过程中,我们的重点需要调整为「为什么重度用户在日常生活中的比例增加?」。也许是因为轻用户转化为重用户,好事,不用太担心。也可能是轻用户逐渐流失,只留下一些重用户,所以我们必须进一步分析「为什么轻度用户逐渐流失?」。
数据分析就是这样剥茧的过程。
对于场景2,也和场景一样。忽略量级直接聊天的比例是流氓。假设有10个亲子内容,现在有13个,历史类1000个,现在有1100个。你还能自信地说,内容播放率的提高是由亲子内容播放率的提高引起的吗?
类似地,当一个渠道今天只有100名新注册用户时,明天1000名新注册用户将增长10倍。一个新注册的渠道有1万人,即使只增加10%,也能带来同样的增量。
场景二:拆解不够,缺乏关键维度简单来说,如果我们不做拆解或者拆解不够,只关注整体表现,就会忽略「被平均」有些人或忽略了其他关键维度对数据的影响。数据分析的艺术有时是从各个维度分解的艺术,忽略了关键维度,错过了改进的机会,大错误的结论。
例如,当我们发现材料的投资回报率较低时,我们决定直接停止。但现实世界往往非常复杂,也许这种材料在中国不好,在美国,在美国,在南美。在高收入人群中,在低收入人群中可能会再次发挥作用。
这里引用一个头条面试题进一步解释一下:
投放潜在客户时,30岁以上客户1000人,转化率2%,30岁以下3000人,转化率4%,整体转化率3.5%。因此,分析师得出结论,30岁以上客户价值低,不建议再投放。这个结论合理吗?
我们有几个角度来驳斥这个结论。
首先,没有其他重要维度,可能是样本选择不平衡。首先,30岁以下选择3万人,30岁以上选择1万人。30岁以下用户和30岁以上用户的人口特征是否一致?
假设我们30岁以上的人选择低收入人群,30岁以下的人选择高收入人群,这将不可避免地对结论产生影响。因此,除了30岁以下/30岁以上的拆分外,我们还可以根据人群收入进行拆分。
第二,为了衡量交付效果,我们不仅要关注转化率,还要关注用户生命周期的整体LTV。假设大多数30岁以下的人购买9.9批量产品,30岁以上的人购买999利润产品,你还能说30岁以上的用户毫无价值吗?
场景三:AB实验时测试效果很好,实际上是上线后翻车辛普森悖论也可以为一些商业现象提供一些合理的解释。「AB实验测试效果好,在线效果一般」原因有很多,比如「新奇效应」或者「显著统计并不意味着业务显著」,但是「辛普森悖论」也是导致翻车的种子选手之一。
例如,虽然我们在AB实验中随机转移用户,我也承认转移足够准确,但测试往往遵循版本迭代,可能是第一个进入AB实验,经常更新用户本身是这个更热衷于应用程序,更活跃的用户。最后,我们根据实验结果发布版本,这可能对一些活动不那么高的用户产生负面影响。
即使在极端情况下,实验版的新用户流程也可能存在bug,但由于新用户在市场中所占比例相对较低,如果我们只看市场数据,我们可能不会注意到实验对新用户体验有不良影响。
因此,在分析过程中,我们不仅要关注主要指标,还要关注重要维度拆除的关键指标。例如,我已经知道用户(如新用户和老用户)在一定维度下的指标性能是不同的,很难确保每组用户在实验层面下的比例完全均匀。除了总指标外,还需要进一步拆卸和分析该指标。例如,支付率不仅取决于整体支付率,还取决于新用户支付率和老用户支付率。
此外,进行足够详细的数据分析也可以使我们更好地最大化实验价值。例如,实验表明,虽然整体支付率只有0.1%,但并不明显。然而,对于特定群体来说,明显的改善可以使30岁以上女性的支付率提高30%,因此该实验仍然具有在线价值。
Reference:
奇奇和蒂蒂关于辛普森悖论的深入分析
森谷蘑菇数据分析-工作中遇到的“辛普森悖论”
了解大厂数据分析面试题「辛普森悖论」,有趣的数据分析
谈论AB测试中常见的辛普森悖论,王叶
本文由 @Ver 每个人都是产品经理,未经许可不得转载原件
题图来自 Unsplash,基于 CC0 协议
本文仅代表作者本人,每个人都是产品经理平台,只提供信息存储空间服务。
数码宝贝新世纪帝皇龙甲兽FM阵容搭配推荐
数码宝贝新世纪帝皇龙甲兽FM阵容怎么搭配?FM是一个新形态的数码兽,自身伤害非常高,可以作为队伍输出。很多玩家不清楚帝皇龙甲兽FM阵容怎么搭配,下面就来看看攻略分享吧。
数码宝贝新世纪帝皇龙甲兽FM阵容推荐
1、阵容一:甲虫+FM+座天+狐狸+朱庇特。以攻为守,甲虫和FM匹配度极高,甲虫的单体控制以及磁场控制和过载可以大幅提升FM的稳定性和输出能力。朱庇特可以给FM提供恐怖的攻击防御加成。座天使在FM前行动 清楚对面狐狸以及其他增益卡的增益效果,让FM实现一击必杀。狐狸则是容错率保证
2、阵容二:FM+维京+甲虫+座天+炽天。维京甲虫都有稳定控制,甲虫磁场 维京护盾提高生存能力。座天驱散可以配合控制和FM。炽天来增加续航和保证回复。
3、阵容三:杰斯+ 朱庇特 +FM +甲虫 +狐狸。强力三C阵容,这套阵容克制一些抓单C构筑的阵容。该阵容连贯性很重要,朱庇特,狐狸,FM,杰斯 速度差要小于30。
“DOTA大神”逆袭成学霸 考研成功好友挂条幅庆祝
大学生可以自由支配的时间很多,在小编的印象中大部分男生会用来打篮球、打游戏,但如果到了大四还这样挥霍时间的话,那就是对自己未来的人生不负责任了。如果把打游戏的时间用来学习,会发生什么呢?
“热烈祝贺土木DOTA(网游)大神汪越初试431分、复试第一考研成功。”最近,郑州大学一宿舍楼外扯起长15米的横幅,祝贺土木工程学院2010级汪越顺利考上湖南大学研究生。大学期间,汪越把大量时间都“奉献”给了网游和篮球,曾有连续打网游七八个小时的“纪录”。研究生考试前100天,他浪子回头,华丽逆袭,超线111分,梦圆湖南大学。
每天学习近14小时 游戏达人变“学霸”
离研究生考试还有100天时,考研的同学每天都泡在自习室里。当再也找不着好友陪伴打游戏时,汪越内心受到了很大的触动。
“我也该把游戏放一放了,再不复习就来不及了,于是我也像他们一样每天去自习。”郑大水利与环境学院的教学楼是该校的通宵自习室,汪越每天都在那里学习到凌晨1点,平均每天学习近14个小时。
因为回去得晚,他成了室友口中的“外卖哥”,担负起了给室友带宵夜的重任。“刚开始我也坐不住,但是看到哥们儿都那么努力,就逼着自己坚持下来。”他说。
汪越自己还摸索出了做题的“诀窍”:多思考,举一反三。“我对每道题都联想很多,分析全面了才能有所收获。”在坚持学习的同时,他还特别注重心态的调整,自始至终都以一种平和坦然的心态来面对。这也是他能够逆袭的重要原因。
约定:他考研成功好友就挂横幅庆祝
“他的游戏打得很棒,在校级DOTA比赛中几次名列前茅,我们就给他起了个外号‘DOTA大神’。”汪越的好友张亚杰说。
听说汪越在倒计时100天时开始复习考研,不光是张亚杰,连平时一块儿玩游戏的好友都表示不太相信。
于是,他们就约定如果汪越考研成功,就挂横幅为他庆祝。
自从开始备战湖南大学,汪越像变了一个人,几乎没再碰过游戏。3月18日,考研国家分数线公布,汪越超线111分。复试时,他又取得了第一名的好成绩。
听说他考研成功,张亚杰和好友们都很高兴。“我们履行约定,马上给他制作了一条横幅表示祝贺。”
好友在祝贺他考研成功的同时,还希望他早点遇到心仪的对象,遇到了就好好珍惜。于是,就有了横幅的下一句——考研虽易,妹子不易,且遇且珍惜。
武林闲侠九阳神功强度以及搭配推荐
武林闲侠九阳神功的强度还有很多玩家们并不了解,也不知道九阳神功应该怎么搭配,下面就由小编为玩家们介绍一下九阳神功强度,想要了解的话就快来这里看看吧!
武林闲侠九阳神功强度以及搭配推荐
1.九阳神功:极好,前排必带,反弹效果非常的好用!
2.基础属性:生命+13%,受治疗+4%。
3.技能:当生命首次降低至50%时,反弹150%所受到的伤害,持续8秒,一次伤害最多被反弹两次。
4.这个秘籍也是非常的适合前排来携带这个秘籍!
平台:安卓
类型:扑克棋牌
版本:v2.2.0.0.9.6
大小:7.42MB
更新:2024-07-26
影音播放
43.65MB
影音播放
61.71MB
生活休闲
29.35MB
摄影图像
22.20MB
实用工具
6.70MB
学教育婴
0KB
社交通讯
40.14MB
新闻阅读
48.13MB
学教育婴
17.29MB
战争策略
453.99MB
战争策略
113.55MB
休闲益智
7.29MB
推理解谜
158.11MB
休闲益智
17.09MB
动作冒险
99.46MB
角色扮演
1.22GB
休闲益智
41.41MB
动作冒险
45.43MB