商业ABtest的一点点思考

商业ABtest的一点点思考

文章目录:

  1. 商业ABtest的一点点思考
  2. 产品运营 | 常用的数据获取方式及特征

一、商业ABtest的一点点思考

      目前abtest的实验方法主要是根据尾号来切,但是商业这边跟产品不同,产品是面对所有的用户的一视同仁名,但是商业会只针对部分用户,  且一般的评估会涉及到的维度除了流量,购买人数之外还会涉及到最后购买金额,来进行综合的考虑。并且最重要的是,是什么呢,是商业的数量级一般会比较小。

      之前完成评估的时候,顺便跑了之前的数据和分别跑了各个尾号的情况,发现这个尾号与尾号之间在小量级的数据上容易存在一定的差异,尾号本身就会有些差异性。

许多人建议使用did(Difference in Differences)方法解决这个问题。后来我搜相关资料的时候发现这是一个要求比较苛刻的方法,有四个前提比如要求两个数据集需要是平行趋势。所以存在一定的困惑在实施上,这个是要严格要求还是这个一定的范围区间都是可以接受的或者忽视掉这个问题。

     本次就商业这边的abtest评估与csl的王璐博士沟通了一下,总体我觉得很有道理,分享一下。

首先她建议我们在没有弄清楚同质化样本的定义以及对用户没有足够了解的情况下,对某些前提也不了解的情况,最好不要用did(difference in differences),更不要用psm-did(我提议的处理不平行数据的方法),用简单的统计去计算即可。我的理解是在不了解的情况话,不要用太复杂的方法,画蛇添足增加太多的其他变量,比如did的本质想法就是通过同质化的对照组来减去实验组因为时间带来的影响,但是我们目前首先很多的数据并不是同质化或者至少从数据曲线来说并不是平行的,那么直接使用只是增加变量,而且考虑到互联网短平快的风格,太复杂的方法也不适合平日大量需求评估,最好化繁为简单处理即可。

      不过她说道,对于金额的异常值或者最原始的数据,我们是需要处理一下的,(我的理解比如金额这部分,你把马云跟我们放在一起,大家都是富人),但是对于转化率这一个指标我们可以处理,一个人数的增加不会影响太多。还提到观察这批高付费用户的出现是存在规律性还是一个异常值,我问为什么,她说,这决定你怎么处理这个异常值(高付费用户)。

     不过考虑大家公司业务有自己的一套评估方法,因此各位想要进行改动还是需要大家达成共识的。

最后打一下我的公众号(ง •̀_•́)ง。

希望我能够更了解你,你也更了解我

公众号搜索: Machinator_chenchen,阿Bing有话说

二、产品运营 | 常用的数据获取方式及特征

      提出任何一个产品的idea或者解决某个需求,都离不开用户,用户是需求之源,而了解用户的需求,提高使用体验的第一步,必定离不开对用户的研究。而与用户接触的过程就是需求采集的过程。

       首先最常见的就是直接面向用户的。例如,用户访谈,用户调研,用户的主动触达。CPO(call per order)是衡量一个电子商务网站流程是否合理,是否将服务贯彻全面的一个指标,CPO的降低将直接代表了运营策略的正确,可以逐渐推广学习。当然这些指标还有多种叫法,比如feedback,客服进线之类的。

      这样直接面向用户的,对于客户的需求采集虽然可以帮助我们直接定位到用户目前的需求,以及他们使用我们产品发现的badcase,可以帮助我们快速的止损,但是这种采集方式,在整合用户的反馈,过滤清洗掉用户的无效需求的时候,必然将耗费大量人力资源,而对于互联网行业来说,这显然是不太划算的。

      相对于典型的传统行业来说,互联网产品的研发生命周期更短,研发管理更精简。例如一款新型汽车的研发过程中,评审点是以百来计数的,而互联网行业的一个典型的产品研发,一般只有几十个不到的评审点。而且盈利模式也更为多元化。互联网、软件产品大多是为使用产品的终端用户所做,通常是面对的是海量的用户,所以就产生了下一种用户需求的数据获取方式“直接面向大数据”。

        例如app中常用的“埋点统计”,埋点是网站分析的一种常用的数据采集方法,数据埋点是一种良好的私有化部署数据采集方式,埋点统计的数据采集,可以简化理解为对于某个操作的标记累加。用微博来理解,可以在用户对内容点赞的时候进行一个标记,再在用户对微博转发的时候进行一个标记,通过对两种数据指标的对比,根据两个数据的匹配度来判断出哪一中类型的优质内容的传播更广一点,用户群体更活跃。但“手动埋点”工程量极大,极容易出错误,对于工程师来说是个很难过的事情。

      在运营策划中常用的方法的还有ABtest和灰度,根据数据来判断新策略是否值得深化推广。对同一个群体制定两种策略,通过两种策略的不同表现数据来对比判断哪个策略更优。例如B站为了让我们更好的投入视频内容中,可以根据使用app的平均使用时长来判断哪种策略更好。A组采用新策略,B组采用旧策略,对于两种策略的平均使用时长数据的采集,可以很明显的看出哪一种策略更为优化,而对于互联网软件行业这种DAU(日活跃用户数量)很大的产品。10%产出的数据就非常有代表性了,这10%就相当于与已经灰度上线了,找到了用户的核心需求,完成了新策略的灰度上线,再经过ABtest的数据,最后得到更好的一种策略,将10%进行逐步的放量,逐渐达到使用的覆盖率100%,最终实现整个策略的温水煮青蛙式上线,非常的稳定,这个过程可以称为灰度放量(阶段性放量)。

到此,以上就是小编对于testab社群运营的问题就介绍到这了,希望介绍关于testab社群运营的2点解答对大家有用。

转载请说明出处内容投诉
CSS教程_站长资源网 » 商业ABtest的一点点思考

发表评论

欢迎 访客 发表评论

一个令你着迷的主题!

查看演示 官网购买