六、用户标签体系与用户画像(标签体系、标签分类、用户画像、用户分群)

发布时间:2024-11

浏览量:134

本文字数:7919

读完约 27 分钟

    用户微观视角下的数据分析,用户标签是进行用户画像的基础,用户画像可以辅助业务人员制定用户分群策略,用户分群在企业战略、用户运营、风险防控方面具有广泛的应用。

    实现精准投放的本质是识别目标消费群体,主要通过两个维度来识别。第一个维度是识别目标消费群体的消费意愿,第二个维度是识别目标消费群体的消费能力。

一、标签体系的整体框架

    用户标签能够以多种形式存在,一种是用户的自然属性,一种是对用户交易、资产数据的统计指标,还有一种是基于某些算法归纳总结出来的规则。以上任意一种形式都可以理解为通过用户行为数据分析得到的在某个维度上具有一定差异性的用户形容词。

image.png

二、标签的分类

从研究客体的数据类型角度,可以将标签分为属性标签、状态标签、协议标签、行为标签、需求标签;

从用户标签的时态角度,可以将标签分为静态标签、时点标签、时期标签;

从标签的加工角度,可以将标签分为基础标签、统计标签、模型标签等;

从业务的应用角度,可以将标签分为用户运营类标签、信用风险类标签、合规风险类标签等。

1、从研究客体的数据类型角度分类

1)属性标签

    在分析个人用户时,属性标签也被称为人口统计信息,主要涉及性别、出生日期、出生地、血型等数据。

    这类数据对用户的行为预测并不具有因果关系,只是根据历史数据统计而得到的统计结果。比如,随着用户年龄的增长,会对房贷、消费贷款、教育储蓄、个人理财等产品产生需求,但是年龄并不是对产品有需求的根本原因,其实婚龄才是其深层次的原因,只不过婚龄和年龄在同时期人群中高度相关罢了。同理,性别和某种业务表现的高相关性,很多也来自外部世界对性别类型的一种行为期望。这类数据对银行、汽车4S店这类需要用户临柜填写表格的公司(机构)而言是可以获取“真实”信息的,而对于电商而言,是难以获取“真实”信息的。但是电商的分析人员也不必气馁,其实“真实”这个概念是有很多内涵的,根据电商数据虽然不能知道用户人口学上的“真实”年龄,但是根据其消费行为完全可以刻画出其心理上的“真实”年龄,而后者在预测用户需求和行为方面更有效。

2)状态标签

    状态标签指用户的社会经济状态和社会资本的标签,如资产情况、存款情况、消费能力、居住小区的档次等数据。社会学认为,人之所以为特定的人,就在于其被固化在特定的关系之中,这被称为嵌入理论。

    了解用户的社会关系,就了解了外界对该用户的期望,进而推断出其需求。通过深入的分析,甚至可以推断出用户未来的需求,达到比用户更了解自己的状态。

    比如,电信企业通过通话和短信行为确定用户的交友圈,通过信号地理信息定位用户的工作、生活和休闲区域,从而推测其工作类型、所处阶层和社交网络类型。也有企业通过用户住址大致确定用户居住小区的档次,以了解其社会经济地位。这类信息是值得每个以用户为中心的企业花时间和精力去深挖的。

3)协议标签

    用户在购买产品前需要与企业签订协议,协议与产品是有对应关系的,因此协议反映了用户对产品的购买情况。用户购买的产品有时可以反映其所处的人生阶段。比如购买母婴类产品的用户,大概率家里有孩子,而且其家庭大概率有车,因此可以推荐汽车养护类产品。关联规则就是主要使用产品协议数据进行产品推荐的一类算法。

4)行为标签

    交易数据是基于账户或不基于账户的用户活动产生的数据,其中基于账户的行为数据被称为动账数据,不基于账户的行为数据被称为非动账数据。

    动账是实际产生交易金额的情况,非动账是用户在交易过程中并未产生实际交易金额,但在交易过程中会产生很多用户行为。

5)需求标签

    能够获取用户的内在需求是最理想的,但这类数据的获取方式很匮乏。传统方式只能通过市场调研、用户呼入或用户投诉得到相关数据。现在利用用户的各种留言和对话就可以获取用户的评价信息。


    以上5种类型的数据是由表象到内在的,数据分析的难度逐渐加大,数据量也逐渐增加。目前1~2层面的标签数据居多,需要结合产品、交易数据及评价逐步完善标签体系。

2、从标签的时态角度分类

    静态数据,也被称为属性数据,数量较少,如性别、出生年月、出生城市等;基于时点的动态数据,也被称为状态数据,是流量数据累计的结果,如截止到月底的资产等;基于期间的动态数据,也被称为流量数据、行为数据,也就是对基于时点的动态数据进行汇总,即可得到基于期间的动态数据,一般只能获得公司内部的数据,如当月现金交易笔数、半年内总入账等。

image.png

    数据时态不同,我们取数的时间窗口也应不同。比如对信用卡申请做分析,如果取静态数据,如用户的基本信息,由于静态数据是没有时间点概念的,因此取任何时间点的数据都没问题。如果取动态数据,由于给每个用户发卡的时间是不一样的,因此动态时间点数据应该取申请信用卡时间点前最近的时间点。而动态期间数据应该取动态时间点数据之前一段时间的数据,如从动态时间点往前6个月以内的数据。

3、从标签的加工角度分类

    从标签的加工角度分类完全是根据公司内部数据工程师在计算该标签时使用的算法深度来区分的。

1)基础标签

    基础标签通常包括用户的所有原生属性或派生属性,常见的基础标签主要用于描述对象的人口属性、社会属性、设备信息、工作属性、协议信息等。基础标签的提取通过基本的SQL语句就可以实现,大多数用户的基础标签可通过公司内部数据库获取,不需要对数据进行汇总等操作。

image.png

2)统计标签

    对交易数据进行汇总后产生的标签被称为统计标签。

例如,“用户资产汇总”是指根据用户的交易流水,汇总其一段时间内的收入、支出,平均账户余额,进而对用户进行价值分群分析,用于该行资源的合理分配;“用户行为偏好”是指以用户交易渠道、产品种类为维度,汇总其交易频次、交易金额、关注频次等来分析客群特征,方便用户经理洞察用户需求偏好。

    在统计标签中比较典型的例子是RFM模型,虽然名称为RFM模型,但更应该将其理解为一种变量计算框架。

    其中,“R”指近度(Recency),即最近一次交易时间。一般而言,上一次交易时间越近的用户对银行所提供的即时商品或服务是最有可能有反应的,因此营销人员可针对此类用户进行较多的营销工作,如邮寄产品信件、电话促销等。“F”指频度(Frequency),交易频率是用户在限定期间内交易的次数。我们可以说最常购买产品的用户,也是满意度最高的用户。如果相信银行品牌及服务品质,那么最常购买银行产品的消费者,忠诚度也最高。增加用户购买的次数意味着从竞争对手处夺取市场占有率,提高自身的营业额。“M”指值度(Monetary),交易金额是所有消费报告的支柱,通过交易金额可以识别用户对企业营业额的贡献,而对于银行来说,用户的存款金额决定了银行资金的丰沛程度,贷款金额则代表了资金的使用水平。

3)模型标签

    模型标签指根据一定的业务需求建立算法模型,以基础标签、统计标签为基础加工出来的标签。简单的模型标签使用SQL语句中的分支语句就可以实现,复杂的模型标签需要使用机器学习或深度学习算法。

模型标签主要用于以下4种场景:

①发现用户潜在需求,也就是根据用户过往的行为表现,从具体产品出发,挖掘潜在用户,进行精准营销;

②用户消费偏好分析,即根据用户的消费行为,获取购物、理财等偏好信息;

③用户风险评分,通过输入用户的基础数据和行为数据,输出各类信用评分模型结果;

④业务营销拓展,主要为支持业务部门某次营销活动而专门开发出来的具有生命周期的用户标签。

根据标签的计算方法,可将模型标签分为规则类模型标签、算法类模型标签、综合应用类模型标签。

    规则类模型标签是使用最为广泛的模型标签,如基于RFM模型计算出来的统计用户级别的标签有“五星荣耀用户”“重要挽留用户”“重要保持用户”等,属于规则类模型标签。

    算法类模型标签的计算方法更为复杂。如用卡人实际性别判断模型等

image.png

    规则类模型标签和算法类模型标签一般适用于场景较单一的情况。有些时候存在部分用户数据不完善的情况,就需要使用综合以上两种计算方法的综合应用类模型标签。

3种用户兴趣偏好标签开发的案例:

image.png

4、业务指标与用户标签的关系

image.png

1)制定业务指标——OSM模型

image.png

    在度量过程中,会生成一些KPI(Key Performance Indicator)指标,将这些KPI指标与预先给定的目标值(Target)进行对比,就可以衡量业务目标是否达到,KPI直接度量策略有效性指标,直接反映目标的达成情况。

2)北极星指标

     北极星指标是产品成功的关键指标,是指在产品的当前阶段与业务或战略相关的绝对核心指标。北极星指标是企业为用户带来的核心价值的体现,是指引公司提升长期价值的方法,一旦制定,北极星指标如同北极星般闪耀在高空中,指引整个团队朝一个方向奋斗。北极星指标的价值是提升公司员工的价值观,凝聚团队力量。

企业北极星指标案例:

image.png

3)拆解北极星指标

    常用的拆解方式有两大类,一类是全链漏斗式,另一类是因子分解式。

    全链漏斗式拆解是指当业务在按照若干个步骤进行时,可以按照其步骤将北极星指标进行拆解。

image.png

    因子分解式拆解是指当业务由不同模块通过加总关系构成时,可以分别根据每个模块的影响因素进行拆解。

image.png

4)业务指标的分层方式

    根据以上拆解方式可以将北极星指标逐级进行拆解,通常可以拆解至4个层级。第1层级的指标是战略层面的指标,是整个公司共同奋斗的目标。第2层级的指标是管理层面的指标,可按照部门职能进行划分;第3层级的指标是运营层面的指标,每个部门中划分不同的小组负责相应的运营指标;第4层级的指标是操作层面的指标,细化到每位员工所需负责的工作。

image.png

    首先,战略层面的指标解决的问题是“做什么”“为什么做”,其所需要的数据产品类型是市场或行业指标型,数据范围是市场或行业外部数据,此类数据可通过国家统计局、行业报告和市场调研的方式获取。其次,管理层面和运营层面的指标解决的问题是“做的如何”,其所需要的数据产品类型是智能报表型,数据范围是企业内部数据,此类数据可通过企业业务系统获取;最后,操作层面的指标解决的问题是“如何做”,其所需要的数据产品类型是智能分析决策型,数据范围是企业内部及外部数据,此类数据可通过企业业务系统和外部数据供应商获取。

image.png

    其中,战略层面、管理层面、运营层面主要使用业务指标,而操作层面使用用户标签。

5)指标和标签的不同点

    在概念方面,指标是用来定义、评价和描述特定事物的一种标准或方式。标签是人为设定的、根据业务场景需求对目标对象运用一定的算法得到的高度精炼的特征标识。

    在属性与特征方面,指标是ICT时代和BI时代的通用语言,指标注重对事物及事件过程进行全面、体系化的描述;更注重与宏观业务分析相结合,逻辑上更严谨,表现风格严肃、刻板;更侧重业务化、严格化和数量化。标签是大数据与人工智能时代的通用语言。标签比指标更微观、更有深度,便于做用户洞察。

    在应用场景方面,指标的应用场景更宏观,涉及企业的战略、管理、运营和支撑等层面。比如,战略目标、市场定位、业务监测、业绩考核、任务分解、数据分析、数据建模、BI应用等。标签的应用场景主要集中在CRM领域,尤其适用于用户运营。比如,用户画像、新增获客、沉默用户激活、存量用户维系、数据建模、数据可视化等。总之,指标最擅长的应用场景是监测、分析、评价和建模,标签最擅长的应用场景是标注、刻画、分类和特征提取。

6)业务指标和用户标签的配合使用

    基于用户标签的应用,根据不同的用户标签进行用户分群,对不同的客群制定差异化的营销策略。在实施营销策略后,再次通过日活跃用户量指标衡量营销策略的有效性及业务目标的达成率,并对比以前的营销指标,发现基于用户标签的分群营销策略的效率比传统的营销策略的效率提高很多。

三、用户画像

1、细分市场与STP模型

    具体来讲,用户画像为细分市场提供了分析依据,细分市场是产品研发的前置条件,产品销售阶段根据产品研发阶段的用户画像进行渠道匹配,被称为STP模型。

S”指细分市场(Segmentation),根据消费者差异确定细分要素和市场,利用5个关键指标衡量细分市场(可测量、可盈利、可进入、可区分、相对稳定);

“T”指选择目标市场(Targeting),评估每个细分市场的吸引力,根据自身与市场匹配度选择细分市场,确定市场营销策略;

“P”指市场定位(Positioning),决定产品在目标消费群体中占据什么位置。

image.png

2、快速入手用户画像

    用户画像的目的是帮助营销人员或风控人员对用户进行洞察,需要描述清楚用户是谁、特征是什么、有什么习惯、通过什么渠道触达等问题。这些被总结成5W1H分析法,也称作6何分析法。在业务数据分析中经常使用5W1H分析法解决实际工作中的业务问题,并利用这种方法拆解活动目标,随着互联网的发展,传统数据分析已无法满足业务的发展需要,业务人员需要更多的策略及方向指引,利用用户画像的精准营销同样也可以通过5W1H分析法来助力业务。

    下面利用5W1H分析法对用户画像的实现进行拆解,从而通过业务角度快速入手用户画像:

1)原因(何因Why)

    从业务角度分析当前遇到的主要问题,用户画像可以帮助产品和营销人员探查用户特征,比如转化率低的用户的特征、流失用户的特征、高风险人群的特征。对于不同的业务现状,洞察业务问题,识别业务人群特征,从而利用用户画像主动出击,精准定位人群,解决业务问题。

2)对象(何事What)

    在实际业务环境中,离不开产品及服务,我们从业务角度出发,具体问题具体分析,针对不同的产品及服务,所适配的用户特征也是不一样的。比如,商家推出一款产品,定位高端人群,需要定义符合该产品的用户特征,包括收入情况、职业、消费能力等,通过匹配,找到符合该产品的人群,制作出符合该产品的用户画像,指导业务人员对产品进行清晰的认知。

3)地点(何地Where)

    用户画像中的“地点”即渠道。用户群体存在渠道偏好,可以挖掘用户的渠道选项,不同的选项偏好,会反映出用户的潜在特征,可以通过对不同渠道的用户进行画像,挖掘出该渠道的用户特征,从而在推广及营销产品和服务的时候能够通过渠道捕获适配的用户群体。

4)时间(何时When)

    时间信息包含很多,如自然时间、浏览时长、停留时长等。通过这些时间标签,可以定义用户对某种产品或某种服务的喜好程度,也可以通过定义不同的时间段,挖掘用户的行为信息集中在何时,分布在早、中、晚哪些时间段,将以上信息结合职业等标签,可以更好地针对特定时间段的人员进行营销。

5)人员(何人Who)

    人员即目标用户,主要是定位适配群体,也是用户画像的主要应用部分。我们通过对用户信息数据进行处理和标签化来制作用户画像,通过自建标签体系,定义各种各样的标签,在推行某产品或某活动的时候,通过已有标签化数据进行画像,从而选择强适配人群,对该群体进行营销。也可以通过该方法锁定营销目标,缩小营销范围,节省营销成本。

6)方法(何法How)

    业务人员需要根据用户的偏好用其喜闻乐见的方式或合适的方法引发用户关注,促进转化。比如推广一款理财产品,针对年轻用户群体,可通过短视频形式推广;针对年长用户群体,可通过线下门店活动推广;针对高潜在用户群体,可以在合适的时间进行一对一电话访问营销、短信推送等。如需曝光,可结合周围人群的购买力,圈选特定商圈,利用户外大屏增加产品曝光。


image.png

3、用户分群的发展历程

    用户分群这种方法由来已久,在20世纪50年代以前,其实已经有比较初级的细分思路,主要根据用户基本属性进行细分,比如社会地位、宗教、性别、教育水平来确定产品、价格和销售渠道。例如,在19世纪的图书市场中,相同内容的书包装不同、售价不同;到了20世纪50年代,这种基于用户分群制定不同营销策略的思维逐渐被人们重视,出现了差异化的市场,分群作为一种市场策略被首次引入,分群等同于产品差异化;而在20世纪60年代,除关心社会人口特征外,还会关心其他影响个人行为的因素,如个人观点和心理活动因素;到了20世纪80年代,用户分群开始被注入新的源泉——统计学,基于用户分群的产品选择模型比基于所有用户的模型更为准确;20世纪90年代随着大数据及人口普查的融入,用于分析用户行为的维度得以拓展,开始重视用户行为和价值分析;发展到21世纪,开始强调基于数据的用户行为分群,用户分群引导了CRM在不同用户群体中的决策,越来越多的数据被用于建立用户分群模型。

image.png

4、用户的决策进程

    单个用户在做购买决定的时候,可以粗略分为5个阶段,分别是确认需求、信息收集、方案评估、购买决策、购后行为

image.png

    主要有5种典型的精准营销方法:第1种是识别出商品或服务的刚需群体,这种方法主要用于第一阶段;第2种是直接获取用户的需求信息,如根据用户在网站上的搜索内容进行商品推荐,这种方法主要用于第二阶段;第3种是在用户比价时进行营销,如获取用户与朋友之间关于某商品的沟通信息,主要用于第三阶段,不过此类营销方法存在法律风险;第4种是在用户购买商品时进行捆绑销售,如给准备购买汽车的用户推销保险,主要用于第四阶段;第5种是根据用户购买商品后的使用情况进行场景交叉销售,如推荐儿童座椅等关联商品,主要用于第五阶段。

5、马斯洛需求理论

    美国心理学家亚伯拉罕·马斯洛把人类的需求从低到高划分为5个层级,依次是生理需求、安全需求、归属需求、尊重需求和自我实现需求

image.png

6、用户消费的成本与收益

    用户画像本质上反映了不同用户对消费某产品的收益和成本的差异,因此用户画像一定要结合业务来展开,不同阶段的业务所需要的用户画像侧重点不同。

例如:用户画像与金融产品精准营销的关系:

image.png

7、用户细分的方法

4种用户细分的方法:

    第1种是层级细分,按用户给企业带来的价值将其划分为4~6层并设计不同的服务模式。这种细分方法的优点是数据需求低,如金融产品只需要使用用户的金融资产信息,同时方便理解,容易根据用户的价值高低分配营销资源。缺点是难以基于这种细分方式设计符合用户需求的特定产品和服务。

image.png

    第2种是用户群体细分,从多个维度(包括资产、人口特征、用户行为等)探索用户的需求,形成特定产品需求的群体,然后有针对性地设计产品和服务。这种细分方法的优点是用户群体有共同的需求、共同的特征,可以按照群体的生命周期进行管理。缺点是分群往往比较模糊,而且不能指导企业营销资源的分配。

image.png

    第3种是双重细分。首先,按照资产规模和贡献潜力等战略维度对用户进行细分,用来确定资源分配、接触频率和渠道等。其次,在每层战略细分的用户群体内,采用产品用户群体或一系列变量形成策略因子群体以推动产品营销。这种方式的优点是有助于围绕用户价值进行组织,同时可以在用户价值的基础上结合用户偏好进行更好的细分。缺点是相比前两种方法,更多的数据会导致业务人员在使用时难以操作。

    第4种是先进细分,收集所有结构化和非结构化数据维度(可多达上千种标签)以支持特定产品、服务和营销活动建议,可以支持用户一对一定制化方案。先进细分这种方法主要通过算法实现,因此要求的数据量比较大,优缺点和用户群体细分的优缺点类似。

8、基于用户分群的精准营销

    需求是需要产品去满足的,一个产品应该优先满足用户的刚需。显然,作为销售人员,在给产品做用户画像时,应该优先定位其刚需人群。

    个人的用户特质、行为偏好是通过标签反映的,而产品的目标人群可通过对其已有用户做细分,也就是通过用户画像来确定,进而制定决策点,在做营销活动时,将个人的标签与产品的画像进行匹配营销,这就是基于用户分群的精准营销。

image.png

匹配用户标签与产品属性:

image.png

9、标签与数据科学的过程

    不同群体的定义是基于用户标签来制定的,通过用户标签可以区分不同的用户群体,从而帮助业务人员制定不同的营销策略,因此可以理解为,标签是操作层面支持数据科学的基础。

    数据科学是一个发现和解释数据中的模式并解决问题的过程。

image.png

四、实战案例:用Python实现用户画像


1、使用Python进行用户画像的基础知识


2、用户画像在诊断阶段中的应用


3、样本数据集介绍


4、使用SQL语句进行数据处理


5、使用Python做用户画像


^