数据分析实战--保险公司客户分类分析

如题所述

第1个回答 2022-06-14

小文 | 公众号: 小文的数据之旅

五一假期过去了，不知道大家过得怎么样呢？假期的这几天，小文没有选择出去旅游(不想成为人海中的一员-。-)，而是待在家里好好地阅读了我的新书--陈哲老师的《活用数据，驱动业务的数据分析实战》，可谓收获满满。当然说的不是spss的使用技巧，而是分析的思路。书里的案例用的spss，小文并不会，因此小文用python实现了一下。
这个案例来自于第六章--甲保险公司客户分类分析。文中使用了stp法进行分析，即客户细分，目标客户选取，目标客户定位。

客户细分根据客户的分类维度进行细分，分类的维度包括5类，分别是自然属性因素、社会特征因素、行为特征因素、态度偏好因素和生活状态与个性因素。
前三者是表露在外的因素，即通过接触就可知道的因素，属于事前分类维度；后两者需要通过调研才能了解，是客户内在本质的区别，属于事后分类维度。因此，往往通过事后分类维度做客户分类，以保证分类的深入性，再通过事前分类维度进行描述与验证，以保证分类客户的差异性和可接触性。

读取数据，将事后分类维度取出来并查看类型，发现9个维度都是数字类型并且部分维度之间似乎存在一定的相关性，这种相关性可能会造成重叠信息的扩大化，增加分类偏差，因此先对这9个维度进行因子分析。

因子分析是指通过少数不相关的因子反映多个具有相关性的原始信息，起到降维和剔除相关性的作用。
因子分析的前提是具有一定的相关性，因此必须通过了kmo和bartlett球形度检验的数据才能进行因子分析。

通过了适用性检验后进行因子分析，格式为：FactorAnalyzer(rotation= None,n_factors=n,method='principal')
（1）rotation:旋转的方式，包括None:不旋转,'varimax':最大方差法,'promax'：最优斜交旋转；
（2）n_factors:公因子的数量；
（3）method:因子分析的方法，包括'minres':最小残差因子法,'principal':主成分分析法；

查看9个公因子的特征值以及方差贡献率，一般选择方差累计贡献率大于0.8的公因子，而文中选择了特征值大于1的公因子，即方差累计贡献率为0.697的前4个公因子。接着根据4个公因子重新拟合。

查看公因子的提取度，发现当使用4个公因子时，4个公因子对9个维度的解释率都超过0.6，说明提取的4个公因子对原始维度有一定的解释力。
接着查看4个公因子的因子载荷，看看是否需要旋转。因子载荷即公因子对原始维度的解释力。

以第一个维度为例，我们发现4个公因子对原始的第一个维度的解释程度分别为：0.418，-0.046，0.697，0.293，表明公因子1与公因子3之间存在一定的相关性，达不到因子分析的既定效果，因此需要进行旋转，使得各个公因子具有差异化的特征。

还是以第一个维度为例，我们发现经过最大方差法旋转之后，4个公因子对原始的第一个维度的解释程度分别为：-0.069,0.153,0.203,0.824，即公因子4对第一个维度的解释力较大。旋转后4个公因子在原始维度上被明显的区别出来，即4个公因子具有差异性的特征。

经过因子分析之后，我们把所有的客户分成了具有差异性特征的4类客户(代表了9个事后分类维度)，接着我们通过因子类型以及保费金额两个维度进行聚类分析。常用的聚类分析方法有kmeans、DBSCAN以及层次聚类，文中使用了层次聚类，因为层次聚类对数据的类型要求不高且事先不需要知道分为几类，缺点在于计算量大。

通过层次聚类分析，我们将所有客户分为了5类，那么分类的效果如何呢？接下来我们通过方法分析检验分类的效果。我们发现无论是保费金额还是因子类型，通过层次聚类分组后，p值都小于0.05，即组间存在显著性差异，聚类效果良好。

通过单因素方差分析，我们知道细分类型各组间存在显著性差异，那么这种差异怎么表现出来呢？对于数值型数据我们用均值进行比较，对于类别型数据我们用占比比较，然后根据保费金额以及因子类别对细分类型命名。

细分客户之后，要选取目标客户。选取目标客户主要从两个维度度量，分别是客户吸引力和企业竞争力。客户吸引力包括两个方面，一是客户规模，二是保费金额，根据其公司需要，按权重6：4进行计算，得出客户吸引力。企业吸引力主要体现在各个保险公司拥有各个细分类型客户的数量，即市场占有率。

由上图可知，中端外向型客户是甲公司的首选客户，其次是中端享受型客户和高端享受型客户，而低端居家型客户和中端自信型客户在资源不足的情况下暂可放弃。

目标客户定位包括两部分，一是目标客户长什么样，也就是用户画像，通过事前分类维度描述目标客户画像；二是目标客户需求是什么，针对需求进行精准营销。分析过程依然是先进行方差分析，通过方差分析的维度用均值或者占比表现差异性，最后通过对应分析展示效果。

事前分类维度一共由6个，分别是性别、年龄、城市、家庭月收入、汽车价格、学历以及职业。通过方差分析发现，学历以及职业在细分类型组间没有显著性差异，故忽略这两个维度继续分析。

从对应分析效果图可知，甲公司首选目标客户中端外向型客户，主要是在分布在北京，武汉的分布比例也比其他细分类型要高，年龄集中在31-40之间，性别为男，家庭月收入在15000到20000元之间，汽车价格在20-30万元间。

依然是选定各细分类型客户，然后对各个维度进行方差分析，通过方差分析检验后的维度用均值或者占比进行比较；而未通过方差分析的维度，则直接用中端外向型客户进行各个维度的比较，数值型用均值，类型型用占比。

由上面的分析可知：
甲公司的目标客户中端外向型客户在选择保险公司考虑的因素中，比较关注服务网点多、亲朋推荐和信任销售人员，其中尤其关注亲朋的推荐。
在满意度分析中，发现中端外向型客户对目前购买的车险并不满意，满意度只有1.5%，不满意的具体原因还需进一步调研。
中端外向型客户车险平均保费在2780元，比其他细分客户更注重产品个性化。
最后对细分类型间没有显著性差异的维度接着进行分析，都是类别数据，直接value_counts()就可以了，这里就不一一展示了。

今天的分享到此结束，希望各位看官有所收获！！

相似回答

保险公司的客户是怎样分类的,这么分类有什么好处答：2. 按客户来源分类：- 直接客户（直接与保险公司建立关系的客户）- 间接客户（通过第三方推荐或介绍而成为客户的）3. 按客户的赔付情况分类：- 一般客户（根据历史赔付记录分类）- 优质客户（通常指赔付记录良好，忠诚度高，价值大的客户）进行客户细分的好处包括：- 满足多样化需求：客户需求丰富多样，...

浅谈客户细分下的保险营销论文答：客户细分是指在已划分好的特定市场中，根据客户的基本特征，行为特征，价值特征等将客户细分为具有不同险种消费需求的群体。细分能够帮助企业找出高价值客户和潜在客户，区分客户的忠诚度和较易流失的客户，可以有针对性地提供保险产品和服务。客户细分一般有几种方式，主要如下：1）基于人口统计的细分：性别...

保险公司在统计和分析理赔数据是常用的方法是什么答：这可能包括根据事故类型、损失程度、索赔理由、时间因素等对数据进行分类。保险公司通常会使用统计模型和分析工具来深入挖掘和分析数据。这可能包括使用线性回归、时间序列分析、聚类分析等统计方法，以及使用大数据分析和机器学习等技术。这些方法可以帮助保险公司更好地理解风险因素和预测未来理赔趋势。保险公司还...

如何对客户进行分类?视频时间 00:30

保险公司外部客户包括哪些答：实现统一一致的客户界面,企业首先需要从内部打通渠道间的隔离,其次建立统一的数据标准,包括数据口径、统计方法等,再者必须做到不同渠道请求数据的数据源要一致,确保多渠道拥有统一的数据目录。3、简化流程,依托新技术使运营智能化,代替传统复杂的流程简化流程是保险公司发挥“集约化”效果的必由之路,传统流程多以现场、...

如何用ABC分类法对客户分类管理?答：ABC分析的一般步骤有：1、收集数据。按分析对象和分析内容，收集有关数据。2、处理数据。对收集来的数据资料进行整理，按要求计算和汇总。3、制ABC分析表。第一栏为物品名称；第二栏品目数累计，即每一种物品皆为一个品目数，品目数累计实际就是序号；第三栏品目数累计百分数，即累计品目数对总品...

分类分析答：分类分析定义 :根据现有数据中对用户或者产品等的类别特征,抽象归纳为模型,并能为新的用户或者产品等进行类别预测的过程.区别:回归模型,预测的Y是数字型变量——例如销售额分类分析中,预测的Y主要是类别变量——例如用户购买的产品类别,只会在若干个产品类别中可选;或者说顾客是否购买的标签,只会在0(...

客户信息分类包括哪些答：客户信息分类不包括综合类信息。一、客户信息客户信息（Customer Information）涵盖客户喜好、客户细分、客户需求、联系方式等基本资料。客户信息基本类型主要分为描述类、行为类和关联类信息三种。二、客户分类 1. 按客户属性分类：如年龄、性别、教育水平、收入等，这些属性助力企业了解客户基本信息，以制定...

大家正在搜

保险公司车险数据分析保险公司有数据分析保险公司数据分析思路保险公司业务数据分析保险公司数据分析岗怎么样保险公司的数据分析岗保险公司数据分析用什么表格保险公司年度数据分析保险公司数据分析工作内容