数据准备:数据来源于telco.sav,如图1所示,Customer_ID表示客户编号,Peak_mins表示工作日上班时期电话时长,OffPeak_mins表示工作日下班时期电话时长等。
图1 telco.sav数据
分析目的:对移动手机用户进行细分,了解不同用户群体的消费习惯,以更好的对其进行定制性的业务推销,所以需要运用聚类分析。 操作步骤:
1,从菜单中选择【文件】——【打开】——【数据】,在打开数据窗口中选择数据位置以
及文件类型,将数据telco.sav导入SPSS软件中,如图2所示。
图2 打开数据菜单选项
2,从菜单中选择【分析】——【描述统计】——【描述】,然后在描述性窗口中,将需要
标准化的变量选到右边的“变量列表”,勾选“将标准化得分另存为变量”,点确定,如图3所示。
图3 数据标准化
3,从菜单中选择【分析】——【分类】——【K-均值聚类】,在K-均值聚类分析窗口中将
标准化之后的结果选入右边“变量列表”,客户编号选入“个案标记依据”,聚类数改为5。点击迭代按钮,在迭代窗口将最大迭代次数改为100,点击继续。点击保存按钮,在保存窗口勾选“聚类成员”、“与聚类中心的距离”,点击继续。点击选项按钮,在选项窗口勾选“ANOVA表”、“每个个案的聚类信息”,点击继续。点击确定按钮,运行聚类分析,如图4所示。
图4 聚类分析操作
结果分析
表1 最终聚类中心
聚类
1
Zscore: 工作日上班时期电话时长
Zscore: 工作日下班时期电话时长
1.60559 .4608
1 -.14005
2 -.78990 -.58917 -.15010
3 .6134
2 -.49365 .3584
5
4 -.33584 1.18873 -.02375
5 .3730
3 -.29014 -.40407
Zscore: 周末电话时长
Zscore: 国际电话时长
1.68250 1.62690 -.06590
-.64550 -.94040 -.14835
.0467
3 .4142
0 -.05337
.0235
1 .1039
8 -.14059
-.04415 .2162
7 4.87718
Zscore: 总通话时长
Zscore: 平均每次通话时长
由最终聚类中心表可得最终分成的5个类它们各自的均值。
第一类:依据总通话时间长,上班通话时间长,国际通话时间长等特征,将第一类命名为高端商用客户。
第二类:依据其在各项指标中均较低,将第二类命名为不常使用客户。
第三类:依据总通话和上班通话时间居中等特征,将第三类命名为中端商用客户。 第四类:依据下班通话时间最长等特征,将第四类命名为日常客户。 第五类:依据平均每次通话时间最长等特征,将第五类命名为长聊客户。
表2 ANOVA 聚类 均方 Zscore: 工作日上班时期电话时长 Zscore: 工作日下班时期电话时长 582.315 468.001 df 误差 均方 df F Sig. 4 .314 3390 1854.02.002 0 4 .449 3390 1042.39.005 0 Zscore: 周末电话时长
39.06
0 443.179 605.770 463.823
4 .955 3390 40.896
.000 .000
Zscore: 国际电话时长 4 .478 3390 926.658
Zscore: 总通话时长 4 .286 3390
2115.07.00
1
0
Zscore: 平均每次通话时长 4 .454 3390
1021.87.00
2
0
由ANOVA表可根据F值大小近似得到哪些变量对聚类有贡献,本例题中重要程度排序为:总通话时长>工作日上班时期电话时长>工作日下班时期电话时长>平均每次通话时长>国际电话时长>周末电话时长。同时Sig.值都为0,说明各变量对聚类均有显着地贡献(经常用Sig.值是否小于0.05来检验聚类结果是否好)。 结论
经过数据标准化以及K-均值聚类分析,最终我们基本实现了本次分析的目的,较为成功的对某移动电话客户进行了细分,初步了解了各类型用户的手机话费消费习惯,对日后经营有一定的指导意义。该移动运营商,可参考不同类型用户群体的手机话费习惯提出有针对性的话费服务,使经营目标达到最优。
因篇幅问题不能全部显示,请点此查看更多更全内容