作者简介:王星,中国人民大学统计学院;谢邦昌,台湾辅仁大学商学院
信息时代的突出特点是数据爆炸。企业资源系统、销售系统、市场调查、供应链、客户、网站、制造流程等都不断在我们面前添加新的信息;但是我们能利用的数据究竟有多少呢?数据挖掘为我们解决这一问题提供了新的方向。
数据挖掘是利用统计与人工智能的算法;从庞大的企业历史数据中,找出隐藏的规律以及建立精确的模型,预测未来,提供有效的市场行销及客户关系管理。数据挖掘自形成概念以来;已经在银行业、保险业、零售业、电信业、直销行销、制造业、电子商务等领域有广泛的应用。
通过商务智能中的数据挖掘以及OLAP联机分析处理,能够让保险公司掌握数字,掌握趋势;同时协助保险公司监管风险,提升业务,增加竞争力。数据挖掘在保险业中特有的应用可以表现在以下几个方面:
一、医疗保险欺诈与滥用
随着我国寿险公司竞争越来越激烈,理赔服务效率成为大众选择保险公司的重要因素。许多寿险公司开始精简理赔受理的流程,试图利用快速的理赔服务吸引保户的青睐。但是,精简理赔审核流程的后续问题是,有些人利用这一漏洞,滥报保险金,造成保险公司沉重的财务负担。据有关资料显示,在保险业发达的美国,当前的保险犯罪仅次于毒品犯罪,保险公司支付的保险金中10%~15%的部分来自欺诈性索赔,仅1994年医疗保险中的欺诈就导致美国人寿保险公司大约500亿美元损失,占当年美国人寿保险欺诈金额的12%。
医疗欺诈事件通常可分为两类,一是非法骗取保险金;这是保险欺诈事件(fraud);由于这类事件通常会涉及较大金额,理赔人员在审核金额较高的理赔案件时,通常会特别注意,因此这一类案件反而造成的伤害并不大。另一类事件则是在合法领取的范围内,采用不当手段欺骗保险。比如:被保险人隐瞒既往病史,不如实告知;医疗服务提供方开大处方,提供不必要的检查和治疗服务,重复就医、高报理赔金额,转嫁费用,甚至与被保险人相互勾结共同欺骗保险等。另一类是滥用事件(abuse),虽然金额较低,但是数量庞大,再加上某些业务员教唆保民冒领保险金,作为承接业务的诱因,使得此类事件层出不穷。传统的控制该类风险方法通过设置免赔额、支付上限、自负比例等风险控制措施来增加被保险人的费用和风险意识,这些方法虽然在一定程度上抑制被保险人的医疗消费需求,降低医疗服务费用,但由于医疗服务是由保险合同中的第三方——医疗机构来提供的,即使医疗服务的价格可由国家加以控制,医疗服务的数量和总的花费却仍然主要由医疗机构来决定,由于医疗机构的利益与保险公司不一致,必然造成医疗费用的超支和转嫁。从医疗保险的长远发展和国外发达国家的经验来看,只有建立起有效的风险评估手段、灵敏的经营效益分析体系、完善的客户档案库和医疗基础数据库,才可能从根本上增强医疗保险的理赔风险控制能力。
美国Empire Blue Cross公司(简称:EBC)是纽约最大的医疗保险公司,运用数据挖掘技术,1997年共计节省下3850万美金的浮滥理赔支出,同时也根据数据挖掘的模型成功告发了不实开立医疗凭据的医生,他们的做法是首先借鉴风险管理技术将病人按不同医院,不同职业,性格,年龄,收入等特征建立医疗欺诈得分;根据疾病的不同种类,建立疾病费用分布密度,二者综合生成预测模型,并通过自动计分(score)功能,快速将理赔案件依照滥用欺诈平均损失额度进行分类处理。这里有一个问题需要探讨:什么样的预测模型才是保险公司最需要的呢?EBC公司认为,一个成功的医疗欺诈预测模型应该具备以下6项功能:
1)找出可疑滥用案件;
2)整合XML格式数据挖掘模型,能够在网络上轻松运用数据挖掘结果;
3)使用者(理赔部门)不需了解详细数据挖掘原理及技术便能直接应用;
4)给予每个理赔案件滥用分数,让理赔人员可以根据分数高低,迅速处理核发理赔金或决定追查;
5)提供理赔人员明确追查方向;
6)提供医院地理信息系统,协助理赔人员找出异常就诊状况及协助病历调阅。
从上预测模型的6个方面的功能来看,这是一个集信息和分析于一体的综合的知识平台,建设如此庞大的知识系统所需要的数据资源业是多方面的,其中包括:医院病人历年病历数据,区域人口数据,心理特征和犯罪诚实数据以及医院地理数据等。EBC公司认为。通过数据挖掘,能够协助无问题案件快速过关,同时也能够提供理赔审核人员追查可疑案件的线索。
二、车险欺诈分析
除了寿险,产险业的车险理赔欺诈事件也是层出不穷,不但耗损公司资源,同时也会影响整体理赔金发放的服务效率。比如:震惊我国保险界的特大欺诈案犯罪特征最为典型,广东胡氏四兄弟多次到各家保险公司投得机动车辆险,并伪造证明材料,在两年时间从9个保险营业网点先后34次骗取近200万人民币元的保险赔款。世界其他各国,诸如美国、日本、瑞典、德国、英国也都有保险欺诈案的记录。
目前各财险部一般采用聘请商务调查机构或者私人侦探社辅助从事保险欺诈案件的调查。但是,这一手段耗费巨大,很难发展成为常规风险控制手段。通过数据挖掘的工具,能够依照过去的欺诈事件建立预测模型,将理赔申请分级处理,解决恼人的诈骗案。数据挖掘在车险的应用主要表现为:车险理赔申请欺诈侦测、业务员及修车厂勾结欺诈侦测以及显示理赔欺诈追查方向等。
通过测览器接口,车险理赔调查人员无须解读繁复的数据挖掘模型,就能够给予每个理赔案件评等,作为案件审理以及欺诈追查的依据。
三、维持保单持有率
一个好客户的流失会严重影响企业的获利,Peppers与Rogers曾指出,若能将客户流失率减少5%;利润将会有100%的成长。对保险业而言,客户流失问题更是重要,保单持有率一直是保险公司相当重要的经营指针,高保单持有率几乎就是获利能力的同义词。造成客户离去的原因何在?是否存在一些迹象可循以便能在在客户离去之前予以贴心的服务,以降低客户离去的意愿。
在此处同样是通过数据挖掘的工具制定流失预警分数,以协助行销人员制定行销策略,挽回可能流失的顾客。同时;根据数据挖掘技术所找出的规则;也可以协助行销人员改进企业问题,例如:某银行就在流失模型中找出一群顾客容易因为等候客服专线而造成流失,因此银行在这些客户的帐单上所打印的专线号码与其它客户不同,根据这种成本不高的措施(不需要大幅扩增客服专线数量),来减少顾客不耐久候的问题,成功地提升了顾客忠诚度。
另一方面,根据研究指出,如果一名消费者向金融机构多购买一项金融商品服务时,该名顾客的流失机率会降低15%~35%。因此,这样就为前面所介绍的交叉销售模型的应用开辟了市场,使通过交叉销售来提升顾客保单持有率成为可能。
四、既有客户保单再销售
“从已经花过10块钱的人身上再赚10块钱;远比从没做过生意的人下手容易”,对于保险业来说,经过一次交易之后,不但建立起与保户之间的情感信任,同时更在交易过程中搜集了更多的资料。通过这些资料能够对这些客户将来对于公司的忠诚度进行度量和分析吗?在保险和金融服务领域,对这个问题作出回答是非常具有挑战性的。因为在这个领域,第一年或者是第二年和客户发生摩擦的费用是相当高的。此时,应用数据挖掘的技术,可以进行更细致的分析,掌握既有顾客的喜好与需求;进行后续的交叉销售(cross-sell)以及垂直销售(up-sell),来改善公司和客户之间的关系,增进客户和公司的亲情。
数据挖掘的主要功能表现在:找出险种销售组合、找出保户提高保额的时机、找出保户提高保额的时机、建立既有保户再销售清单与规则、建立顾客消费周期事件时序关系。
通过数据挖掘的技术,不但能够运用关联规则找出一次销售给顾客的最佳保险组合,同时还能利用时序规则技术找出再顾客生命周期中,购买保险的时间顺序与规律,协助保险公司找出针对既有保户再销售的最佳方案。
五、保单电话行销
除了业务员推销之外,电话行销也是拓展保险业绩的重要渠道。在直销盛行的今天,各寿险公司已经开始意识到电话行销在提高公司竞争力方面的重要作用。
数据挖掘能够利用过去电话访谈、成交纪录建立预测模型,协助电话行销人员找出较有购买意愿的潜在客户;让行销人员不必再乱枪打鸟,而提升电话销售成交率。
同时,数据挖掘模型结果可以与电话行销中心内部系统整合,提供电话行销人员最立即的协助。包括:决定最有可能的销售险种、决定成交机率最高的call out时机、决定销售脚本、提供交叉销售与再销售规则、提供现有保户流失解约可能性指针。
通过数据挖掘协助电话行销人员的力系统,根据客户的资料,显示客户选购某一险种,比如住院日额险的可能性。另外,用同样的机制可以挑选出最有可能的族群进行电话销售,从而实现电话行销的最优化。
六、保单直效邮件销售
由于寿险业竞争日渐激烈,在减少业务员佣金成本的条件下;原本动辄被业务体系抗议的直效行销手法,已经逐渐为国内寿险业接受。
如何节省邮件行销资源,提升邮件回复率,成为各寿险公司直销的目标。这里的问题是,直效邮件的回复率一般都在0.05%以下,回复率的分布多为偏态或非单峰分布,
采用普通的线性或逻辑斯回归一般不会直接得到较好的结果,此时采用非参数的密度估计或贝叶斯网络技术有可能建立起稳健的预测模型,利用过去邮件行销的历史响应纪录,协助寿险公司进行下列分析:筛选可能的响应客户名单;选择可能购买的险种;分配免费保单资源。
在直销邮件销售中,用增益表(lift chart)或累计增长图(lift gain chart),可以很快确定目标族群。一个好的预测模型,只要发送20%的邮件,就能够得到全部发送的55%~60%左右的回复率,也就是说,通过数据挖掘技术,能够将邮件回复率大幅提高数倍。
总之,以数据挖掘技术为核心的商务智能信息系统正可为保险公司全面提升客户服务水平提供不竭的动力。我们期待着,中国保险业能够有效利用数据挖掘技术,建立强大的商务智能信息系统,为国内保险高速、稳健发展打下坚实的基础。
参考文献:
1Berry, M.J.A., Linoff, G. "Data Mining Technique for Marketing, Sale, and Customer Support". Wiley Computer,1997.
2林杰斌,刘明德等.资料采矿.文魁资讯股份有限公司,2002,4.
3谢邦昌,资料仓储和资料撷取在顾客关系管理上的运用.
4陈滔等,论商业医疗保险的风险控制.保险研究,2001,2.
5Data Mining & SPSS Clementine3db.思科技股份有限公司.