马上注册入会,结交专家名流,享受贵宾待遇,让事业生活双赢。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
刘力欣(苏州大学商学院)刘开强(苏州大学科技处)乔桂明(苏州大学商学院) 近年来,大数据已被医疗行业、能源行业、社交网络行业、电子商务行业和金融行业广泛应用于日常运营和深度分析等过程。其中,金融行业更是在大数据刚刚兴起时就非常关注其潜在机遇,例如将大数据应用于金融产品模型收益提升、风险管理、产品营销和客户关系管理等领域。然而,银行业大范围应用大数据分析仍存在很多挑战。首先,金融机构从业人员较少了解大数据分析,他们对大数据的认知存在两个误区:认为大数据无所不能(Michael & Lupton, 2016),或者认为大数据没有个人经验或组织经验有效(Alles, 2015)。其次,由于应用大数据进行业务流程改造通常需要大量前期投入,银行的管理者会先从投资回报率来思考,大数据业务流程改造是否可以显著提升市场营销效果,获得回报能否远大于投入。但是目前大数据的研究应用案例还很难证明其价值有多大,这就导致许多企业考虑到投入回报率不确定,不愿意先试先行应用大数据分析。因此,证明实际应用大数据分析获得成功具有高可能性,并研究如何提高大数据分析的投入回报率非常重要。再次,银行成功实施大数据项目需要多个业务部门共同协作,只有大数据专家设计精确模型,没有其他部门的共同配合是无法实现高回报率的。例如,在大数据具体实施过程中,需要梳理改造业务流程、制定相应的营销激励方案、员工自上而下一致认可参与大数据解决方案,进而来推动大数据项目的实施。然而,目前关于大数据的研究主要集中在基础设施和算法研究上,从公司管理角度分析大数据项目实施路径的参考文献少之又少。最后,从技术角度来看,如果没有提前进行变量处理或对变量进行降维,现在主流的机器自主学习方法很难对高维度且大量的数据集进行有效的分析。并且随着神经网络和集成分析模型等容易产生极为晦涩难懂结果的方法越来越流行,更加限制了仅具备大数据基础知识的银行员工理解并应用大数据,因此采用一种高效且易于理解的大数据解决方案对于大数据项目的成功实施至关重要。
为了帮助金融机构借助大数据的力量解决实际问题,本文以亚洲大型商业银行A银行为样本,系统研究了银行应用大数据进行精准营销的解决方案:包括从方案设计到实际实施,最后观察大数据项目实际运行结果的全过程。通过总结和研究这个项目的实施过程和经验,揭示了金融机构可以通过应用大数据分析成功实施精准营销,并通过这一解决方案获取长期竞争优势。
文献综述
(一)关于解决方案设计障碍的研究
现在,大多数企业已经意识到采用大数据分析进行投资决策是有意义的,但是Sam & Chatwin (2018)认为一些问题阻碍了这些公司实施大数据分析,如安全隐私、数据量过大、缺乏专业知识和经验、来自机构内部阻力等因素阻碍了公司真正采取行动执行大数据项目。根据Baldwin(2015)的调查,80%左右的机构没有成功实施他们的大数据项目,超过65%的企业报告其大数据项目的回报低于投资金额。Baker (2012)指出技术、组织和背景环境是实施大数据分析项目的重要成功因素,技术指当前该组织机构本身的技术能力;组织指企业的特征,如企业规模、技能和经验等是否适合推进大数据战略;背景环境指竞争对手、合作伙伴和政府支持大环境。可见,迄今为止,大多数研究依然停留在概述实施大数据项目的原则上,那些真正想要采用大数据分析的机构依然很难找到有效的参考项目和立即模仿实施的着手点。
例如在银行业,与大数据分析相关的两个主要领域是精准营销和风险管理,风险管理一直是银行业的核心议题之一,已有不少成功运用大数据分析建立风险模型和内部机制的案例,但精准营销解决方案对于银行业来说仍然是一个全新的领域,很多公司管理者对应用大数据分析的理解依然较浅显。之前大部分研究集中于数据分析的方法,很少研究大数据的实施路径。但是大数据实施过程涉及多个部门、多个业务条线,存在需要不同部门协同配合、梳理业务流程、调配硬/软件设施等很多问题,在资源有限的条件下难以同时实现所有目标。为了尽快获得投资回报,需要明确提升哪些业务的效益,具体每一步应当如何做。Kitchin & Lauriault(2015)认为在大数据分析充分发挥其解决银行问题潜力前,需要从“大处着眼,小处着手”,即把一些小型大数据分析项目作为着手点,通过成功实践具有高回报、高价值的小型项目来奠定未来银行人员大规模应用大数据分析的信心。Sivarajah, Kamal, Irani, et al.(2017)认为应该首先解决最紧迫的需求,并且按照一定顺序实施大数据分析,如实施机器学习项目应当从小型问题向大型问题递进,在实践中整合第一轮的分析结果,并运用到第二轮模型设计中去。由于第一轮小规模测试反映出的错误预测结果、成功响应分析经验、变量权重调整方法等都是极有价值的,有助于将预测分析从实验过程扩展到大规模应用。
(二)关于解决方案设计要点的研究
商业银行储存着大量的客户资料、客户的交易信息和商业数据。为了将这些数据价值进行转化,很多商业银行都渴望借助大数据战略来提高经营效益、提升服务效率。具体来看,商业银行比电子商务和零售等行业获取的客户数据质量要高很多(Kleindienst, 2017)。这是因为:第一,商业银行的客户必须向银行提交准确且精细的数据,如准确的亲属关系、住址、年收入、资产状况等大量涉及到客户核心财务的数据。第二,银行也可以主动追踪每一个客户的账户,追查客户的信用记录,以及信用卡交易、面对面交易、手机端交易、网络交易的具体情况;此外,如果客户是企业端,还可以追踪公司融资行为、财务情况、信用状况、供应链上下游等。相比之下,电子商务公司虽然也需要处理客户的大量浏览记录和消费数据,但是这些数据只收集和储存了较少的客户个人信息,并且如果交易笔数有限会导致数据变量有限,因此电子商务等行业在进行大数据精准营销时会面临数据不足从而导致预测结果误差率大的问题。
相反,银行大数据解决方案面临的挑战不在于数据流缺失,而是数据纬度高这一问题。例如,在大数据分析中非常重要的一步——客户聚类,由于客户的信用记录可能包含数百个和客户画像相关的变量、信用相关的交易行为及其他衍生变量,这些高纬度数据问题会使得聚类分析变得非常复杂,也难以有效地解释客户群体划分,甚至识别解释变量的预测结果。Ma, Baer, Chakraborty(2015)认为当数据集非常大时,数据会出现高偏度、肥尾、大量零数值等特征,这使得客户分类成为一个很大的挑战。他们通过一个包含 30000名客户的聚类实验,发现大量观测值密集在一个聚类中心处,并将 50%的客户分到了一个小组里面。此外,尽管大量文献提出用不同的方法来解决如何进行高纬度数据分析,但这些分析结果并不直观。因为现在大数据研究的趋势是分析方法越来越复杂,内部过程又如同黑匣子一样,难以用通俗易懂的方式说明,结果又没有任何文字解释论述。这就导致实践中没有接受过足够训练的业务人员完全不能阐释这些结论,银行员工无法理解那些影响业务实践的重要变量到底是什么。理论研究与实践完全朝向两个不同的方向发展。因此,企业普遍希望能用更透明、更直观的方法解释机器自主学习过程,这一需求很值得学术界重视。如果没有简单易懂和有意义的分析,就很难把研究推广到业务中,以实践验证实现最大化产出,那么大数据专家们提出的分析模型就是“纸上谈兵”。这一点对银行工作人员是尤为重要的。
(三)关于解决方案效果衡量的研究
大数据分析结果很难进行绩效衡量。目前理论上比较常见的大数据绩效衡量方法是A/B检测或者与基准线进行比较。但这些衡量方法放到实际业务中,很难找到一个合适的基准线来验证营销方法的准确性。实践中两个最常用的绩效衡量指标是衡量新增收入和提升响应率,然而新增收入不一定是由大数据引发,可能是业务实践本身带来的,即不进行大数据分析,凭借传统业务开展也会创造收入;高响应率不一定必然等同于投资回报,即响应率提高是由执行某些操作技巧引发的,而不是大数据分析带来的。Davenport & Dyché(2013)调查了三家美国银行——美国富国银行、美国银行和探索银行,指出银行业曾经是众所周知的最快接受新科技和新变革的行业,然而经济危机后,他们更关注资产平衡表,对于新技术变得保守起来,在低成本这一约束下,银行推进大数据计划需要重新适应这一节奏。因此对于银行而言,可信的收入创造力和有效的响应效率提升是评价大数据项目最重要的指标。
总之,大数据项目的成功实施需要很多因素共同作用,需要大量软硬件条件、各个部门以及全体员工的共同努力。本文讨论了一个从规划到实施大数据在银行应用的实际案例,并观察了该案例的长期影响,是一个结合理论研究与实践需求的实用范例。通过我们的案例研究,希望可以为研究人员、金融从业人员和数据分析专家提供宝贵的知识,并将这些知识应用于他们的大数据研究项目。
案例研究
我们将以亚洲大型商业银行A银行为样本,采用两阶段聚类模型处理高纬度数据,运用产品预测模型对零售产品精准营销进行预测。此外,案例还讨论了大数据的实施策略,探讨在银行营销实践中如何帮助决策者设计调整营销方案,并对营销方案的效果进行详细分析。
A银行全球排名250左右,拥有100多家分支机构,有30多家海外分支机构/代表处,在全球共有6000多名员工。其强势业务是公司业务,尤其是中小企业贷款等,与其他大型商业银行相比,A银行的个人零售业务较弱。2015年,A银行开始拓展电子银行业务,希望通过组织重构,大力发展Fintech领域的潜能,通过大数据分析将个人零售业务培养为另一项强势业务。
大数据分析小组作为A银行这一项目的承接方首先解决了数据获取的合法性及数据保护问题,采用四层机制保护客户数据:第一层大数据分析小组与银行签署保密协议,明确该小组在数据分析过程中期和后期对客户数据、具体模型及应用细节有保密义务;第二层所有数据处理、模型分析均在该银行设备上进行,并且由银行工作人员进行操作;第三层明确数据用途,所有收集的数据仅用于此项目研究,任何人不得将数据拷贝带出或交由第三方;第四层,数据脱敏操作,数据在收集过程中系统自动将姓名、电话、详细住址、详细学历信息、收入等客户个人信息进行了脱敏,显示为代码或简化后的间隔型变量。
(一)A 银行零售客户分析
作为一家大型商业银行,A银行拥有超过250万户活跃零售客户,在对客户进行初步分析后,我们发现A银行面临两项客户关系管理问题。一是存在分支机构的财富管理顾问对部分客户进行过度营销的问题,也就是超过90%的收入是由10%的零售客户贡献的,这一比例显著高于80%的财富由20%人群创造这一法则。二是银行客户的年龄与持有理财产品数量有显著的相关性,即前期随着客户年龄增长,其持有产品的数量保持增长;当客户年龄达到51~60岁左右,持有产品数量将会达到最高值(平均为1.74);此后,其持有产品数量将会骤降(见图1)。因为大多数客户在 60岁以后准备退休或者已经退休,收入就会递减,如果此时这些客户还在接受同样的营销策略,那么银行就是对他们进行了过度营销,会引起客户厌烦,营销效果适得其反。为了解决这两个问题,大数据团队提出两个方法:一是在CRM系统中对客户进行精细分组,并采取针对性策略营销;二是建立产品预测模型进行个人定制化产品推荐。这两项解决方案不仅能够向客户提供个人定制化金融服务,而且有助于提高客户活跃度或激活新客户增加销售收入。
(二)聚类分析
由于客户聚类分析可以归纳客户的相似性,提供一个全体客户的透视图,因此通常被银行业用于进行CRM分析的第一步。在客户数量小、变量有限时这一方法非常容易获得很好的归类结果,然而当客户数量超过20万、解释变量超过700个时,聚类分析就非常难获得理想的结果。为了解决数据维度高、观测变量密集的两个问题,同时为了使得数据分析结果易于被银行员工理解,A银行大数据分析团队提出两阶段聚类分析方法,旨在产生有效的、可解释的聚类结果。
第一阶段进行战略聚类,目标是产生宏观层面的策略规划。在这一阶段,首先根据变量重要性筛选出最常用于银行业客户价值分析(CVS)的托管客户资产(AUM)和客户利润贡献度(CPC)两个变量,结合客户基本信息的50个变量进行第一轮K-means聚类分析。根据分类结果,将客户分为7组,聚类后每组数量降至20000至50000个客户。由于这个聚类产生的分组太大,不适合用于实际执行精准营销,因此将这一结果用于战略规划和客户关系管理影响因素观测。
第二阶段进入操作聚类分析阶段,将第一阶段的分类分成更小的组用于实际销售或者客户关系管理。这一阶段使用了客户账户行为、产品持有情况、KYC(know your customer)、渠道偏好等超过600个变量。首先针对这些变量进行hierarchical分类,根据变量是连续变量还是分类变量进行分类处理,确定变量之间距离集群和变量之间的相关系数,分组整合。将变量进行整合后,再进行客户集群分组,重新进行K-means聚类分析,分组后发现每一个小组都有至少20个独特特征用以命名及与其他小组进行区分,表1展示了基本的二阶段分类方法的策略和分类结果。这样银行员工能够直观地理解分类结果并结合经验验证分类的有效性,剔除离群异常值,便于进行实际营销操作。
(三)产品粘性预测模型
产品粘性预测模型已广泛应用于零售和电子商务行业,用于预测客户对个性化产品推荐的接受情况。在银行,客户的产品粘性包括短期产品粘性和长期产品粘性。长期产品粘性反映了客户对该产品根深蒂固的偏好,主要反映在客户的历史交易记录和产品持有量中。短期产品粘性反映了客户受他人影响产生的产品偏好,例如来自财富管理顾问、朋友、亲戚或媒体的推荐,主要反映在客户的浏览行为(如在银行网站上)或客户加入的社区推荐(如Facebook社区)。当然,如果投资回报率很高,客户的短期产品粘性可能会转变为长期产品粘性,并长期持续。相反,如果投资回报很低,失去客户信任,客户的长期产品粘性可能会转变为短期产品粘性。
长期粘性预测模型第一步采用RFM模型,通过计算最近一次购买间隔 (Recency)、购买产品频率 (Frequency)和金额(Monetray),得出客户对共同基金、保险、信用卡、黄金、外币储蓄账户、外币存款和个人贷款等七种金融产品的长期粘性得分。第二步将RFM得分最高的10%客户作为 trainning data,构建决策树预测模型。第三步将客户基本资料中的字段、历史交易、产品持有量和投资回报统计等163个作为输入变量,针对剩余客户进行每一项金融产品响应概率计算。最后将该模型预测的七种个人理财产品的响应概率(粘性得分)进行排序,以确定每位客户偏好的前三种理财产品及顺序(鉴于银行保密协议,此模型具体设计无法详述)。
短期粘性预测模型中需要考虑每个客户最近在该银行网站上的在线浏览点击行为,包括电脑端和移动应用APP端。我们在分析客户浏览网页与浏览后实际购买行为之间的关系后发现:一级短期产品粘性是客户浏览网页后实际购买概率范围的10%~20%,二级短期产品粘性是客户浏览网页后实际购买概率范围的20%~30%。然后,通过客户特征值分析确定每个客户网页浏览后购买产品频率落入的阈值区间。根据对历史数据的分析,如果短期产品粘性中一级产品粘性值和二级产品粘性值高于长期产品粘性中第2个长期产品和第3个长期产品的粘性值,则短期产品可能会挤出长期产品中第2个和第3个产品。如果客户的短期产品粘性没有达到一级标准值,那么客户的三大首选产品都来自长期产品粘性,预测如图2所示。
(四)根据预测模型设计的营销方案
1.多渠道营销方案
图3展示了通过大数据分析得出预测结果后,大数据团队为A银行制定的多渠道自动化精准营销实施方案。大数据团队为A银行设计了每月自动评分系统,并在系统滚动评分中显示出每位客户的战略聚类模型结果、运行集群模型结果和前三大首选产品的标签。
然后,自动评分系统中的这些标签会被推送到以下各大系统:(1)该银行所有网站(含手机网银等)后台;(2)分支机构前台系统;(3)银行呼叫中心;(4)VIP客户的财富管理系统。首先,对于非VIP客户,银行主要通过网站、分支机构前台系统等低成本渠道与之进行互动。值得一提的是,该银行原本有一个由 IBM设计的网上商品推荐引擎,可以向网络浏览的客户自动进行产品推荐。但我们的大数据精准预测结果带来的客户网络点击率比 IBM系统的网络产品广告点击率高出16倍,该引擎现已被我们的预测取代。其次,对于VIP客户,银行的主要互动渠道是财富管理顾问与客户进行沟通营销,或是银行呼叫中心发起电话与客户进行沟通。最后,当客户到任何一家分支机构前台办理业务时,银行柜员可以很快从前台系统中检索到客户的账户信息及个性化产品推荐结果,这样银行柜员可以在处理客户业务需求的同时马上提供个性化的产品推荐。
2.财富管理顾问电话营销
虽然A银行是通过全渠道开展营销活动,但由于一些渠道最近才开始实施,因此本文重点关注财富管理顾问对AUM排名前三的高净值客户进行电话营销这一过程。表2展示了该过程中目标客户、执行的预测模型、项目实施时长、参与分支机构数量和客户平均响应效率。在传统预测模型中,根据客户购买的可能性对其进行评分,进而主要针对那些能将响应率最大化的客户开展营销,以获得最大响应率值来证明其方案有效。然而,该方案希望证明,响应率是由大数据模型触发的,而不是由那些针对营销活动作出积极响应的客户触发的。因此,A银行的营销活动推荐的金融产品(公募基金和保险产品)不向客户提出任何特殊优惠,目标客户目前必须持有这些产品,或在过去六个月内没有购买任何此类产品。本营销过程分三轮实施,以下是该活动执行过程:
第一轮是一个小规模实验,大约三分之一的A银行分支机构自愿参与其中,主要目的是为了验证两阶段聚类分析的效果。在第一轮,分析团队测试了财富管理顾问是否可以激活保守的高资产净值VIP客户。因此,选择保守精英VIP客户、保守退休VIP客户、持有外币资产的潜在VIP客户为目标。根据历史结果这类客户的响应率约为2.4%(基线),而二阶段聚类大数据分析后这些客户响应率达到3.1%。这一活动效果大大提高了银行管理层和员工对大数据解决方案的信心。一是即便目标客户是保守客户,但实验的响应率却非常好,高于基准1%左右;二是此次活动为理财顾问节省了大量时间和精力,即便不了解客户需求,也可以根据分析结果直接对客户进行营销。三是大数据分析团队发现保守的客户只接受低风险的产品,比如保险,这为之后下一步营销提供了重要经验。
由于A银行1/3分支机构在第一轮实验中获得了非常成功的经验,第二轮实验中所有分支机构都参与了营销活动,并且采用了两阶段聚类和产品粘性推荐模型。针对第一轮未营销的激进精英VIP、激进潜在VIP和激进退休VIP客户,结合两阶段聚类分析和产品亲和力模型,以及第一轮的经验和营销话术进行营销。第二轮活动响应率提高到4.9%。第三轮营销活动保留了所有客户类型,这一轮响应率提高到了6.5%。
表3进一步比较了三轮实验客户聚类分析的响应率和客户总贡献排名结果。由于第一轮营销仅采用两阶段聚类分析,并选择了两类保守客户作为营销目标,响应结果仅比基准线高29%。当纳入积极类客户时,第二轮和第三轮的响应率分别比基准线高出104%和171%。结果表明,财富管理顾问和个人理财部门通过在每一轮活动中不断改进他们的营销做法,也提高了响应率。研究结果还表明,虽然高净值客户(精英VIP和退休VIP)的响应率不一定是最高的,但总贡献率最高。
图4显示了产品粘性预测模型和营销活动结果对比。图中实线表示实际营销活动中公募基金响应率与预测的公募基金响应率比值,虚线表示实际营销活动中保险产品的响应率与预测的保险产品响应率比值。基本上,结果显示产品粘性模型的预测结果是相当准确的,因为实际响应率走势与预测的概率趋势基本一致。由于保险响应率明显较小(即样本量较小),该虚线出现了一些不规则的峰值。但图 4显示公募基金的响应率明显高于保险,大约是保险的4到5倍。这些与预测情况是吻合的。
这三轮营销活动持续了10个月,营销活动总销售金额达到30亿美元。在完成所有营销活动后,A银行运用两阶段聚类模型对客户细分情况进行了更新,并帮助A银行完善了客户管理系统,设立了机器自主学习系统,滚动式持续进行大数据产品粘性预测和预测结果推送。
对A银行大数据精准营销解决方案的进一步分析
(一)建立可操作的聚类分析模型和产品粘性预测模型
通常大数据分析聚类模型和产品粘性预测模型研究通过复杂的模型作出预测,但客户分类结果并不能非常清晰鲜明地展示小组特征,分组之后的结果以客群1、客群2、客群3......来代表,这将导致实践中大部分没有接受数据处理训练的银行工作人员不能有效理解分组的意义,带有疑虑进行营销,对于工作人员组织销售话术、选择沟通时间和沟通态度有很大影响,这些影响会降低沟通营销结果。本大数据团队两阶段分类操作过程虽然复杂,但是结果清晰可见,易于银行工作人员理解,并且产品粘性预测模型可进行机器自动学习,逐月对数据进行更新,操作简便,有助于实践应用。
(二)注重呈现有实践意义的大数据分析结果
在大多数公司中,大数据分析团队要为管理层制定战略提供决策建议。传统的管理者和营销销售人员更倾向于依赖个人或集体以往的成功经验,所以通常是大数据战略的主要反对者。因此证明大数据分析对银行增收有实际效果、对于改变反对者态度有重要意义。本文认为进行大数据分析结果的衡量应该采用增加收入和提升响应率两个指标(见表3)。本案例研究中客户在过去六个月内零持有该产品或未购买过任何共同基金和/保险,因此销售增量和响应率提升可以极为有效地反映大数据分析模型的有效性。
(三)解决方案从小范围向大范围推进实施
我们建议实践中首先采用小规模的大数据分析,以了解实施过程中每个内部/外部执行的关键点,再进行大规模推广。本案例第一轮营销活动仅涉及三分之一分支机构,这些分支机构负责人可以被视为大数据早期拥护者。由于这些分支机构经理都是自愿参加测试运行,他们也会全力配合实施大数据营销活动。然后由这些经理将第一轮成功结果作为有力的证据,与其他分支机构经理分享经验,以增加其他没有参加第一轮大数据分析试验的分支机构的信心。最后多轮营销活动不仅帮助所有管理人员熟悉相关技术和模型,还帮助银行员工清晰地观察到客户特征,了解其服务的客户群体,便于以后设计服务策略。
(四)营销渠道的选择
营销成本是营销活动实践另一个需要重要考虑的因素。一类客户的高响应率不等于高贡献率,因此,在商业银行的营销活动中,采用多渠道营销是一种经济有效的方法。低成本渠道,如利用网站和APP向客户推送广告,适用于只能创造低利润的产品或客户;高成本渠道,如财富管理顾问适用于创造高利润的客户,尽管这些客户的响应率可能比较低,但客户创造的总价值高。此外,大数据分析团队发现,在与投资顾问沟通后访问相应网页的客户在所有客户集群中的响应率最高。最后,长期的产品粘性深深植根于过去经验。当通过客户历史购买行为识别客户为保守型客户时,营销活动的结果表明这些客户只接受保守型产品,这为后期营销提供了经验借鉴。
(五)实施过程注意实际工作特色
在实施过程中,及时沟通是最重要的部分。大数据分析团队从一开始就与银行个人金融部门的管理人员和员工密切合作。让利益相关者参与模型开发/实施,并确保他们观察到积极的结果,有助于消除他们对大数据分析能否成功的疑虑。考虑到分公司和产品部都是直接面向客户并且面临业绩考核压力的业务部门,将分析结果与分支机构的日常运营和各项业务业绩目标相结合是本案例研究的一项关键成功因素。最终经过几轮的营销实践,大数据分析对提高精准营销的成功率、提高员工效率、增加收入、降低成本有显著效果,大数据解决方案的意义得到广泛认可。
结论
目前,大数据分析在银行业精准营销中应用相对较少,仍需要一些成功的实践案例来指导银行和其他金融机构制定大数据解决方案,提高他们的信心及成功机会。本案例研究总结了银行如何成功应对大数据分析实践过程中的挑战,以期为其他银行开展大数据分析精准营销提供借鉴。
|