近些年来,由于社会大众对隐私保护要求的提高和相关隐私保护相关法律法规的出台,隐私计算技术受到了社会和业界的大量关注。业界对隐私计算的落地也进行了大量的尝试。本篇将介绍一则基于金融营销与风控的落地案例,以及目前隐私计算在多方数据合作中的应用现状。
一、场景介绍
营销和风控是金融领域中两个最重要的任务,也是机器学习落地最多的两个场景。对于银行来说,一个典型的场景是对客户进行贷款、信用卡等产品的销售,即营销任务。当客户进行相关金融业务申请时,银行则需要进行资格审核,过滤“不合格”客户,进行风险控制,即风控任务。机器学习在营销场景中的应用可以帮助从企业的存量客户中更好地筛选出营销目标客户,其目标是在保证营销效果不受明显影响的前提下节约营销资源、减少对低兴趣客户的干扰。机器学习在风控领域的应用可以帮助企业更好地进行用户检测,其目标是找到贷款审批人群中不具备还款能力的申请者,降低银行的坏账率。
在传统的金融领域营销和风控建模中,由于本地数据特征不足,银行需要借助外部数据源来提升建模效果。而数据使用方式一般是数据提供商携带数据进入银行,即直接的数据交易。随着隐私数据保护要求的提高和相关法律法规的出台,并且过去的数据交易方式存在很大的隐私问题,传统金融企业在逐渐失去外部数据源的链接。在这种场景下,如何在满足数据隐私的同时,利用外部数据提升风控和营销建模的效果,成为现阶段金融领域亟待解决的问题。
二、案例解析
在以银行为代表的金融企业与外部数据源(如电商企业等互联网公司)进行联合风控和联合营销的数据合作中,外部数据源为银行提供更加精细的用户画像,提升了其对用户群体的营销和风控建模的表现。
银行与外部数据源的数据合作具有以下两个特点:
数据为分布式存储:银行和外部数据源各自持有数据,为了保护隐私数据的安全,整个过程不能产生数据的直接交换。
计算任务较为复杂:数据合作的目标是风控、营销建模,属于机器学习任务,在安全多方计算中属于较为复杂的计算任务。
整个联合风控分成以下三个大步骤:
隐私求交:由于纵向联邦建模只能在共有客户上进行,银行和数据提供方首先需要进行隐私求交、找到共有客户。
模型训练:在此案例中,我们要对用户是否有违约行为进行预测,属于二分类任务,双方联合训练逻辑斯蒂模型。
模型推理:在完成模型训练之后,双方将模型上线,银行使用模型进行新用户的推理。
三、案例思考
在本篇中,我们介绍了一种金融行业借助外部用户画像进行联合营销、联合风控的场景。在2020年11月中国人民银行发布的《安全多方计算金融应用技术规范》(后文简称规范)中,详细介绍了一种安全多方计算在联合风控中的应用,本落地案例的场景即对应规范中的应用流程。
该规范中的应用主要有两个特点:一是金融企业与数据提供商的数据明文均不出本地。二是多方之间通过传递加密状态下的模型训练中间结果完成建模。在我们介绍的案例中,数据使用者(银行)通过联邦学习利用数据提供者(互联网公司)的特征提升自身的用户画像描述能力,提高自身营销和风控任务的建模表现。
该案例是一个典型的数据分布式存储的纵向联邦建模场景,借助基于同态加密保护的联邦学习方法,实现了数据的所有权和使用权的分离,使互联网公司的海量用户数据在隐私不泄露的前提下赋能金融企业,提升金融场景的机器学习建模效果。
本篇内容摘选自《隐私计算》,作者为香港科技大学计算机科学与工程系副教授、智能网络与系统实验室主任陈凯教授,加拿大工程院及加拿大皇家科学院两院院士、微众银行首席人工智能官杨强教授。
《隐私计算》内容系统完整全面,呈现相对完整的隐私计算知识体系,系统阐述了隐私计算关键技术,包括4大发展阶段,5大应用平台和9大落地实践案例。其理论应用价值兼备,产业实践案例丰富,对隐私计算相关从业者和实践者具有很高的参考价值。
本书亦得到中国科学院院士梅宏作序,中国工程院院士高文,中国工程院外籍院士、加拿大皇家科学院院士罗智泉,创新工场董事长兼CEO李开复等联袂推荐。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com