风控系统之事件溯源,决策流程记录与版本控制

news/2024/11/14 12:58:10/文章来源:https://www.cnblogs.com/wnhyang/p/18386520

个人博客:无奈何杨(wnhyang)

个人语雀:wnhyang

共享语雀:在线知识共享

Github:wnhyang - Overview


背景

一天,小明在风控管理台查看事件数据时,发现一笔决策结果为“拒绝”❌的交易事件,小明点开事件详情发现其触发了一条“24小时内向不同陌生账户转账超过30w”的规则,规则设置的处置方式是“拒绝”❌。小明通过策略规则却查不到那条“24小时内向不同陌生账户转账超过30w”的规则,经确认原来是这条规则在此交易触发后一段时间内被修改了,已经不知道当时是如何配置的!?

这该怎么办?

我们要知道风控等其他系统都需要对于配置实时生效,所以使用了规则引擎,规则引擎具有实时生效优雅热刷新的特性,但也因此,如果规则设置有问题而没有回滚/溯源/复现的机制,将是很大的问题!!!

所以本质上就是要在规则引擎应用之上打造完善的版本控制,能够对规则历史进行溯源。

事件记录

之前的文章风控系统建设,指标策略规则流程设计,LiteFlow隐式子流程,构造EL和Chain,提到了最终存储在es中大概有哪些数据。以下仅供参考,有部分还没做。

这里再次梳理一下:

1、基础数据,保留所有事件字段。

2、事件处理流程,也就是输入的数据经历了哪些流程和组件处理!

3、策略集结果,包括策略集、策略、规则的所有决策结果。还要加上特殊配置的策略执行流程。

4、指标数据,本次事件计算的所有指标数据。

{"result": {"name": "手机登录策略","code": "phone_login","disposalName": "通过","disposalCode": "pass","policyResults": [{"name": "手机登录最坏","code": "phone_login_worst","mode": "worst","disposalName": "通过","disposalCode": "pass","ruleResults": [{"name": "测试规则03","code": "352452","disposalName": "通过","disposalCode": "pass","score": 0}],"mockRuleResults": []},{"name": "手机登录顺序","code": "phone_login_order","mode": "order","disposalName": "通过","disposalCode": "pass","ruleResults": [],"mockRuleResults": []}]},"zbs": [{"id":"1","name":"24小时交易金额之和","type":"sum","version":0,"value":"1413.07938"},{"id":"3","name":"选必于","type":"sum","version":0,"value":"436864.3324399999"},{"id":"4","name":"24小时交易金额大于10万求和","type":"sum","version":0,"value":"1413.07938"},{"id":"5","name":"规支才公照还","type":"ass","version":0,"value":"1.0"},{"id":"6","name":"且者矿","type":"max","version":0,"value":"988.56238"},{"id":"7","name":"北在文地","type":"min","version":0,"value":"424.517"},{"id":"8","name":"看活历地许","type":"avg","version":0,"value":"706.53969"},{"id":"9","name":"情性特问写养八","type":"sum","version":0,"value":"1413.07938"},{"id":"10","name":"其断子把酸","type":"count","version":0,"value":"2.0"}],"fields": {"N_S_ipCity": "南昌市","N_S_lonAndLat": "98.63974,12.4825","N_S_payerType": "关在那边员","N_S_idCardCity": "未知","N_S_payeeIDNumber": "640000198102131788","N_S_ipProvince": "江西省","N_S_payeeIDCountryRegion": "US","N_F_transAmount": 424.517,"N_S_payerAddress": "其它区 山西省 承德市","N_S_seqId": "c678bfbfb4c544eaaeb52373702a0aca","N_S_payeePhoneNumber": "18643006812","N_S_transSerialNo": "809bbad3-1c81-4b59-9e42-fa0b028d1448","N_S_payerAccount": "1234567890","N_S_payeeAccount": "1234567880","N_S_ip": "106.230.80.158","N_S_policyCode": "phone_login_worst","N_S_payeeType": "济常准属适","N_S_payerIDNumber": "420000199805245558","N_S_payeeBankName": "ABC Bank","N_S_phoneNumberProvince": "未知","N_S_ipIsp": "电信","N_S_payerIDCountryRegion": "US","N_D_transTime": "2013-06-21 16:30:09","N_S_phoneNumberCity": "成都","N_S_phoneNumberIsp": "中国电信","N_S_payeeAddress": "- 福建省 抚州市","N_S_payeeRiskRating": "HIGH","N_S_policySetCode": "phone_login","N_S_payerBankName": "XYZ Bank","N_S_idCardDistrict": "未知","N_S_appName": "phone","N_S_idCardProvince": "湖北省","N_S_ipCountry": "中国","N_S_payeeName": "范明","N_S_payerName": "石娜","N_S_payerPhoneNumber": "18123341918","N_S_payerRiskRating": "HIGH"}
}

以下仅是示例,表示一笔事件要记录当时处理流程,示例是线性简单的流程,但实际上怎么样,不知道呢🤷

image

这样每次事件都具备了溯源的基础了,相当于对于当时场景拍了照片(快照嘛)。但是有了照片怎么找到照片里的人呢?🥺

请安心,随着时间的变化,照片里人早已变了模样,只能试着找找喽。

版本控制

这就要提到一种主表+历史表(或者讲快照表)的设计,这种设计特别适用于需要跟踪数据变更的场景。

1. 主表 (Master Table)

主表存储的是最新的、有效的数据记录。通常情况下,主表中会包含业务关键字段以及一些基本的元数据信息(如创建时间、最后修改时间等)。

示例字段

  • id:唯一标识
  • name:名称
  • status:状态
  • created_at:创建时间
  • updated_at:更新时间

2. 历史表 (History Table)

历史表则用来保存所有历史版本的数据记录。每当主表中的数据发生变化时,旧的数据会被复制到历史表中,以便长期保存。

示例字段

  • id:唯一标识
  • master_id:与主表中的ID对应
  • name:名称
  • status:状态
  • version:版本号
  • changed_by:变更操作者
  • created_at:创建时间
  • updated_at:更新时间

上面是大致的思路,具体怎么实现还是取决于具体的业务场景。

在使用LiteFlow的情况下版本控制又要复杂一些,这里仅提供思路。

关于风控系统中变化最多的规则配置,先来评估一下数据量。已知策略集-策略-规则,策略集对策略是1-n,策略对规则也是1-n,那么对应数据是$$n^{2}$$。如果n100100条规则也不是很夸张🙂‍↕️),那么一个版本的规则库就有1w条数据,任意修改变更一次,一年变化100次也不多对吧🙄,那么历史表就要再✖️100,也就是100w,好像有点难顶了!

怎么办呢?

不想数据行过多的话就降维打击吧🤔

主表可以设置为`1-n-$$n^{2}$$,但历史表可以简化一下,降一个纬度。

history历史表可以设置字段:

  • id:主键
  • policy_set_id:策略集id
  • policy_set_name:策略集名
  • policy_id:策略id
  • policy_name:策略名
  • version:版本号
  • changed_by:变更操作者
  • created_at:创建时间
  • updated_at:更新时间

具体的策略对应的信息进行垂直拆分,

history_ext历史扩展表设置字段:

  • id:与历史表一致
  • policy_info:策略信息json字符串
  • rule_info:规则信息json字符串

这样的话其实就是将策略-规则通过json串压缩在一张表里了,不再是1-n了。

这样的还有一点注意,status如何定义。

  • 如果主表表示最新数据,那么主表就是运行区,status应该是表示开关等,只有大的修改后才会进入历史表,历史表最新版本数据不包含主表数据,。
  • 如果历史表最新版本表示最新数据,那么历史表status就有historyonline之分,主表就表示工作区,状态是等待提交、已提交,类似于git工作区。

image

写在最后

拙作艰辛,字句心血,望诸君垂青,多予支持,不胜感激。


个人博客:无奈何杨(wnhyang)

个人语雀:wnhyang

共享语雀:在线知识共享

Github:wnhyang - Overview

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/789087.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解密华为问界M7 Pro:智能出行的全新里程碑与技术亮点

华为问界M7 Pro为何备受瞩目?这款智能SUV究竟能为出行体验带来怎样的颠覆?智能座舱如何将科技与舒适完美结合,自动驾驶技术又将如何引领未来出行?通过鸿蒙生态的无缝联动,华为能否能够真正改变我们的生活方式?在这篇文章中,深入探讨这些问题,揭示华为在智能出行领域的全…

【ROS教程】服务通信

@目录1.流程2.自定义请求和响应的数据2.1 std_msgs内置类型2.2 编写.srv文件2.3 修改package.xml文件2.4 修改CMakeLists.txt文件2.4.1 修改find_package指令2.4.2 添加add_message_files指令2.4.3 添加generate_messages指令2.5 查看头文件3.编写cpp文件3.1 功能包目录文件树3…

NocoBase 1.3:REST API 数据源、移动端 V2 和更多功能

NocoBase 1.3 带来了 REST API 和 MSSQL 数据源、支持通过 URL 打开弹窗、动态配置字段组件、增强的移动端版本、企业微信认证、多对多数组、以及工作流中的日期计算节点等多项新功能。从 v1.3 开始,NocoBase 提供两个关键分支:main 和 next。main 分支,beta 版本,专注于缺…

ArgoWorkflow教程(三)---使用 Artifacts 实现步骤间文件共享

上一篇我们分析了 Workflow、WorkflowTemplate、template 之间的关系。本篇主要分析如何在 argo-workflow 中使用 S3 存储 artifact 实现步骤之间的文件共享。上一篇我们分析了 Workflow、WorkflowTemplate、template 之间的关系。本篇主要分析如何在 argo-workflow 中使用 S3 …

错误处理、cuda模型、GPU架构杂谈

错误处理、cuda模型、GPU架构杂谈 错误处理 所有编程都需要对错误进行处理,早起的编码错误,编译器会帮搞定,内存错误也能观察出来,但是有些逻辑错误很难发现,甚至到了上线运行时才会被发现,而且有些厉害的bug复现会很难,不总出现,但是很致命,而且CUDA基本都是异步执行…

【日记】已经在开始幻想明年的年度计划了(498 字)

正文看来每次都是准备迎检的时候忙很多,但检查来的时候反倒还好一点。今天比昨天好上一些,没有那么忙了。感觉不去跳舞的 8 月,运动量下降了好多,膝盖经常响。只要半月板没事就好…… 前几天高配速的酸痛好像彻底消失了。今晚想去看看舞蹈室开门没有,如果没有的话就去买巧…

GPU的Fermi 架构与Kepler架构杂谈

Fermi 架构 Fermi架构是第一个完整的GPU架构,如图10-15所示。图10-15 Fermi架构是第一个完整的GPU架构 Fermi架构逻辑图,如图10-15所示,具体数据如下: 1)512个加速核心,CUDA核 2)每个CUDA核心都有一个全流水线的整数算数逻辑单元ALU,和一个浮点数运算单元FPU 3)CUDA核被…

CUDA编程结构、存储管理、线程管理杂谈

CUDA编程结构、存储管理、线程管理杂谈 CUDA编程结构 一个异构环境,通常有多个CPU多个GPU,他们都通过PCIe总线相互通信,也是通过PCIe总线分隔开的。所以要区分一下两种设备的内存: 1)主机:CPU及其内存 2)设备:GPU及其内存 这两个内存从硬件到软件都是隔离的(CUDA6.0 以…

Vue3实现excel文件预览和打印

预览excel 关于实现excel文档在线预览的做法,一种方式是通过讲文档里的数据处理成html,一种是将文档处理成图片进行预览。 首先我们先讲一下实现html这种方式预览的。Excel预览用的是xlsx这个库。 xlsx xlsx是一个优秀的表格处理库,是一款适用于浏览器和nodejs的开源电子表格…

计算机电源管理

在计算机电源管理中,S1, S2, S3, S4 代表不同的电源状态或睡眠状态。 了解这些状态,对计算机设备理解功耗及工作状态有很大帮助。最近公司开会,系统同事有讲S3状态功耗很低,我猜和电脑的睡眠、息屏有关。。。emmm,不懂就要学 以下是这些状态的详细说明:S1 状态(低电量等…

使用SRS实现了音视频通话,以及共享桌面的功能

引言在三年前,写智能小车的时候,当时小车上有一个摄像头需要采集,实现推拉流的操作,技术选型当时第一版用的是nginx的rtmp的推拉流,服务器的配置环境是centos,2H4G3M的一个配置,nginx的rtmp的延迟是20秒,超慢,后来研究了SRS以及ZLMediaKit这两个开源的推拉流服务器,没…