金融案例:统一查询方案助力数据治理与分析应用更高效、更安全

随着企业数据规模的增长和业务多元化发展,海量数据实时、多维地灵活查询变成业务常见诉求。同时多套数据库系统成为常态,这既带来了数据管理的复杂性,又加大了数据使用的难度,面对日益复杂的数据环境和严格的数据安全要求,需要解决多数据库系统并存、数据孤岛严重、权限管理混乱和数据查询提取困难等问题。与此同时,企业对数据安全管控的要求越来越高,不同角色和部门需要访问的数据各异,如何精细控制数据库权限、防止数据泄露和误操作成为关键挑战。

建设背景

相较于日常查询,在系统实施时通过建立索引、分区等技术来优化、提高查询效率。Ad-Hoc查询生成的方式很多,常见方式是将数仓中的DIM表和Fact表映射到语义层,分析师借助语义层选择表建立表间的关联最终生成SQL语句,Ad-Hoc能力是分析师在使用时临时生产的,系统无法预先优化这些查询,即席查询的位置在EDW中。在一个数据仓库系统中,Ad-Hoc查询使用的越多,对数仓的要求就越高。

以银行、消费金融公司为例,存在业务查询与统一Ad-Hoc需求,下设部门涵盖产品研发、运营推广、贷后管理、法务合规等多个业务领域。由此多类型数据库实例共存下,在用户体系整合、数据权限管理、操作安全审计、SQL查询语法等方面变得十分繁杂,急需一款能够进行多数据库接入、统一数据出口的平台。

案例场景

随着业务量的增长,为提升业务处理效率和风险管理水平,业务主要分为三个部门:风险管理部门、科技部门、金融市场部门,其中风险管理人员能够熟练的使用SQL,但需要针对不同的业务改变SQL语法,经常会出现语法不兼容的问题。金融市场人员较少使用SQL,需要以可视化拖拉拽的方式去拉取明细数据。科技部开发人员在操作数据库时经常会出现误删除、修改核心数据,写一些危险SQL对业务库造成压力,需要给使用人员设置DDL权限以及代码检查来保证数据安全。

部门管理员统一在平台内配置用户的账号信息以及数据源的JDBC链接信息,根据业务需要配置数据权限和代码校验规则,完成基础配置后风险管理人员即可在平台内屏蔽掉下游的计算引擎用一种通用SQL语法取数,金融市场人员需要先根据业务配置常用的数据模型,后续进行可视化取数,excel数据整理。而开发人员只能够在所配的权限下对数据库执行DML语句,如果有超出权限的SQL需要发起审批,审批通过后才可以执行。

痛点分析

1、账号存在安全风险

数据库账号往往由多名操作人员共享,运维人员的权限有可能超出工作实际使用所需要的,很容易出现操作越权等行为,给数据安全造成威胁。

2、不同数据库存在语法差异

不同类型的数据库都有其独特的SQL语法和规则,开发人员在编写SQL查询语句时,需要针对不同数据库进行适配,增加了开发的工作量,并可能导致潜在的错误和性能问题。

3、业务多维查询遇到问题

业务查询常见钻取、上卷、切片、切块、行列变换,在业务查询过程中,零售场景查询单个PV或者查询业务流水,数据读取动则上百个G;查询内存OOM,一直不够用;夜间调度与数据同步,产品经理和分析师上班时间杀任务脚本。

4、审计线索不足,追溯困难

传统工具无法记录用户及其行为数据,如果有数据操作异常的行为无法进行溯源和定责,可能导致数据的二次侵害,给平台长期健康稳定运行带来挑战。

5、业务人员SQL使用频率低

许多报表和分析人员对SQL语句不熟悉,新增报表或者固定报表字段变更时需要进行数据探查,过去提取操作都需要依赖IT人员编写SQL查询,导致数据查询周期长,业务决策支持的效率较低。

6、业务数据分散多个系统中

在复杂的融合分析场景下,数据分析难以将存储在本地Excel文件中的数据导入系统与业务库数据进行关联,不能及时灵活的对业务数据进行分析。

建设方案

1、统一查询引擎

支持适配多种数据库语法,自动转换查询语句,提供包括语法高亮、关键词提示、格式化等功能的IDE编辑界面,让用户无需关心底层数据库的语法差异,一站式完成数据连接、数据处理、数据分析等全流程功能。

2、统一身份认证管理

在使用平台前需管理员先维护好用户个人的账号信息以及相应权限,登录统一查询平台后才能访问数据库,无法接触到数据库真实账号密码。

3、AI辅助数据查询

可根据自然语言表达的数据查询结果转译对应的SQL命令,包括SQL的生成、改写、纠错等,帮助查询人员轻松完成复杂数据提取分析工作。

4、降低数据分析门槛

业务人员可以通过拖拽式操作进行数据提取、模型配置、过滤器配置、可视化报表配置等功能,直观地选择数据源、定义查询条件和组合数据,无需深入了解底层数据库结构和SQL语法,提升数据决策支持能力。

5、数据库安全权限管控

配置数据脱敏、行级权限等安全措施,根据不同角色和职责设定权限,保证业务库中数据的隐私和安全,并对权限变动、危险SQL等用户行为实时审计,以确保数据的合规使用。

file

建设收益

在某消费金融公司的项目落地中,使不同部门的人员能够迅速获取所需信息,显著提升了业务处理效率,满足了客户资料查询、交易记录检索、风险信息评估等多种场景的数据分析。同时确保了金融信息的安全性和保密性,为后续平台的稳健运行提供有力保障。

1、数据需求周期大幅缩短

传统的数据需求流程需要经过多个部门审批、协调,由IT人员排期手动提取。统一查询平台借助SQL/自助取数,允许数据分析、业务人员在统一的平台上按需自助提取,大大减少了沟通、开发、测试成本,使得数据获取周期从原来的3-5天缩短到分钟级出数。

2、数据驱动决策门槛显著降低

借助自助取数及SQL收藏等功能,使得一线业务及运营管理人员也能便捷访问多源异构数据资产,推动全员数据驱动决策,自平台上线以来,业务侧数据分析参与度显著提高,登录人次、停留时长、SQL收藏量、查询任务数、数据导出次数等指标均远超项目规划预期。

3、数据风险操作统一溯源

借助平台的审计日志功能,全面覆盖各类对接数据库的数据操作行为,实现操作行为完整记录率的100%触达,不仅增强了数据安全管理及合规性,还将数据风险操作的定位与排查时间从数小时大幅缩短至数分钟内,审计响应效率提升达80%以上。

4、数据访问权限可视可管

统一查询平台运用行/列级权限控制及数据脱敏技术,实现数据访问权限的可视化与精细化管理,提高了数据安全管控能力。数据表权限配置有效覆盖率提升至95%以上,有效阻止非法数据访问;实现对客户信息、渠道数据等的自动识别与脱敏处理,有力保障了企业在数据共享与应用中的安全性与合规性。

file

《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057?src=szsm

《数栈产品白皮书》下载地址:https://www.dtstack.com/resources/1004?src=szsm

《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001?src=szsm

想了解或咨询更多有关大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szcsdn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/661682.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开发一个语音聊天社交app小程序H5需要多少钱?

社交,即时通讯APP系统。如何开发一个社交App||开发一个即时通信应用是一项复杂而充满挑战的任务,需要考虑多个技术、开发时间和功能方面的因素。以下是一个概要,描述了从技术、开发时间和功能角度如何开发这样的应用: 1. 技术要点…

Linux查看某一个程序的安装路径

前提 这一方法的前提条件是:必须是运行着的程序。 方法 这里以查找运行的nginx的安装目录为例。 查看nginx运行进程,查看当前进程的PID,例子中的PID就是7992。 nginps -aux|grep nginx执行ls -l /proc/进程号/exe,然后会打印…

十一、大模型-Semantic Kernel与 LangChain 的对比

Semantic Kernel 与 LangChain 的对比 Semantic Kernel 和 LangChain 都是用于开发基于大型语言模型(LLM)的应用程序的框架,但它们各有特点和优势。 基本概念和目标 Semantic Kernel 是一个由微软开发的轻量级 SDK,旨在帮助开发…

C++Day 7 作业

1、lambda #include <iostream>using namespace std;int main() {int a 100;int b 90;int temp;auto fun [&]()mutable->int {temp a;ab;btemp;};fun();cout<<a<<endl;return 0; } 2、vector #include <iostream> #include <vector>…

C#应用程序实现多屏显示

前言 随着业务发展&#xff0c;应用程序在一些特定场景下&#xff0c;只在一个显示器上展示信息已经不能满足用户需求。我们如何把主屏运行程序中多个窗体移动到各个扩展屏幕位置显示呢&#xff1f;C# 是通过什么方式来实现的&#xff0c;下面介绍 C# 使用 Screen 类的方式来实…

经典机器学习法---感知模型机

优质博文&#xff1a;IT-BLOG-CN 1、模型形式 感知机模型主要用于解决二分类问题&#xff0c;即响应变量Y是个二分类变量&#xff08;如性别&#xff09;。其基本思想是拟找出一个超平面S&#xff0c;将样本空间中的训练集分为两个部分&#xff0c;使得位于超平面S合一侧的点具…

Python 与 TensorFlow2 生成式 AI(三)

原文&#xff1a;zh.annas-archive.org/md5/d06d282ea0d9c23c57f0ce31225acf76 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 第七章&#xff1a;使用 GAN 进行风格转移 神经网络在涉及分析和语言技能的各种任务中正在取得进步。创造力是人类一直占有优势的领域&…

曹操出行冲刺港交所上市:2023年收入突破100亿元,规模效应显现

近日&#xff0c;曹操出行有限公司&#xff08;下称“曹操出行”&#xff09;向港交所递交上市申请&#xff0c;华泰国际、农银国际、广发证券&#xff08;香港&#xff09;担任其联席保荐人。 据招股书介绍&#xff0c;曹操出行由吉利控股集团于2015年孵化成立&#xff0c;使…

第三方软件测评费的取费标准

随着信息技术的快速发展&#xff0c;软件产品在各行各业的应用越来越广泛&#xff0c;而软件的质量直接关系到用户的使用体验和企业的业务运行。为了确保软件的质量和性能&#xff0c;第三方软件测评服务应运而生。那么&#xff0c;第三方软件测评费的取费标准是怎样的呢&#…

内网端口转发与代理

思路&#xff1a;渗透的前提是双方能够建立通信。目前无法和win7建立通信&#xff0c;但是拿到了windows2003的权限&#xff0c;所以可以在Windows2003主机上面建立节点&#xff0c;作为跳板机去访问到内网。 目前状态&#xff1a;控制win2003&#xff08;IP&#xff1a;192.1…

7 -- 异常

目录 异常机制 Error与Exception 什么是异常 异常体系结构 Error Exception 捕获和抛出异常 自定义异常及经验小结 异常机制 Java的异常机制主要依赖于try、catch和finally块来处理程序执行过程中出现的异常事件。 解决方案&#xff1a; 使用try块捕获可能发生异常的…

[华为OD] C卷 5G网络 现需要在某城市进行5G网络建设,已经选取N个地点设置5G基站 200

题目 现需要在某城市进行5G网络建设&#xff0c;已经选取N个地点设置5G基站&#xff0c;编号固定为1到N,接 下来需要各个基站之间使用光纤进行连接以确保基站能互联互通&#xff0c;不同基站之间架设光纤的成 本各不相同&#xff0c;且有些节点之间已经存在光纤相连&#…