数据脱敏(五)脱敏算法-变换算法

脱敏算法篇使用阿里云数据脱敏算法为模板,使用算子平台快速搭建流程来展示数据


  "变换脱敏"是一种数据处理技术,主要用于保护个人隐私和数据安全。它通过将敏感信息(如姓名、身份证号、电话号码等)进行某种形式的转换,使其无法直接识别,以防止数据泄露和滥用。这种技术在数据分析、数据挖掘、数据共享等领域有广泛应用。

  在实际操作中,变换脱敏通常包括以下几个步骤:

1.识别敏感信息:首先需要确定哪些信息是敏感的,例如个人信息、财务信息等。这可以通过人工审查或使用自然语言处理等技术实现。

2.变换策略:根据业务需求和法规要求,制定合适的变换策略。例如,可以将姓名转换为音译名,将身份证号码转换为后四位数字,或将电话号码进行一定的位移变换等。

3.执行变换:使用编程语言或数据处理工具,对原始数据进行变换操作。这可以是全量变换,也可以是根据条件进行部分变换。

4.验证和测试:在变换完成后,需要对数据进行验证和测试,确保变换效果符合预期,且不影响数据的正常使用。

需要注意的是,变换脱敏虽然可以保护个人隐私,但也可能导致数据失真,影响数据分析的准确性。因此,在使用变换脱敏时,需要权衡隐私保护和数据质量之间的关系

变换脱敏及平台支持

数字取证

    首先构建数字取整流程,这里使用四舍五入取整,从csv文件读取内容,之后对联系方式分别进行变换,并输出结果

    流程图如下,从json文件选取名称,经纬度,分发给变换算子

处理流程-取整脱敏

    从世界各国及以及区划的json文件,读取映射结果如下

取整脱敏-json读取

取整算子设置取证位数,保留位数正数为小数点后,负数为小数点前

举例:29.32,对应位数为

2 9 . 3 2

-1 0  1 2

取整脱敏-取整算子

执行流程,查看结果

小数取整-参数-1,十位取整

小数取整-参数1,小数点后一位取整

时间取整

    接下来构建时间取整流程,从csv读取姓名和入学时间数据分发给时间取整算子。这里使用时间全部向下取整。

    从csv读取数据,入学时间是一段话,需要从这段话里抽取出时间,抽取的结果为时间数组

时间取整-流程图

通过映射展开,得到拉平的数据

时间取整-对象映射

分发给算子,向下取整直接使用时间格式化即可。

时间取整-时间格式化

点击执行流程,查看结果

时间取整-年份

时间取整-天

时间取整-分

字符移位

    构建流程如下,从csv读取数据后,为了结果中方便对比,添加入学时间1,身高1列,分发给两个循环位移算子,一个针对字符串进行位移,一个针对数字位移,正数向左移动,负数向右移动

移位脱敏-流程图

位移脱敏-字符串

位移脱敏-数字

执行流程,查看结果

移位脱敏-字符串

移位脱敏-数字

    数字移位的话,会存在比如180,向右移动一位变成018,为了保证数据类型不变,会转化成18的情况,无法通过向左移位还原。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/479581.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot自动注入源码分析

Spring Boot何时注入Autowired标注的属性? 是在Bean实例化后,填充Bean的时候注入Autowired标注的属性 如果注入类型的Bean存在多个,Spring Boot是如何处理的? 如果存在多个类型的Bean,会根据primary—>javax.ann…

Redis典型应用之分布式锁

目录 前言 分布式锁的基础实现 引入过期时间: 引入校验ID: 引入lua lua的简介: 引入看门狗 (watch dog) 引入Redlock算法 前言 在一个分布式系统中,也会涉及到多个节点同时去访问一个公共资源的时候&am…

ArcGIS API for JavaScript 4.X 本地部署(js,字体)

0 目录(4.19) /4.19/ 1 修改文件 1.1 init.js 编辑器打开/4.19/init.js搜索文本[HOSTNAME_AND_PATH_TO_JSAPI],然后将其连同前面的https://替换为http://ip地址/4.19,可以是localhost,只能本机引用 替换后&#xff…

Selenium 自动化测试—如何搭建自动化测试环境

🍅 视频学习:文末有免费的配套视频可观看 🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 最近也有很多人私下问我,selenium学习难吗,基础入门的学习内容很多是3以前…

【linux】体系结构和os管理

冯诺依曼体系结构 输入单元:包括键盘, 鼠标,扫描仪, 写板等 中央处理器(CPU):含有运算器和控制器等 输出单元:显示器,打印机等 这里的存储器指的是内存 三者是相互连接的,设备之间会进行数据的来回拷贝&am…

社区店经营全攻略:如何选址、运营并打造火爆生意?

随着电商的兴起,实体店的经营面临着越来越多的挑战。然而,社区店依然具有独特的优势,如便捷的地理位置、与消费者的紧密互动等。 作为在社区店开鲜奶吧5年的创业者,我深有感触,那么这篇文章将为你提供最有价值的干货信…

计算机设计大赛 深度学习人体跌倒检测 -yolo 机器视觉 opencv python

0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 **基于深度学习的人体跌倒检测算法研究与实现 ** 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满…

深入浅出JVM(一)之Hotspot虚拟机中的对象

本篇文章思维导图 对象的创建 对象的创建可以分为五个步骤:检查类加载,分配内存,初始化零值,设置对象头,执行实例构造器 类加载检查 HotSpot虚拟机遇到一条new指令,会先检查能否在常量池中定位到这个类的符号引用,检查这个类是否类加载过 没有类加载过就去类加载类加载过就进…

基于Java+SpringBoot的旅游路线规划系统(源码+论文)

文章目录 目录 文章目录 前言 一、功能设计 二、功能实现 1.1 前端首页模块的实现 1.2 景点新闻 1.3 景点在线预订 1.4 酒店在线预订 1.5 管理员景点管理 1.6 管理员旅游线路管理 1.7 酒店信息管理 三、库表设计 前言 随着我国的经济的不断发展,现在的一些热门的景…

【C++】类与对象(构造函数、析构函数、拷贝构造函数、常引用)

🌈个人主页:秦jh__https://blog.csdn.net/qinjh_?spm1010.2135.3001.5343🔥 系列专栏:http://t.csdnimg.cn/eCa5z 目录 类的6个默认成员函数 构造函数 特性 析构函数 特性 析构的顺序 拷贝构造函数 特性 常引用 前言 &…

HBase 进阶

参考来源: B站尚硅谷HBase2.x 目录 Master 架构RegionServer 架构写流程MemStore Flush读流程HFile 结构读流程合并读取数据优化 StoreFile CompactionRegion Split预分区(自定义分区)系统拆分 Master 架构 Master详细架构 1)Meta 表格介…

光芒绽放:妙用“GLAD原则”打造标准的数据可视化图表

光芒绽放:妙用“GLAD原则”打造标准的数据可视化图表 文章目录 光芒绽放:妙用“GLAD原则”打造标准的数据可视化图表前言一、可视化工具有哪些?二、那如何做出正确可视化图表 ?GLAD原则1.G原则2.L原则3.A原则4.D原则 三、总结最后…