脱敏算法篇使用阿里云数据脱敏算法为模板,使用算子平台快速搭建流程来展示数据
"变换脱敏"是一种数据处理技术,主要用于保护个人隐私和数据安全。它通过将敏感信息(如姓名、身份证号、电话号码等)进行某种形式的转换,使其无法直接识别,以防止数据泄露和滥用。这种技术在数据分析、数据挖掘、数据共享等领域有广泛应用。
在实际操作中,变换脱敏通常包括以下几个步骤:
1.识别敏感信息:首先需要确定哪些信息是敏感的,例如个人信息、财务信息等。这可以通过人工审查或使用自然语言处理等技术实现。
2.变换策略:根据业务需求和法规要求,制定合适的变换策略。例如,可以将姓名转换为音译名,将身份证号码转换为后四位数字,或将电话号码进行一定的位移变换等。
3.执行变换:使用编程语言或数据处理工具,对原始数据进行变换操作。这可以是全量变换,也可以是根据条件进行部分变换。
4.验证和测试:在变换完成后,需要对数据进行验证和测试,确保变换效果符合预期,且不影响数据的正常使用。
需要注意的是,变换脱敏虽然可以保护个人隐私,但也可能导致数据失真,影响数据分析的准确性。因此,在使用变换脱敏时,需要权衡隐私保护和数据质量之间的关系
变换脱敏及平台支持
数字取证
首先构建数字取整流程,这里使用四舍五入取整,从csv文件读取内容,之后对联系方式分别进行变换,并输出结果
流程图如下,从json文件选取名称,经纬度,分发给变换算子
处理流程-取整脱敏
从世界各国及以及区划的json文件,读取映射结果如下
取整脱敏-json读取
取整算子设置取证位数,保留位数正数为小数点后,负数为小数点前
举例:29.32,对应位数为
2 9 . 3 2
-1 0 1 2
取整脱敏-取整算子
执行流程,查看结果
小数取整-参数-1,十位取整
小数取整-参数1,小数点后一位取整
时间取整
接下来构建时间取整流程,从csv读取姓名和入学时间数据分发给时间取整算子。这里使用时间全部向下取整。
从csv读取数据,入学时间是一段话,需要从这段话里抽取出时间,抽取的结果为时间数组
时间取整-流程图
通过映射展开,得到拉平的数据
时间取整-对象映射
分发给算子,向下取整直接使用时间格式化即可。
时间取整-时间格式化
点击执行流程,查看结果
时间取整-年份
时间取整-天
时间取整-分
字符移位
构建流程如下,从csv读取数据后,为了结果中方便对比,添加入学时间1,身高1列,分发给两个循环位移算子,一个针对字符串进行位移,一个针对数字位移,正数向左移动,负数向右移动
移位脱敏-流程图
位移脱敏-字符串
位移脱敏-数字
执行流程,查看结果
移位脱敏-字符串
移位脱敏-数字
数字移位的话,会存在比如180,向右移动一位变成018,为了保证数据类型不变,会转化成18的情况,无法通过向左移位还原。