记一次批量更新mysql数据过程

一、前言

需求背景:mysql数据库中有一个表的数据(600多万)有一个字段的内容需要解密再通过另外一种加密方式进行加密再回存。通过java程序计算完成更新。

二、方案一

一条条计算更新。这里是将手机号解密,在通过另外一种方式回存。

算法步骤:

1、查询需要解密的数据总条数

2、循环查询1条数据,进行解密,加密,更新,commit。

	public void updateOne() {int n = 0;n = getCount();log.info("待密数据条数:" + n);if (n > 0) {for (int i = 0; i < n; i++) {TmpMUser tmpMUser = getOne();if (null != tmpMUser) {String yphone = tmpMUser.getCellphoneSha();log.info("原手机号:" + yphone);if (!StringUtils.isEmpty(yphone)) {yphone = yphone.replaceFirst("86-s4:", "");String phone = SM4Util.sm4Decode(yphone, keyString);String origPhone = SHAUtils.getSHA("86-" + phone);log.info("解密出手机号:" + phone);tmpMUser.setPhone(phone);tmpMUserMapper.updateTmpMUser(tmpMUser.getRowId(), phone, origPhone);tmpMUserMapper.commit();}}log.info("已解密数据条数:" + i);}} else {log.info("没有需要解密的数据");}}

存在的问题。

数据量太大,几秒钟才能操作完成一条。原因:每更新一条就commit,消耗数据库性能,第二,更新的条件没有索引,查找数据较慢。

三、方案二

改进,建索引,每200条commit一次。

/*** 更新200条* */public void update200() {int n = 0;n = getCount();log.info("待密数据条数:" + n);if (n > 0) {for (int i = 0; i < n / 200 + 200; i++) {List<TmpMUser> tmpMUserList = get200();if (CollectionUtils.isNotEmpty(tmpMUserList)) {for (TmpMUser tmpMUser : tmpMUserList) {String yphone = tmpMUser.getCellphoneSha();log.info("原手机号:" + yphone);if (!StringUtils.isEmpty(yphone)) {yphone = yphone.replaceFirst("86-s4:", "");String phone = SM4Util.sm4Decode(yphone, keyString);String origPhone = SHAUtils.getSHA("86-" + phone);log.info("解密出手机号:" + phone);tmpMUser.setPhone(phone);tmpMUserMapper.updateTmpMUser(tmpMUser.getRowId(), phone, origPhone);}}tmpMUserMapper.commit();}log.info("已解密数据条数:" + 2 * i + "00");}} else {log.info("没有需要解密的数据");}}

四、主要问题

这里更新数据一定需要手动commit,如果没有commit更新是不生效的,所以优化这一步是关键。

优化完成,提升到每秒200条。

   /*** 提交事务*/@Update("<script>" +"commit " +"</script>")public void commit();

五、mysql常规优化

单表优化

除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度。一般以整型值为主的表在千万级以下,字符串为主的表在五百万以下是没有太大问题的,而事实上很多时候MySQL单表的性能依然有不少优化空间,甚至能正常支撑千万级以上的数据量。

1字段

尽量使用TINYINT、SMALLINT、MEDIUM_INT作为整数类型而非INT,如果非负则加上UNSIGNED;

VARCHAR的长度只分配真正需要的空间;

使用枚举或整数代替字符串类型;

尽量使用TIMESTAMP而非DATETIME;

单表不要有太多字段,建议在20以内;

避免使用NULL字段,很难查询优化且占用额外索引空间;

用整型来存IP。

2索引

索引并不是越多越好,要根据查询有针对性的创建,考虑在WHERE和ORDER BY命令上涉及的列建立索引,可根据EXPLAIN来查看是否用了索引还是全表扫描;

应尽量避免在WHERE子句中对字段进行NULL值判断,否则将导致引擎放弃使用索引而进行全表扫描;

值分布很稀少的字段不适合建索引,例如“性别”这种只有两三个值的字段;

字符字段只建前缀索引;

字符字段最好不要做主键;

不用外键,由程序保证约束;

尽量不用UNIQUE,由程序保证约束;

使用多列索引时主意顺序和查询条件保持一致,同时删除不必要的单列索引。

3查询SQL

可通过开启慢查询日志来找出较慢的SQL;

不做列运算:SELECT id WHERE age + 1 = 10,任何对列的操作都将导致表扫描,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边;

sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库;

不用SELECT *;

OR改写成IN:OR的效率是n级别,IN的效率是log(n)级别,IN的个数建议控制在200以内;

不用函数和触发器,在应用程序实现;

避免%xxx式查询;

少用JOIN;

使用同类型进行比较,比如用'123'和'123'比,123和123比;

尽量避免在WHERE子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描;

对于连续数值,使用BETWEEN不用IN:SELECT id FROM t WHERE num BETWEEN 1 AND 5;

列表数据不要拿全表,要使用LIMIT来分页,每页数量也不要太大。

4引擎

目前广泛使用的是MyISAM和InnoDB两种引擎:

MyISAM

MyISAM引擎是MySQL 5.1及之前版本的默认引擎,它的特点是:

不支持行锁,读取时对需要读到的所有表加锁,写入时则对表加排它锁;

不支持事务;

不支持外键;

不支持崩溃后的安全恢复;

在表有读取查询的同时,支持往表中插入新纪录;

支持BLOB和TEXT的前500个字符索引,支持全文索引;

支持延迟更新索引,极大提升写入性能;

对于不会进行修改的表,支持压缩表,极大减少磁盘空间占用。

InnoDB

InnoDB在MySQL 5.5后成为默认索引,它的特点是:

支持行锁,采用MVCC来支持高并发;

支持事务;

支持外键;

支持崩溃后的安全恢复;

不支持全文索引。

六、mysql语句优化

  1. 尽量避免使用子查询
  2. 用IN来替换OR
  3. 读取适当的记录LIMIT M,N,而不要读多余的记录
  4. 禁止不必要的Order By排序
  5. 总和查询可以禁止排重用union all
  6. 避免随机取记录
  7. 将多次插入换成批量Insert插入
  8. 只返回必要的列,用具体的字段列表代替 select * 语句
  9. 区分in和exists
  10. 优化Group By语句
  11. 尽量使用数字型字段
  12. 优化Join语句

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/97256.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Zookeeper 入门

第 1 章 Zookeeper 入门 1.1概述 Zookeeper从设计模式角度来理解&#xff1a;是一个基于观察者模式设计的分布式服务管理框架&#xff0c;它负责存储和管理大家都关心的数据&#xff0c;然后接受观察者的注册&#xff0c;一旦这些数据的状态发生变化&#xff0c;Zookeeper就将…

MySQL之事务与引擎

目录 一、事物 1、事务的概念 2、事务的ACID特点 3、事务之间的相互影响 4、Mysql及事务隔离级别(四种) 1、查询会话事务隔离级别 2、查询会话事务隔离级别 3、设置全局事务隔离级别 4、设置会话事务隔离级别 5、事务控制语句 6、演示 1、测试提交事务 2、测试事务回滚 4…

哈希表HashMap(基于vector和list)

C数据结构与算法实现&#xff08;目录&#xff09; 1 什么是HashMap&#xff1f; 我们这里要实现的HashMap接口不会超过标准库的版本&#xff08;是一个子集&#xff09;。 HashMap是一种键值对容器&#xff08;关联容器&#xff09;&#xff0c;又叫字典。 和其他容易一样…

[笔记] 阿里云域名知识

文章目录 前言一、域名二、域名常见分类2.1 泛域名2.2 为什么要设置子域名 三、记录类型3.1 A- 将域名指向一个PV4地址3.2 CNAME- 将域名指向另外一个域名3.3 AAAA- 将域名指向一个PV6地址3.4 MX- 将域名指向邮件服务器地址3.5 SRV- 记录提供特定的服务的服务器使用场景 3.6 TX…

Navicat Premium 16.2.7 for Mac

Navicat Premium 16是一款功能强大的跨平台数据库管理工具&#xff0c;支持多种数据库类型&#xff0c;如MySQL、MariaDB、Oracle、SQLite、PostgreSQL等等。它提供了丰富的数据库管理功能和工具&#xff0c;可以帮助开发人员和数据库管理员快速地创建、管理和维护数据库。 Nav…

Windows安装单节点Zookeeper

刚学习Dubbo&#xff0c;在Centos7中docker安装的zookeeper3.7.1。然后在启动provider时一直报错&#xff0c;用尽办法也没有解决。然后zookeeper相关的知识虽然以前学习过&#xff0c;但是已经忘记的差不多了。现在学习dubbo只能先降低版本使用了&#xff0c;之后再复习zookee…

什么是手术麻醉系统?

一、手术麻醉系统的主要作用 手术麻醉系统能更好、更准确地记录和管理手术与麻醉的临床信息&#xff0c;提高医生和麻醉师的工作效率。它主要用于病人手术与麻醉的申请、审批、安排&#xff0c;精确记录病人在手术过程中的术中医嘱、术中费用等信息&#xff0c;追踪生命体征等…

如何将Word转成PDF?试一下这个转换方法

Word转成PDF是现代办公中常见的需求&#xff0c;它可以确保文件的格式和内容在不同平台上保持一致&#xff0c;并且更加方便共享和打印。在这个数字化时代&#xff0c;我们经常需要将Word文档转换为PDF格式&#xff0c;无论是个人用户还是商务用户都会遇到这样的需求。那么如何…

实力认证!OceanBase获“鼎信杯”优秀技术支撑奖

6 月 30 日&#xff0c;2023 “鼎信杯”信息技术发展论坛在京隆重举办第二届“鼎信杯”大赛颁奖典礼。OceanBase 凭借完全自主研发的原生分布式数据库&#xff0c;以及丰富的核心系统国产数据库升级案例&#xff0c;斩获“优秀技术支撑奖”。 论坛上&#xff0c;国内首个基于在…

「Linux」使用VS Code远程连接Linux

目录 一、VS Code简介 1.VS Code是什么&#xff1f; 2.使用VSCode远程连接Linux的好处 二、使用VSCode远程连接Linux 1.在VSCode中使用Remote插件 1.1 安装Remote插件 1.2 配置Remote 2. VS Code远程连接Linux 三、VSCode远程连接Linux时的一些常见问题和解决方法 1.VSCode远程…

并发 04(Callable,CountDownLatch)详细讲解

并发 Callable 1 可以返回值 2可以抛出异常 泛型指的是返回值的类型 public class Send {public static void main(String[] args) {//怎么启动Callable//new Thread().start();Aaa threadnew Aaa();FutureTask futureTasknew FutureTask(thread);new Thread(futureTask,&qu…

美创科技获通信网络安全服务能力评定(应急响应一级)认证!

近日&#xff0c;中国通信企业协会公布通信网络安全服务能力评定2023年第一批获证企业名单。 美创科技获得应急响应一级资质&#xff0c;成为2023年第一批获证企业之一&#xff01; 通信网络安全服务能力评定是对通信网络安全服务单位从事通信网络安全服务综合能力的评定&#…