1. 改善性能
数据库管理员把他们生命中的相当一部份时间花在了调整、试验以改善DBMS性能之上。在诊断应用的滞缓现象和性能问题时,性能不良的数据库(以及数据库查询)通常是最常见的祸因。
可以看出,下面的内容并不能完全决定MySQL的性能。只是想回顾一下前面各章的重点,提供进行性能优化探讨和分析的一个出发点。
-
首先,MySQL(与所有DBMS一样)具有特定的硬件建议。在学习和研究MySQL时,使用任何旧的计算机作为服务器都可以。但对用于生产的服务器来说,应该坚持遵循这些硬件建议。
-
一般来说,关键的生产DBMS应该运行在自己的专用服务器上。
-
MySQL是用一系列的默认设置预先配置的,从这些设置开始通常是很好的。但过一段时间后你可能需要调整内存分配、缓冲区大小等。(为查看当前设置,可使用
SHOW VARIABLES;
和SHOW STATUS;
。) -
MySQL一个多用户多线程的DBMS,换言之,它经常同时执行多个任务。如果这些任务中的某一个执行缓慢,则所有请求都会执行缓慢。如果你遇到显著的性能不良,可使用
SHOW PROCESSLIST
显示所有活动进程(以及它们的线程ID和执行时间)。你还可以用KILL
命令终结某个特定的进程(使用这个命令需要作为管理员登录)。 -
总是有不止一种方法编写同一条SELECT语句。应该试验联结、并、子查询等,找出最佳的方法。
-
使用
EXPLAIN
语句让MySQL解释它将如何执行一条SELECT语句。 -
一般来说,存储过程执行得比一条一条地执行其中的各条MySQL语句快。
-
应该总是使用正确的数据类型。
-
决不要检索比需求还要多的数据。换言之,不要用
SELECT *
(除非你真正需要每个列)。 -
有的操作(包括INSERT)支持一个可选的
DELAYED
关键字,如果使用它,将把控制立即返回给调用程序,并且一旦有可能就实际执行该操作。
插句题外话
-
DELAYED 的含义
在支持的 SQL 操作(如 INSERT)中,使用 DELAYED 关键字可以让操作变成异步执行。也就是说,当客户端执行该操作时,MySQL 会:
-
立即将控制权返回给调用程序
- 调用程序(如一个应用程序或脚本)在发送 SQL 操作后,不需要等待操作实际完成就可以继续执行其他任务。
-
稍后执行实际操作
- MySQL 将操作放入一个队列中,等到目标表可用(例如当前没有其他写操作时),再实际执行该操作。
-
-
工作机制
-
将操作加入队列
- 使用 DELAYED 时,INSERT 操作不会立刻锁定目标表,而是将要插入的数据存储在一个内存队列中。
-
异步处理
- MySQL 后台线程会在目标表可用时,从队列中取出数据并执行插入操作。
-
非阻塞操作
- 这样调用程序就不用等待数据库写操作完成,提高了程序的响应速度。
-
-
优点
-
提升响应速度
- 对于客户端来说,DELAYED 操作立即返回,不会因为表锁或 I/O 等操作造成延迟。
-
适用于高并发场景
- 特别是在高并发写入场景下,可以减少锁竞争,提升整体系统的吞吐量。
-
-
缺点与限制
-
数据可能丢失
- 如果服务器在队列中的数据被实际写入表之前崩溃,这些数据会丢失。
-
目标表的限制
- DELAYED 只支持 MyISAM 存储引擎,不支持 InnoDB 等其他存储引擎。
-
实时性不高
- 插入操作不是即时完成,因此对于需要实时写入的场景不适用。
-
DELAYED 已被废弃
从 MySQL 5.7.6 开始,DELAYED 关键字被废弃,不再推荐使用。
-
回归正题
-
在导入数据时,应该关闭自动提交。你可能还想删除索引(包括
FULLTEXT
索引),然后在导入完成后再重建它们。 -
必须索引数据库表以改善数据检索的性能。确定索引什么不是一件微不足道的任务,需要分析使用的SELECT语句以找出重复的WHERE和ORDER BY子句。如果一个简单的WHERE子句返回结果所花的时间太长,则可以断定其中使用的列(或几个列)就是需要索引的对象。
-
你的SELECT语句中有一系列复杂的OR条件吗?通过使用多条SELECT语句和连接它们的UNION语句,你能看到极大的性能改进。
-
索引改善数据检索的性能,但损害数据插入、删除和更新的性能。如果你有一些表,它们收集数据且不经常被搜索,则在有必要之前不要索引它们。(索引可根据需要添加和删除。)
-
LIKE
很慢。一般来说,最好是使用FULLTEXT
而不是LIKE
。 -
数据库是不断变化的实体。一组优化良好的表一会儿后可能就面目全非了。由于表的使用和内容的更改,理想的优化和配置也会改变。
-
最重要的规则就是,每条规则在某些条件下都会被打破。