[转帖]见识一下SQL Server隐式转换处理的不同

https://cloud.tencent.com/developer/article/1873328

 

 

隐式转换(Implicit Conversion)就像他的名字一样,是个隐秘、不容易被发现的问题,但归根结底,还是设计开发中未遵守相关的规范,或者说是不良的设计开发习惯所导致的。

如果在条件中的字段和变量类型不一致,数据库会按照低精度向高精度的顺序进行隐式转换,转换的过程就会消耗资源,例如CPU,但是更关键的是如果隐式转换的字段是索引列,就会导致因使用了函数而不能用到索引,该使用索引扫描的执行计划就变成了全表扫描,这对系统性能来说就是潜在的风险。

例如在Oracle中,类型转换如下,

字符串类型转换关系,

测试表test的object_name是varchar2类型,subobject_name是nvarchar2类型,都创建了索引,

代码语言:javascript
复制
SQL> create table test as select * from dba_objects;
Table created.SQL> select count(*) from test;COUNT(*)
----------97095SQL> create index idx_test_01 on test(object_name);
Index created.SQL> alter table test modify subobject_name nvarchar2(30);
Table altered.SQL> create index idx_test_02 on test(subobject_name);
Index created.SQL> desc testName             Null?    Type---------------- -------- ----------------------OWNER                     VARCHAR2(30)OBJECT_NAME               VARCHAR2(128)SUBOBJECT_NAME            NVARCHAR2(30)...

构造where varchar2=nvarchar2,因为varchar2精度比nvarchar2小,所以需要将varchar2转换为nvarchar2类型,由于varchar2是左值,对索引列做了函数操作(SYS_OP_C2C),导致不能用到这个索引,因此是全表扫描,

代码语言:javascript
复制
SQL> var p nvarchar2(200);
SQL> exec :p := 'a';
PL/SQL procedure successfully completed.SQL> select * from test where object_name = :p;
no rows selected
------------------------------------------------------------------------------------------------------------
| Id  | Operation         | Name | Starts | E-Rows | Cost (%CPU)| E-Time   | A-Rows |   A-Time   | Buffers |
------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      |      1 |        |   388 (100)|          |      0 |00:00:00.04 |    1396 |
|*  1 |  TABLE ACCESS FULL| TEST |      1 |     16 |   388   (1)| 00:00:05 |      0 |00:00:00.04 |    1396 |
------------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------1 - filter(SYS_OP_C2C("OBJECT_NAME")=:P)

构造where nvarchar2=varchar2,因为varchar2精度比nvarchar2小,所以需要将varchar2转换为nvarchar2类型,但此时的varchar2是右值,虽然用了函数,但是并未影响左值的索引字段nvarchar2,因此即使出现了隐式转换,不会影响索引使用,会采用索引扫描,

代码语言:javascript
复制
SQL> var q varchar2(200);
SQL> exec :q := 'a';
PL/SQL procedure successfully completed.
SQL> select * from test where subobject_name = :q;
no rows selected
-----------------------------------------------------------------------------------------------------------------------------
| Id  | Operation                   | Name        | Starts | E-Rows | Cost (%CPU)| E-Time   | A-Rows |   A-Time   | Buffers |
-----------------------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |             |      1 |        |     1 (100)|          |      0 |00:00:00.01 |       2 |
|   1 |  TABLE ACCESS BY INDEX ROWID| TEST        |      1 |      1 |     1   (0)| 00:00:01 |      0 |00:00:00.01 |       2 |
|*  2 |   INDEX RANGE SCAN          | IDX_TEST_02 |      1 |      1 |     1   (0)| 00:00:01 |      0 |00:00:00.01 |       2 |
-----------------------------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------2 - access("SUBOBJECT_NAME"=SYS_OP_C2C(:Q))

但是最近碰到了一个SQL Server隐式转换的问题,发现还是有区别。

P.S. SQL Server刚接触,如果操作和原理上讲的不对的,请各位指正。

测试场景1

创建一个SQL_Latin1_General_CP1_CI_AS排序规则的数据库,测试表如下,一个字段是varchar,一个字段是nvarchar,都创建了索引,

代码语言:javascript
复制
create table test(c1 nvarchar(200), c2 varchar(200));
insert into test(c1,c2) select cast(a.name as nvarchar(200)), a.name from master.dbo.spt_values a where a.number<10000;
create nonclustered index idx_test_01 on test(c1);
create nonclustered index idx_test_02 on test(c2);

(1) 构造where nvarchar=varchar,

代码语言:javascript
复制
select * from test where c1='a';

此时选择了Index Seek,再回表的操作,

(2) 构造where varchar=nvarchar,

代码语言:javascript
复制
select * from test where c2=N'a';

我们看到执行计划中提醒表达式列出现了类型转换,这会影响执行计划选择“SeekPlan”,执行了CONVERT_IMPLICIT函数的列就是左值c2,强制转换为nvarchar,“SeekPlan”的执行计划,我理解就是Oracle中的Index Unique Scan或Index Range Scan,而且当前确实选择了全表扫描,Table Scan,这就是隐式转换,导致不能使用索引的场景,

测试场景2

创建一个Latin1_General_CP1_CI_AS排序规则的数据库,和场景1相同,测试表如下,一个字段是varchar,一个字段是nvarchar,都创建了索引,

代码语言:javascript
复制
create table test(c1 nvarchar(200), c2 varchar(200));
insert into test(c1,c2) select cast(a.name as nvarchar(200)), a.name from master.dbo.spt_values a where a.number<10000;
create nonclustered index idx_test_01 on test(c1);
create nonclustered index idx_test_02 on test(c2);

(1) 构造where nvarchar=varchar,

代码语言:javascript
复制
select * from test where c1='a';

效果和场景1是相同的,此时选择了Index Seek,再回表的操作,

(2) 构造where varchar=nvarchar,

代码语言:javascript
复制
select * from test where c2=N'a';

这时就可以看出一些不同了,场景1中相同语句,因为隐式转换,导致用了Table Scan,而此处,虽然谓词提示CONVERT_IMPLICIT(c2),但未作为Warning,而且执行计划还是使用的Index Seek,路径上和场景1稍有不同,我猜这个是不是因为CONVERT_IMPLICIT的使用导致的?有知道的朋友,可以介绍下,

我看了下,我们的测试库,常用的排序规则,是Chinese_PRC_BIN,效果和场景2是相同的。

Jonathan Kehayias在这篇文章中,提到了SQL_Latin1_General_CP1_CI_AS和Latin1_General_CP1_CI_AS这两种排序规则不同数据类型的转换关系,如下所示,

P.S.

https://www.sqlskills.com/blogs/jonathan/implicit-conversions-that-cause-index-scans/

(1) SQL_Latin_General_CP1_CI_AS排序规则,

varchar到nvarchar的隐式转换,是黄色的,意思是Causes Scan,即忽略索引,

(2) Latin_General_CI_AS排序规则,

varchar到nvarchar的隐式转换,是绿色的,允许用Seek,

因此在SQL Server中,不同的排序规则,隐式转换的影响可能是不同的,有的会影响索引的选择,有的就无影响,我不知道SQL Server为什么这么多排序规则,我也不知道有没有官方文档列出哪些排序规则对隐式转换是敏感的,

因此这就给用了隐式转换的应用带来了风险,尤其是开发、测试、生产数据库环境的排序规则不同的情况下,可能没人注意排序规则,但是隐式转换的影响可能就会不同,这就像定时炸弹,或许测试环境,隐式转换没关系,速度杠杠的,但到了生产,隐式转换就开始起作用,将原本能索引扫描的强制改为了全表扫描,对系统的性能就会产生冲击。

其实针对这类的问题,最佳方案就是能规范日常的设计和开发,定义合适的字段类型,程序中的变量使用和定义相同的类型,无论用什么排序规则,可以说就没隐式转换什么事儿了。

退而求其次,如果不能做到规范的设计和开发,至少在开发测试的阶段,或者通过工具,或者通过人肉,检索下当前系统中用了全表扫描的语句,再根据字段是否存在索引,判断是否因为书写不当造成了隐式转换。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/724061.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

读AI未来进行式笔记11丰饶时代与奇点

读AI未来进行式笔记11丰饶时代与奇点1. 第四次工业革命 1.1. 在AI轰轰烈烈地拉开第四次工业革命帷幕的同时,一场清洁能源革命也紧锣密鼓地展开 1.1.1. 清洁能源革命好比一场“及时雨”,不但将解决日益加剧的全球气候变化问题,而且会大幅降低全世界的电力成本 1.1.2. 人们将致…

PyQtGraph之多图绘制

from PyQt5.QtWidgets import * import pyqtgraph as pg import sysclass MainWindow(QWidget):def __init__(self):super().__init__()self.setWindowTitle(pyqtgraph作图示例)# 创建 GraphicsLayoutWidget 对象self.pw = pg.GraphicsLayoutWidget()self.pw.setBackground(w)#…

PyQtGraph之柱状图

from PyQt5.QtWidgets import * import pyqtgraph as pg import sysclass MainWindow(QWidget):def __init__(self):super().__init__()self.setWindowTitle(pyqtgraph作图示例)# 创建 PlotWidget 对象self.pw = pg.PlotWidget()# 设置图表标题self.pw.setTitle("订单数量…

PyQtGraph绘制折线图

from PyQt5.QtWidgets import * import pyqtgraph as pg import sysclass MainWindow(QWidget):def __init__(self):super().__init__()self.setWindowTitle(pyqtgraph作图示例)# 创建 PlotWidget 对象self.pw = pg.PlotWidget()# 设置图表标题self.pw.setTitle("气温趋势…

PyQT5之PyQtGraph实时数据显示

from PyQt5 import QtWidgets,QtCore,QtGui import pyqtgraph as pg import sys import traceback import psutilclass MainUi(QtWidgets.QMainWindow):def __init__(self):super().__init__()self.setWindowTitle("CPU使用率监控")self.main_widget = QtWidgets.QWi…

使用pytorch实现HWC转CHW分析

使用pytorch实现HWC转CHW分析 import torch import numpy as np from torchvision.transforms import ToTensor t = torch.tensor(np.arange(24).reshape(2,4,3)) print(t) #HWC 转CHW print(t.transpose(0,2).transpose(1,2)) print(t.permute(2,0,1)) print(ToTensor()(t.num…

双拼学习 - 小鹤双拼

双拼很有意思,很好玩的!1 小鹤双拼 小鹤双拼官方网站 学会了就再也回不去了,大家也学会使用双拼吧!From: @韦易笑 原理就是第一个字母输入声母(红色字体),第二个字母输入韵母(蓝色字体),所有汉字都是两次击键,外加几条纯韵母规则(或者叫零声母,比如啊字),对于声…

Web服务器编程

浏览器与web服务器的通信流程Web编程 Web编程.c 服务器应答格式: 服务器接收到浏览器的数据之后,需要判断GET/后面跟的网页是否存在,如果存在则请求成功,发送指定的指令,并发送文件内容给浏览器,如果不存在,则发送请求失败的指令请求成功: "HTTP/1.1 200 OK\r\n &…

MongoDB文档存储

非关系型数据库存储NoSQL,全称 Not Only SQL,意为不仅仅是 SQL,泛指非关系型数据库。NoSQL 是基于键值对的,而且不需要经过 SQL 层的解析,数据之间没有耦合性,性能非常高。 非关系型数据库又可细分如下。键值存储数据库:代表有 Redis、Voldemort 和 Oracle BDB 等。 列存…

SSH Samba

1. SSH的安装与配置 Secure Shell (SSH) 是一种网络协议,允许用户通过加密的通道安全地访问另一台计算机。SSH广泛用于远程登录系统、管理服务器和进行安全数据传输。在Ubuntu这样的Linux发行版中,安装和配置SSH服务是一项常见且相对简单的任务。以下是在Ubuntu系统上安装和配…

nmap官方文档

名称 nmap — 网络探测工具和安全/端口扫描器 理论 渗透测试流程以及每个阶段需要做的事情 与客户确认测试范围——获得授权书——信息收集——漏洞挖掘——漏洞利用——后渗透——痕迹清除——生成渗透测试报告 项目启动:事先与客户沟通,测试事项、获得授权、保密协议测试对…

使用cJSON库对JSON格式进行解析

JSON format基本概念 JSON是JavaScript Object Notation的简称,中文含义为“JavaScript 对象表示法”,它是一种数据交换的文本格式,而不是一种编程语言 它易于阅读和编写,并且易于机械解析和生成,常在Web开发中用于数据的格式和传输数据格式 对象 JSON 由两种数据结构组成…