海量智库第30期 | 基于Antlr4的SQL解析器设计介绍

SQL作为一种4GL,开发人员不需要关心其具体如何实现的,只需要进行数据需求声明即可。而对于数据库管理系统或者数据库工具,开发人员则需要了解SQL背后的逻辑,通过编码实现。一般会将SQL语句输出转换成一个语法解析树,对语法解析树进行遍历,实现逻辑。

SQL Parser可以很好的完成SQL解析的任务,但也存在语法受限、对开发人员要求高、消耗大等问题。

因此,我们选择antlr4作为语法解析器的基础技术。本文将为您介绍本文将为您介绍基于antlr4的sql解析器设计


 antlr4工具介绍

antlr4是一款强大的语法分析器生成工具,它可以基于语法定义,自动化的生成编译器的前端(编译器的前端指词法分析、语法分析和语义分析三个阶段),将开发人员从复杂的编译理论中解放出来,集中精力处理业务逻辑。

术语解释:

antlr4的总体设计

antlr4由三部分组成:

  • 语法定义部分
  • 编译器前端
  • 语法解析业务逻辑

人工需要参与的是业务逻辑层的分析单元的代码编写,业务分析单元的输入和输出分别是SQL语句和统一抽象模型。

antlr4的接口设计

1.DDL模型设计

1.1 公共组件设计

1.1.1顶层结构设计

这里只列举了两种类型的SQL语句即DDL和DML,实际上所有的SQL语句如DCL,DAL都是SQLStatement的抽象。

1.1.2 Segment设计

设计说明:

  • Segment用于保存特定的对象信息,和数据库里对对象的定义类似;
  • 所有的Segment接口都继承自SQLSegment,每一种Segment都表示一种不同的功能,但是并没有直接定义方法声明。
1.1.3 TableSegment设计

1.1.4 ColumnSegment设计

设计说明:

  • ColumnDefinitionSegment实现了CreateDefinitionSegment,意义是表示这个类用于创建操作,而非修改操作。
1.1.5 ConstraintSegment设计

设计说明:

  • ConstraintDefinitionSegment是约束定义,实现了CreateDefinitionSegment和AlterDefinitionSegment,表示其既可用于创建时,也可用在修改时,典型的例子就是在建表和修改表时都可以用到。
1.1.6 基础信息类设计

1.2 Oracle DDL设计

1.2.1 CreateTableDDL模型设计

支持的SQL用BNF形式描述如下:

CREATE TABLE [ schema. ] table [relational_table];relational_table::=[ (relational_properties) ]relational_properties::={ column_definition }[, {column_definition}| { out_of_line_constraint }]...column_definition::=column [ datatype ] [ {inline_constraint }...]inline_constraint::=[ CONSTRAINT constraint_name ]{ [ NOT ] NULL| UNIQUE| PRIMARY KEY}out_of_line_constraint::=[ CONSTRAINT constraint_name ]{ UNIQUE (column [, column ]...)| PRIMARY KEY (column [, column ]...)}
1.2.2 DropTableDDL模型设计

DropTableDDL的类图设计如下:

设计说明:

  • Oracle不支持批量Drop Table,在抽象类中的列表是为了兼容类似MySQL这种支持批量删除的数据库准备的。

支持的SQL用BNF形式描述如下:

DROP TABLE [ schema. ] table;
1.2.3 CreateIndexDDL模型设计

CreateIndexDDL类图设计如下:

支持的SQL用BNF形式描述如下:

CREATE INDEX [ schema. ] index_nameON { [schema.] table (column [, column]) };
1.2.4 DropIndexDDL模型设计

DropIndexDDL模型设计类图如下:

支持的SQL用BNF形式描述如下:

DROP INDEX [ schema. ] index ;
1.2.5 TruncateTableDDL模型设计

TruncateTableDDL模型类图设计如下:

设计说明:

  • Oracle不支持批量Truncate Table,此处使用List是为了支持其他的数据库。

支持的SQL用BNF形式描述如下:

TRUNCATE TABLE [schema.] table;
1.2.6 DropTriggerDDL类模型设计

支持的SQL用BNF形式描述如下:

DROP TRIGGER [ schema. ] trigger ;

通过了解Antlr4的设计,快速掌握Antlr4,让开发者简单、高效的进行SQL编译。

目前,海量数据在exBase的增量同步中也使用了Antlr4工具,帮助企业低成本的进行数据库迁移。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/695982.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聚观早报 | 比亚迪海狮07 EV上市;苹果将升级Siri

聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 5月13日消息 比亚迪海狮07 EV上市 苹果将升级Siri OpenAI开发全新技术 沃尔沃EX30车型将上市 SpaceX计划新建发…

OSError: [WinError 1455] 页面文件太小,无法完成操作 的问题

实质问题是报错:caffe2_detectron_ops.dll“ or one of its dependencies 还需要安装一个包: pip install intel-openmp 安装之后顺利测试通过。

UART中的DMA数据处理过程

一、DMA简介 DMA (Direct Memory Access) ,直接内存存储器,使用它在做数据传输时能够大大减轻CPU的负担。 DMA,全称 Direct Memory Access,即直接存储器访问。用来提供在外设和存储器之间或者存储器和存储器之间的高速数据传输。D…

【机器学习-06】Scikit-Learn机器学习工具包进阶指南:机器学习分类模型实战与数据可视化分析

🎩 欢迎来到技术探索的奇幻世界👨‍💻 📜 个人主页:一伦明悦-CSDN博客 ✍🏻 作者简介: C软件开发、Python机器学习爱好者 🗣️ 互动与支持:💬评论 &…

RK3568/RK3588智慧校园AI盒子方案,电子班牌,出入口管制,数字化校园等,支持鸿蒙,支持免费定制

智慧校园解决方案基于物联网、人工智能等新兴技术,为师生构建智能化校园环境,涵盖了校园安全、智慧教室、考勤管理、智慧食堂等多个场景,从工作、学习到生活,带来更人性化、更便捷、更高效的服务。 方案架构 方案特点 全面感知校园…

极狐GitLab 容器镜像安全扫描实践【下】

GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab :https://gitlab.cn/install?channelcontent&utm_sourcecsdn 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署…

巴奴火锅翻车,杜中兵后悔暗讽海底捞

曾经喊出“服务不过度,样样都讲究”、内涵海底捞的巴奴火锅,又改回了2012年的广告语,试图重回“产品主义”。 巴奴火锅于2001年创立于河南安阳,彼时被视作火锅界的黑马。巴奴火锅创始人的杜中兵,坚信“产品主义”一定…

运维安全管理系统:“四集中”管理 解决迫切问题

日前,国内专注于保密与非密领域的分级保护、等级保护、业务连续性安全和大数据安全产品解决方案与相关技术研究开发的领军企业——国联易安依托自身强大的研发能力,丰富的行业经验,自主研发了新一代软硬件一体化统一安全运维平台——国联易安…

品牌舆情都包含什么内容?建议收藏

一个品牌的声誉、形象、产品质量、服务质量等,无时无刻不在接受着大众的检验。互联网传播迅速,一个不好的舆论直接导致整个品牌的声誉受到严重影响。品牌舆情都包含什么内容?接下来伯乐网络传媒就来给大家讲一讲。 一、品牌舆情的基本构成 1…

Bean的生命周期与循环依赖

如有不对的地方,还请大佬指正 Bean生命周期 扫描类 得到 BeanDefinition(包含bean的class等属性值) 后在BeanFactoryPostProcessor对bean实例化之前对Bean的元数据进行操作,修改Bean的属性值、添加自定义的BeanDefinition 实例化非懒加载单例bean1. …

给返修就能炫耀几年?16.4的高分,指标优秀,行业公认top 1顶刊!

本周投稿推荐 SSCI • 2区社科类,3.0-4.0(社科均可) EI • 计算机工程类(接收广,录用极快) SCI&EI • 4区生物医学类,1.5-2.0(录用率99%) • 1区工程类&#…

【C++初阶】string模拟实现

✅✅✅✅✅✅✅✅✅✅✅✅✅✅✅✅ ✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨ 🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿&#x1…