普及 SAM

news/2024/11/8 8:21:43/文章来源:https://www.cnblogs.com/alexande/p/18533912

参考了一些博客,如有侵权,请告知。

内部资料,包不外传。

定义

后缀自动机(SAM)的结构包含两部分,有向无环单词图(DAWG)和 parent 树。SAM 中的每个节点都同时存在于这两个结构中。

以下假设我们是关于字符串 \(s\) 的 SAM。

DAWG

DAWG 是一个 DAG。

我们令起始结点为 \(st\)\(st\) 在 DAWG 中表示一个空串,而其他所有结点均 \(s\) 的一个或多个子串。

对于 DAWG 中的每条有向边都有一个字符 \(c\),一个结点 \(x\) 所包含的子串为从 \(st\) 走到 \(x\) 路径上的字符依次拼接得到的结果,因为有多条路径,所以结点 \(x\) 可能包含很多子串。

为了描述方便,如果结点 \(x\) 包含 \(s\) 的一个后缀,那么我们称这个点为关键点。

结点

  • 每一个结点代表的所有子串,一定是 \(s\) 某个前缀中若干长度只相差 \(1\) 的后缀。
  • 结点 \(x\) 代表的所有子串中,最长子串长度记为 \(\max ( x )\),最短子串长度记为 \(\min ( x )\)
  • 我们记 endpos 为一个子串在 \(s\) 中所有出现过的结尾位置集合,则一个结点所有子串的 endpos 相同。
  • 任意两个结点的 endpos 不同,否则即可将其合并为一个结点。

有向边

\(u \to v\) 有连边则表示 \(u\) 的所有子串加上这条边所代表的字符 \(c\) 后能够变成的子串被 \(v\) 包含,但不一定其是 \(v\) 的所有子串(\(v\) 可能由多个点连边转移过来)。

后缀链接与 parent tree

注意:后缀链接并没有和 DAWG 中的有向边有直接联系。

  • \(u\) 的后缀链接所指的结点为 \(nxt_u\),如果 \(nxt_u = v\),当且仅当 \(\min(u) = \max (v) + 1\),且 \(nxt_u\) 的子串是 \(u\) 的子串的后缀。
  • 对于 \(u\)\(nxt_u\) 来说,\(nxt_u\) 的 endpos 集合包含 \(u\) 的 endpos 集合。
  • 后缀链接本质构成了一棵以 \(st\) 为根的内向树,我们称这棵树为 parent tree。

构造

大家可以通过构造感受 SAM 的有向边和后缀链接所表示的深层含义。

正常情况下,构造 SAM 的复杂度是 \(O(nV)\) 的,\(V\) 为字符集大小。

SAM 的构造是一个在线的增量算法,也就是说我们通过 \(s\) 的 SAM 得出 \(s + c\) 的 SAM。一般情况下我们选择直接记代码,当然你也可以通过下述例子感受 SAM 的构造过程与严谨逻辑。

首先,当 \(s\)acbabc 时,我们的后缀自动机应该长这样(比较复杂,其实是为了让读者更清楚的理解 SAM 的结构,注意看清楚箭头方向):

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/828668.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

F5 BIG-IP Next WAF 20.3.0 发布下载,新增功能介绍

F5 BIG-IP Next WAF 20.3.0 发布下载,新增功能介绍F5 BIG-IP Next 20.3.0 - 多云安全和应用交付 BIG-IP 是硬件平台和软件解决方案的集合,提供专注于安全性、可靠性和性能的服务 请访问原文链接:https://sysin.org/blog/f5-big-ip-next/ 查看最新版。原创作品,转载请保留出…

知识分享:Air780E软件之UDP应用示例

一、UDP概述UDP(用户数据报协议,UserDatagramProtocol)是一种无连接的、不可靠的传输层协议,主要用于实现网络中的快速通讯。以下是UDP通讯的主要特点: 1.1 无连接通讯: UDP在发送数据之前不需要建立连接,这大大减少了通讯的延迟。发送方只需将数据包封装成UDP报文,并附…

想要硬件设计不用愁?首先要搞懂这三类GPIO!

合宙低功耗4G模组经典型号Air780E,支持两种软件开发方式: 一种是传统的AT指令;一种是基于模组做Open开发。 传统AT指令的开发方式,合宙模组与行业内其它模组品牌在软件上区别不大,在硬件功耗上更有优势; 模组Open开发,合宙采用的是LuatOS方式,相对C-SDK入门更简单,开发…

定位模组LuatOS快速入门:源UART串口通信

合宙Air201资产定位模组——是一个集成超低功耗4G通信、语音通话、超低功耗定位、计步、震动、Type-C、充电、放音、录音等功能的超小PCBA。 内部集成高效、简单、可靠的LuatOS语言,旨在帮助客户降低开发难度,降低研发成本,以及打造超小超低功耗的精品产品。 合宙Air201快速…

为 .NET Conf 2024 做好准备之本地社区活动 .NET Conf China 2024 启动

.NET Conf 2024 是一个面向.NET生态系统社区的大型活动,将于2024年11月12日至14日举行。该活动将通过YouTube和Twitch进行现场直播,并在dotnetconf.net网站上提供直播流。这是一个免费的虚拟事件,旨在为初学者和学习者提供关于AI、Web开发、移动开发和游戏开发等方面的教育内…

源码开放:WebSocket应用示例

1 WebSocket概述WebSocket是HTML5下一种新的协议(本质上是一个基于TCP的协议),它实现了浏览器与服务器之间的全双工通信,能够节省服务器资源和带宽,达到实时通讯的目的。WebSocket协议通过握手机制,允许客户端和服务器之间建立一个类似TCP的连接,从而方便它们之间的通信…

东山派七号STM32MP157-适配U-Boot LCD驱动 内核启动LCD打印启动信息

最近淘到一块东山派7号开发板,基于STM32MP157DAC,因为便宜,买过来玩。 但是韦东山的资料真的有一说一,板子出的挺多,除了卖的最好的板子,其他的资料非常非常少。。(韦老师您看到了别生气,至少因为资料少引发问题我解决了也算收获经验了。。。) 我说的是实话,因为正点…

chapter16

segmentation.py参数第一题问题先让我们用一个小地址空间来转换一些地址。这里有一组简单的参数和几个不同的随机种子。你可以转换这些地址吗? segmentation.py -a 128 -p 512 -b 0 -l 20 -B 512 -L 20 -s 0 segmentation.py -a 128 -p 512 -b 0 -l 20 -B 512 -L 20 -s 1 segm…

刻不容缓腾讯云双十一活动羊毛攻略!!!

前言 每年的各大云厂商都在举办自己的活动,这不腾讯云举办了双十一嘉年华上云拼团 GO, 像我们这类程序员都拥有自己的博客或者需要部署的应用以及 Demo 案例,缺少不了云服务,接下来我带着大家领略最佳价格!!一、活动时间与节奏预热期(10 月 24 日 - 10 月 31 日)可提前了解活…

避坑指南:Mask操作时不要使用float(-inf)填充

在Transformer等类似深度学习任务中有掩码自注意力机制等子模块,会涉及默认的填充值, 建议填一个足够小的数,如-1e6就OK了,如果设置成float(-inf),如: if mask is not None:mask = mask.expand(attention_scores.shape[0], -1, -1, -1)attention_scores = attention_score…

游记:第37届校赛

T7 悦跑圈!启动! 改完这个题我就睡觉 求在s1或s2闭合的最小环,所以我枚举了边,假设一条边的两头分别是u和v,我以为环就是dij跑出来的d[u]+d[v],虽然不会立刻原路返回起点,但是中间可能有重复路径,而环是不能有这种路径的,所以从一开始就错了。(不长记性,失恋三部曲忘…

zlibrary镜像网站,z-library中文入口(持续更新)

zlibrary,一个全球领先的数字图书馆,拥有超过1300万册电子书资源,供人下载。它跨越多个学科,从古典文学到现代科技,再到人文艺术,无所不包。ZLibrary的使命是促进教育平等,让每个人都能便捷地获取知识。zlibrary数字图书馆镜像网址 zlbrary最新官网地址:https://zh.z-l…