树状数组

news/2025/1/18 8:56:06/文章来源:https://www.cnblogs.com/ronchen/p/18225509

树状数组(Binary Indexed Tree,BIT)是一种用于维护 \(n\) 个元素的前缀信息的数据结构。

以前缀和为例,对于数列 \(a\),可以将其存储为前缀和数组 \(s\) 的形式,其中 \(s_i = \sum \limits_{j=1}^i a_j\)。那么通过前缀和数组,就可以快速求出原数组中给定区间中数字的和:对于区间 \([l,r]\),区间和为 \(s_r - s_{l-1}\),其中假设 \(s_0 = 0\)

显然,对于长度为 \(n\) 的数列,前缀和需要用长度为 \(n\) 的数组进行存储。而当数列 \(a\) 发生变化时,要使得 \(s\) 数组的内容仍能够正确对应数列 \(a\) 的前缀和,就需要对 \(s\) 的值进行修改,即使数列中只有一个数发生变化,也可能需要修改 \(s\) 数组的多个值,才能保证整个数组仍然存储的是 \(a\) 的前缀和。

类似地,对于长度为 \(n\) 的数列,树状数组也会使用长度为 \(n\) 的数组来进行存储。在这个数组中,每个位置存储的内容则稍微有些复杂。

例题:P3374 【模板】树状数组 1

已知一个数列,需要支持两种操作:
1. 将某一个数加上 \(x\)
2. 求出某区间中每一个数的和并输出。
数列长度和操作个数均不超过 \(5 \times 10^5\)

分析:如果使用朴素的做法,将这个数列保存在一个数组 \(a\) 中,那么对于第二种操作,需要将查询区间内的每一个数依次加起来。如果这样做,那么最坏情况下每一次操作就要遍历整个数组,导致超时。

另一种想法是,通过将数列存储为前缀和数组 \(s\) 的形式,那么就可以快速求出给定区间的和;然而,对于第一种操作,在最坏情况下则又需要修改整个数组,同样会导致超时。

那么有没有方法可以结合两种做法的优势,使得两个操作均使用较低的时间复杂度来完成呢?这里就可以用到树状数组。

对于任何一种数据结构,可以将其抽象为一个黑匣子:黑匣子里面存储的是数据,可以向其提供支持的操作,包括修改操作和查询操作。当向其支持查询操作时,其需要通过保存的数据计算出需要的结果然后返回;当向其提供修改操作时,黑匣子需要更新其内部的数据,来保证对于之后的查询操作,黑匣子仍能够返回正确的结果。能否解决问题取决于这个黑匣子是否能以及能以何种复杂度实现这些操作;而如何实现这样一个黑匣子,则是我们的任务。

在这个问题中,黑匣子需要维护一个数列,需要支持的有单点修改操作和区间查询操作。

和前缀和类似,树状数组每个位置保存的也是原数组中某一段区间的和。为了准确说明每个位置分别保存的是哪一段区间,首先引入一个函数 lowbit(x),它的值是 \(x\) 的二进制表达式中最低位的 \(1\) 所对应的值。例如,\(6\) 的二进制表示为 \((110)_2\),最低位的 \(1\) 为第二个 \(1\),其对应的值为 \((10)_2=(2)_{10}\),故 \(lowbit(6)=2\)\(20\) 的二进制表示为 \((10100)_2\),最低位的 \(1\) 为第二个 \(1\),其对应的值为 \((100)_2=(4)_{10}\),故 \(lowbit(20)=4\)

在常见的计算机中,有符号数采用补码表示,而在补码表示下,\(lowbit(x)\) 有一种简单的表达方法:lowbit(x)=x&(-x),其中 & 为按位与。由于 \(-x\) 的补码为 \(x\) 按位取反后再加 \(1\),考虑 \(x\)\(-x\) 的二进制表示,\(x\) 末尾的若干 \(0\) 在取反后变成 \(1\),加上 \(1\) 后变成 \(0\)\(x\) 最低位的 \(1\) 在取反后变成 \(0\),得到进位后变成 \(1\);比该位更高的不会得到进位,维持取反的状态。因此,在按位与的过程中,只有那一位得到的结果为 \(1\),其余都为 \(0\)

 x 二进制表示:0101...1000...0
-x 的反码表示:1010...0111...1
-x 的补码表示:1010...1000...0

那么,假设树状数组使用数组 \(c\) 来进行存储,原来的 \(n\) 个数分别为 \(a_1\)\(a_n\),则 \(c_i = \sum \limits_{j=i-lowbit(i)+1}^i a_j\)。换句话说,树状数组中每个位置保存的是其向前 \(lowbit\) 长度的区间和。

image

这样做有什么好处呢?考虑假设已经有了这样一个数组 \(c\),如何用它实现前缀和查询操作。假设要求 \(a_1\)\(a_i\) 的前缀和 \(s_i\),可以先将 \(c_i\) 加入答案,那么剩下的部分就是 \(a_1\)\(a_{i-lowbit(i)}\),换句话说,问题变成了求 \(s_{i-lowbit(i)}\)。那么接下来又可以将 \(c_{i-lowbit(i)}\) 加入答案,不断重复操作,直到问题变成求 \(s_0\) 为止,那么此时就已经得到 \(s_i\) 了。示例代码如下:

int query(int x) {int res = 0;while (x > 0) {res += c[x]; x -= lowbit(x); // 从大到小将需要的值求和}return res;
}

这个过程的每一步中,把一个数 \(x\) 变成 \(x-lowbit(x)\),结合之前说的 \(lowbit\) 的含义,可以发现实际上是在不断地去掉 \(i\) 的二进制表示中最低位的 \(1\)。由于一个数 \(i\) 的二进制表示的位数不超过 \(\log i\),故每一次查询的时间复杂度为 \(O(\log n)\)

接下来再考虑单点修改操作。假设修改的数是 \(a_i\),由于可能有多个位置对应的区间包含 \(a_i\),对于这些位置都要进行修改。

例如,要查询 \(s_{14}\) 的值,可以发现 \(s_{14}=c_{14}+c_{12}+c_8=64\);如果要修改 \(a_3\) 的值,则需修改所有包含 \(a_3\) 的区间值,也就是 \(a_3,a_4\)\(a_8\)

image

有哪些位置需要包含 \(a_i\) 呢?先考虑几个结论,假设一个位置 \(c_j\) 包含 \(a_i\),那么有:

  1. \(j \ge i\)。这一点很显然,因为一个位置只会包含它前面的数。
  2. \(lowbit(j) \ge lowbit(i)\),当且仅当 \(j=i\) 时取等号。
  3. \(lowbit\) 的值相等的位置不会包含同一个数。

综合以上的结论,可以按 \(lowbit\) 从小到大的顺序找出满足条件的 \(j\)

首先,\(i\) 是第一个满足条件的 \(j\),记为 \(j_0=i\)

下一个 \(j\) 需要比 \(i\) 大,且 \(lowbit\) 也要更大,即二进制表示中末尾的 \(0\) 更多,因此至少需要把最后一个 \(1\) 变成 \(0\),也就是至少加上 \(lowbit(j_0)\);由于 \(lowbit(j_0)<lowbit(j_0+lowbit(j_0))\),而 \(j_0=i\),所以 \(i\) 显然在 \(j_0+lowbit(j_0)\) 对应的区间内,也就是说 \(j_0+lowbit(j_0)\) 就是下一个 \(j\),记为 \(j_1=j_0+lowbit(j_0)\)

再下一个 \(j\) 又可以通过 \(j_1+lowbit(j_1)\) 得到,由于 \(lowbit\) 是翻倍增长的,所以 \(lowbit(j_0)+lowbit(j_1)\) 仍然小于 \(lowbit(j_1)+lowbit(j_1)\),意味着 \(i\) 也在 \(j_1+lowbit(j_1)\) 所对应的区间内,即 \(j_2=j_1+lowbit(j_1)\)。以此类推,即可得到所有需要修改的位置。示例代码如下:

void add(int x, int y) {while (x <= n) {c[x] += y; x += lowbit(x); // 从小到大修改需要修改的位置}
}

由于 \(lowbit\) 的值只有不超过 \(\log n\) 种,一次修改中一个 \(lowbit\) 值最多只会对应一个需要的位置,所以每一次修改的时间复杂度也为 \(O(\log n)\)

至此,我们知道树状数组可以维护一个数列,并以 \(O(\log n)\) 的时间复杂度进行单点修改操作和前缀和查询操作。对于本题,要实现的是区间和查询操作,可以通过前缀和查询操作来实现:对于 \([l,r]\) 的查询,只需要用 \([1,r]\) 的和减去 \([1,l-1]\) 的和即可。

#include <cstdio>
typedef long long LL;
const int MAXN = 5e5 + 5;
LL a[MAXN];
int n, m;
int lowbit(int x) {return x & -x;
}
LL query(int x) {LL ret = 0;while (x > 0) {ret += a[x];x -= lowbit(x);}return ret;
}
void update(int x, LL d) {while (x <= n) {a[x] += d;x += lowbit(x);}
}
int main()
{scanf("%d%d", &n, &m);for (int i = 1; i <= n; i++) {int x;scanf("%d", &x);update(i, x);}while (m--) {int op, x, y;scanf("%d%d%d", &op, &x, &y);if (op == 1) update(x, y);else printf("%lld\n", query(y) - query(x - 1));}return 0;
}

例题:P3368 【模板】树状数组 2

已知一个数列,需要进行两种操作:将区间 \([x,y]\) 每一个数加上 \(x\);或者求出某一个数的值。
数列长度和操作个数均不超过 \(5 \times 10^5\)

分析:和上个问题相反,这里需要对于数列实现区间加法的修改操作和单点的查询操作。乍一看好像没法使用树状数组,但实际上只需要进行一些小处理,就能把这个问题变得和上个问题相同。

对数组进行差分操作:假设原来的数列为 \(a\),令 \(b_i=a_i-a_{i-1}\),那么 \(a_i=\sum \limits_{j=1}^i b_j\),即 \(a\)\(b\) 的前缀和数组。当 \(b_i\) 增加 \(x\) 时,意味着 \(a_i\)\(a_n\) 都会增加 \(x\)。那么,对于 \(b\) 数组而言,第一个操作的效果为:假设要将区间 \([l,r]\) 的数增加 \(x\),则 \(b_l\) 增加 \(x\)\(b_{r+1}\) 减少 \(x\);第二个操作的效果为:求出 \(b\) 的某个前缀和。这样一来,\(b\) 数组就可以用树状数组进行维护。

#include <cstdio>
const int MAXN = 5e5 + 5;
int a[MAXN], n;
int lowbit(int x) {return x & -x;
}
int query(int x) {int ret = 0;while (x > 0) {ret += a[x];x -= lowbit(x);}return ret;
}
void update(int x, int d) {while (x <= n) {a[x] += d;x += lowbit(x);}
}
int main()
{int m, pre = 0;scanf("%d%d", &n, &m);for (int i = 1; i <= n; i++) {int x;scanf("%d", &x);update(i, x - pre);pre = x;}while (m--) {int op;scanf("%d", &op);if (op == 1) {int x, y, k;scanf("%d%d%d", &x, &y, &k);update(x, k); update(y + 1, -k);} else {int x;scanf("%d", &x);printf("%d\n", query(x));}}return 0;
}

例题:P1908 逆序对

对于给定的一段正整数序列,逆序对就是序列中 \(a_i>a_j\)\(i<j\) 的有序对。给定长度为 \(n\) 的正整数序列,求逆序对数。其中 \(n \le 5 \times 10^5\)

分析:考虑朴素的做法,枚举 \(i\),再枚举比 \(i\) 大的位置 \(j\),统计 \(a_j<a_i\) 的数量。假设把所有 \(j>i\)\(a_j=k\) 的数量记为 \(cnt_k\),那么也就是统计 \(s_{a_i-1}=\sum \limits_{k=1}^{a_i-1} cnt_k\)。也就是说,查询的是一个数列 \(cnt\) 的前缀和。如果按照从大到小的位置枚举 \(i\),那么每当 \(i\) 前进一步,可用的 \(j\) 就增加一个,需要将 \(cnt_{a_j}\) 增加 \(1\)。可以发现,这是不断地在对数列 \(cnt\) 进行前缀和查询和单点修改操作,因此可以用树状数组维护数列 \(cnt\)

但是还有一个问题:数列 \(cnt\) 的长度是多少呢?由于 \(a\) 中的元素可以很大,所以 \(cnt\) 的下标也可以很大。为了解决这个问题,可以用到离散化的思想。由于 \(cnt\) 数组开始时全为 \(0\),总共会进行 \(n\) 次修改,也就是说最多只有 \(n\) 个位置不是 \(0\)。因此可以只记录这些可能非 \(0\) 的位置。具体而言,首先将序列排序并去重,在这个序列上利用 std::lower_bound(),可以快速求出原数列中一个数是数列中的第几小。那么 \(cnt_k\) 可以表示序列中第 \(k\) 小的数的个数。这样一来,\(cnt\) 的长度就最多是 \(n\) 了。

#include <cstdio>
#include <vector>
#include <algorithm>
using std::lower_bound;
using std::sort;
using std::unique;
using std::vector;
typedef long long LL;
const int N = 5e5 + 5;
int n, a[N], bit[N], bound;
vector<int> data;
int discretization(int x) { // 求出x是第几小return lower_bound(data.begin(), data.end(), x) - data.begin() + 1;
}
int lowbit(int x) {return x & -x;
}
void add(int x) {while (x <= bound) {bit[x]++; x += lowbit(x);}
}
int query(int x) {int res = 0;while (x > 0) {res += bit[x]; x -= lowbit(x);}return res;
}
int main()
{scanf("%d", &n);for (int i = 1; i <= n; i++) {scanf("%d", &a[i]); data.push_back(a[i]);}// 离散化的准备工作sort(data.begin(), data.end());data.erase(unique(data.begin(), data.end()), data.end());bound = data.size();LL ans = 0;for (int i = n; i >= 1; i--) {ans += query(discretization(a[i]) - 1);add(discretization(a[i]));}   printf("%lld\n", ans);
}

习题:P5459 [BJOI2016] 回转寿司

给定一个长度为 \(n\) 的序列 \(a\),从中选出一段连续子序列 \([l,r]\),使得 \(L \le \sum \limits_{i=l}^r a_i \le R\),求方案数。
数据范围:\(1 \le n \le 10^5, |a_i| \le 10^5, 1 \le L,R \le 10^9\)

解题思路

枚举 \(r = 1 \sim x\),求出对于每个 \(r\) 有多少 \(l\) 符合条件,累加即为答案。

先预处理出前缀和数组 \(sum\),那么 \(\sum \limits_{i=l}^r a_i\) 的值为 \(sum_r - sum_{l-1}\),当且仅当 \(L \le sum_r - sum_{l-1} \le R\)\(l\) 符合条件。将式子变形,可得 \(sum_r - R \le sum_{l-1} \le sum_r - L\)

所以只需要找到在 \(r\) 前面有多少个 \(sum_{l-1}\)\([sum_r-R,sum_r-L]\) 这个值域范围内。这个问题可以对数据离散化后用树状数组维护,时间复杂度为 \(O(n \log n)\)

参考代码
#include <cstdio>
#include <algorithm>
#include <vector>
typedef long long LL;
using std::sort;
using std::lower_bound;
using std::unique;
using std::vector;
const int N = 1e5 + 5;
int a[N], bit[N * 3], bound;
LL sum[N];
vector<LL> data;
int discretization(LL x) {return lower_bound(data.begin(), data.end(), x) - data.begin() + 1;
} 
int lowbit(int x) {return x & -x;
} 
void add(int x) {while (x <= bound) {bit[x]++;x += lowbit(x);}
}
int query(int x) {int res = 0;while (x > 0) {res += bit[x];x -= lowbit(x);}return res;
}
int main()
{int n, l, r; scanf("%d%d%d", &n, &l, &r);data.push_back(0);for (int i = 1; i <= n; i++) {scanf("%d", &a[i]); sum[i] = sum[i - 1] + a[i]; // 预处理前缀和data.push_back(sum[i]);data.push_back(sum[i] - l);data.push_back(sum[i] - r);}sort(data.begin(), data.end());data.erase(unique(data.begin(), data.end()), data.end());bound = data.size();LL ans = 0;add(discretization(0)); // sum[0]计数加1for (int i = 1; i <= n; i++) { // 枚举右端点int q1 = query(discretization(sum[i] - l));int q2 = query(discretization(sum[i] - r) - 1);ans += q1 - q2; // 累加在值域范围内的方案数add(discretization(sum[i])); // sum[i]计数加1}printf("%lld\n", ans);return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/722509.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

树上前缀和与差分

树上前缀和 设 \(sum_i\) 表示根节点到节点 \(i\) 的权值总和。 则有:对于点权,\(x,y\) 路径上的和为 \(sum_x + sum_y - sum_{lca} - sum_{fa_{lca}}\)。 对于边权,\(x,y\) 路径上的和为 \(sum_x + sum_y - 2 \times sum_{lca}\)。习题:P4427 [BJOI2018] 求和解题思路 预处…

SynProject 介绍---(synopse理解的版本控制和文档自动化生成)

SynProject 介绍---(synopse理解的版本控制和文档自动化生成) Synopse SynProject是一个用于Delphi项目的源代码版本控制和自动化文档生成的开源应用程序。它在GPL许可下发布。 有关其全部功能的完整列表,请参阅SynProject功能。源代码可从本源代码存储库获取。请选择上方的…

品牌全域人群资产增长飞轮

品牌人群资产是指品牌通过一系列营销活动和用户互动所积累的、对品牌有一定认知、情感和忠诚度的用户群体。这些资产是品牌的无形资产,对于品牌的长期成功和市场份额的扩张至关重要。 品牌人群资产可以模拟成一个多层次、多维度的球形结构体,其中核心用户群位于中心,随着用户…

TCP传输控制协议

网络编程 TCP传输控制协议 传输层中最为常见的两个协议分别是传输控制协议TCP(Transmission Control Protocol)和用户数据报协议UDP(User Datagram Protocol) 一、TCP协议的特点:TCP是面向连接的,端对端(一对一)的可靠的协议,可修复损坏数据,全双工的连接。 1.TCP协议判…

NPU与超异构计算杂谈

NPU与超异构计算杂谈 NPU 基础 近年来,随着人工智能技术的飞速发展,AI 专用处理器如 NPU(Neural Processing Unit)和 TPU(Tensor Processing Unit)也应运而生。这些处理器旨在加速深度学习和机器学习任务,相比传统的 CPU 和 GPU,它们在处理 AI 任务时表现出更高的效率和…

网络编程知识点

网络编程 两台主机的进程实现通信的方式 同一台主机中的实现进程间通信的方式有很多,比如管道、信号、消息队列、信号量集、共享内存等,如果现在需要两台主机间的进程实现数据传输,则想要用到套接字文件(socket)的,它的作用则是用于实现不同主机中的进程间通信的。 IP协议 …

VMware-Ubuntu20.04配置双网卡解决远程连接的2种场景

需求场景环境:VMware Workstation下的虚拟机Ubuntu20.04 LTS 需求1:网卡1:桥接模式,在物理局域网与宿主机拥有同网段的IP,便于局域网通信 需求2:网卡2:NAT模式,假如不在家中局域网,宿主机未连入局域网时,Ubuntu使用NAT模式连接宿主机,共享使用宿主机网络,此时需要宿…

MySQL-12.数据库其他调优策略

C-12.数据库其他调优策略 1.数据库调优的措施1.1 调优的目标尽可能节省系统资源,以便系统可以提供更大负荷的服务。(吞吐量更大) 合理的结构设计和参数调整,以提高用户操作响应的速度。(响应速度更快) 减少系统的瓶颈,提高MySQL数据库整体的性能。1.2 如何定位调优问题 不过…

2024/06/09

学习时长:4.5小时 代码行数:121行 博客数量:1篇 今日主要学习了调用阿里云api来完成发送短信验证码 首先要在阿里云开通短信服务 然后申请资质,创建模板。 然后使用api使用 然后就会生成对应的sdk示例// This file is auto-generated, dont edit it. Thanks. package dem…

m基于PSO粒子群优化的LDPC码OMS译码算法最优偏移参数计算和误码率matlab仿真

1.算法仿真效果 matlab2022a仿真结果如下:2.算法涉及理论知识概要Offset Min-Sum(OMS)译码算法是LDPC码的一种低复杂度迭代解码方法,它通过引入偏移量来减轻最小和算法中的量化效应,从而提高解码性能。当应用粒子群优化(PSO)来计算OMS译码算法中的最优偏移参数时,目标是…

第五日

5. 最长回文子串 题目描述:给你一个字符串 s,找到 s 中最长的回文子串 思路从最长入手,用p[i][j]记录从i-j中的最长回文 从回文入手,抓住回文中的中间值,依次求解各个字符作为中间值时的情况,并比较找出最大尝试第一次尝试 class Solution:def longestPalindrome(self, s…

南昌航空大学软院第二次博客

一、前言 1.通过这几次PTA的大作业,加深了我对java编程的了解和熟练度。 这一段时间的学习:这一段时间主要训练了有关java接口和多态相关方面的知识,这部分内容是Java的重要组成部分,他们共同提高了代码的开发效率,使得代码设计灵活,维护简单,结构清晰 关于类的特性:在设…