前言
树状数组,即树形存储的数组,又称Binary Indexed Tree或Fenwick Tree。
抛开它树形的存储结构,这种神奇的数据结构的应用看起来与「 树」没什么关系:
有一个序列$A=(A_1,A_2,\dots,A_N)$,在不超过$\mathcal O(\log N)$的时间复杂度内完成下列操作:
$\to~$求$[L,R]$区间内所有数之和。
$\to~$指定一个元素$A_x$,将其加上$k$。
如果想要使求和操作尽可能快,很容易想到前缀和,这样求和操作只要$\mathcal O(1)$的时间,但更新操作的时间复杂度就升至$\mathcal O(N)$,无法满足题目要求;反之,若直接暴力维护$A$中所有元素的值,则虽然更新操作只需要$\mathcal O(1)$,但求和操作的时间又变成了$\mathcal O(N)$,还是满足不了要求。那有没有一种算法,综合了两种方式的优势,达到题目时间要求呢?
肯定有,那就是今天说的——树状数组。
基本算法
洛谷 P3374【模板】树状数组 1
同“前言”中的部分,$1\le n,m\le 10^5$,其中$m$为操作总次数。
由于$n,m\le 10^5$,所以$\mathcal O(nm)$的暴力解法肯定行不通,需要使用$\mathcal O(M\log N)$的树状数组。其存储结构大致上是这样的:

是不是已经有些明白了?这里我们我们把$B$当作树状数组的内部存储,则据图可知:
- $B_1=A_1$
- $B_2=A_1+A_2$
- $B_3=A_3$
- $B_4=A_1+A_2+A_3+A_4$
- $B_5=A_5$
- $B_6=A_5+A_6$
- $B_7=A_7$
- $B_8=A_1+A_2+A_3+A_4+A_5+A_6+A_7+A_8$
- ..
可以看出,$B_i=A_{i-2^k+1}+A_{i-2^k+2}+\dots+A_i$,其中$k$为$i$在二进制下末尾$0$的的个数。换句话说,$2^k$就是$i$在二进制中的的lowbit。
关于lowbit函数
$\to~$lowbit的定义:
- $\mathrm{lowbit}(0)$ 无意义。
- 对于任意$x > 0$,$\mathrm{lowbit}(x)=2^k$,其中$k$为$x$在二进制下末尾$0$的的个数。
$\to~$举例:$\mathrm{lowbit}(10010)=10$;$\mathrm{lowbit}(10000)=10000$
$\to~$C/C++实现:
1
2
3
|
inline int lowbit(int x) {
return x & -x;
}
|
或宏定义形式:
1
|
#define lowbit(x) (x) & -(x)
|
根据lowbit函数,上述公式可以写作:
$$
l:=i-\mathrm{lowbit}(i)+1\\
r:=i\\
B_i=\sum_{j=l}^{r} A_j
$$按照这样,就可以在$\mathcal O(\log n)$的时间复杂度内求$[0,x]$中整数之和(prefixSum(x))或将$A_x$加上$k$(update(x, k))。
对于$[L,R]$的区间之和,可以按照segmentSum(l, r) = prefixSum(r) - prefixSum(l - 1)的方式进行计算。详见代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
|
#include <cstdio>
using namespace std;
template <typename value_type>
class fenwick_tree {
private:
const int n;
value_type* a;
inline int lowbit(int x) { return x & -x; }
public:
inline fenwick_tree(int m): n(m) {
a = new value_type[n + 1];
for(int i=0; i<=n; i++)
a[i] = 0;
}
inline ~fenwick_tree() { delete[] a; }
inline value_type prefixSum(int i) {
value_type res = 0;
for(; i; i-=lowbit(i)) res += a[i];
return res;
}
inline value_type segmentSum(int l, int r) {
return prefixSum(r) - prefixSum(l - 1);
}
inline void update(int i, const value_type& d) {
for(; i<=n; i+=lowbit(i))
a[i] += d;
}
};
int main()
{
int n, m;
scanf("%d%d", &n, &m);
fenwick_tree<int> bit(n);
for(int i=1; i<=n; i++)
{
int a;
scanf("%d", &a);
bit.update(i, a);
}
while(m--)
{
int op, x, y;
scanf("%d%d%d", &op, &x, &y);
if(op == 1) bit.update(x, y);
else printf("%d\n", bit.segmentSum(x, y));
}
return 0;
}
|
在洛谷 P3374上提交耗时仅$572\mathrm{ms}$,同题用同样为$\mathcal O(\log N)$的线段树耗时约$2.5\mathrm{s}$,可见相比于线段树算法,使用树状数组不仅代码量小、容易实现,还有运行速度快等等优势。
基础算法到此为止,下面来看一些经典的扩展应用。
扩展应用
知识补充:离散化
对于序列$A=(A_1,A_2,\dots,A_N)$,我们将$A$中的每个数都按原先的映射到一个$[1,N]$的范围内,这个过程被称为离散化。一般来说,离散化时同样的元素映射到同样的值,不同的元素映射到不同的值,且满足原先的大小关系。换句话说,令原先的序列为$(A_1,\dots,A_N)$,离散化后的序列为$(B_1,\dots,B_N)$,则满足如下条件:
- $1\le B_i\le N$($1\le i\le N$)
- 若$i \ne j$,且$A_i < A_j$,则$B_i < B_j$。
- 若$i \ne j$,且$A_i = A_j$,则$B_i = B_j$。
- 若$i \ne j$,且$A_i > A_j$,则$B_i > B_j$。
求逆序对
逆序对问题是经典的序列问题。众所周知,这类问题可以用归并排序在$\mathcal O(N\log N)$的时间内解决。不过,既然今天讲的是树状数组,那就不能用归并排序,就主要来说一说树状数组的解法。
洛谷 P1908 逆序对
给定一个整数序列$A=(A_1,A_2,\dots,A_N)$,求其中逆序对的个数。
一个整数对$(i,j)$被称为“逆序对”,当且仅当如下条件满足:
$\to 1\le i < j\le N$
$\to A_i > A_j$
数据范围:$N\le 10^5,A_i\le 10^9$。
由于$N\le 10^5$,所以暴力的$\mathcal O(N^2)$做法肯定不行。
我们考虑使用树状数组,先将数组离散化成$[1,N]$之间的数,记离散化后的序列为$B=(B_1,\dots,B_N)$。我们按$($总数对数量$)-($非逆序对数量$)=($逆序对数量$)$的公式计算,其中总数对的数量为$1+2+\dots+N-1=\frac {N(N-1)}2$。用树状数组维护每个数字的出现次数,则非逆序对的数量可以在遍历$B$中的每个元素时动态计算。详见代码。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
|
#include <cstdio>
#include <algorithm>
#define maxn 500005
using namespace std;
inline int read() {
static char c;
while((c = getchar()) < '0' && c > '9');
int res = c ^ 48;
while((c = getchar()) >= '0' && c <= '9')
res = (res << 3) + (res << 1) + (c ^ 48);
return res;
}
template <typename value_type>
class fenwick_tree {
private:
const int n;
value_type* a;
inline int lowbit(int x) { return x & -x; }
public:
inline fenwick_tree(int m): n(m) {
a = new value_type[n + 1];
for(int i=0; i<=n; i++)
a[i] = 0;
}
inline ~fenwick_tree() { delete[] a; }
inline value_type prefixSum(int i) {
value_type res = 0;
for(++i; i; i-=lowbit(i)) res += a[i];
return res;
}
inline void update(int i, const value_type& d) {
for(++i; i<=n; i+=lowbit(i))
a[i] += d;
}
};
int a[maxn], rk[maxn];
int main()
{
int n = read();
for(int i=0; i<n; i++)
a[rk[i] = i] = read();
stable_sort(rk, rk + n, [&](int x, int y) -> bool {
return a[x] < a[y];
}); // 因为可能会有重复的数字,所以必须使用稳定的stable_sort排序,用sort只有40分
fenwick_tree<int> bit(n); // 初始化树状数组,离散化之后大小为n就行
long long ans = n * (n - 1LL) >> 1LL; // 总数对个数
for(int i=0; i<n; i++)
{
ans -= bit.prefixSum(rk[i]); // 减去非逆序数对,即prefixSum(b[i])
bit.update(rk[i], 1); // 动态更新当前元素出现次数
}
printf("%lld\n", ans);
return 0;
}
|
习题:CF1676H2 Maximum Crossings (Hard Version)
区间更新
用过线段树的都知道,树状数组最大的缺点就是无法直接实现区间更新。不过,在一些特殊情况下,我们可以通过差分+离散化来间接实现区间的更新。先来看洛谷上的模板:
P3368【模板】树状数组 2
已知一个长为$N$的数列,你需要进行下面两种操作:
1 x y k:将$[x,y]$区间内的每个数都加上$k$。
2 x:求第$x$个数的值。
运用差分的思想,用树状数组维护$A$的差分数组$B$($B_i=A_i-A_{i-1}$)。
此时,我们可以把“区间$[x,y]$中所有元素都加上$k$”看作:
- $B_x:=B_x+k$
- $B_{y+1}:=B_{y+1}-k$
此时,$A_x=B_1+\dots+B_x$,正好是树状数组的前缀和操作。
于是,我们在$\mathcal O(N\log N)$的时间复杂度内解决了这个问题。
C++实现如下(此实现方式与前面讲的略有不同):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
|
#include <cstdio>
#define maxn 500005
using namespace std;
template <typename value_type>
class fenwick_tree {
private:
const int n;
value_type* a;
inline int lowbit(int x) { return x & -x; }
public:
inline fenwick_tree(int m): n(m) {
a = new value_type[n + 1];
for(int i=0; i<=n; i++)
a[i] = 0;
}
inline ~fenwick_tree() { delete[] a; }
inline value_type prefixSum(int i) {
value_type res = 0;
for(; i; i-=lowbit(i)) res += a[i];
return res;
}
inline void update(int i, const value_type& d) {
for(; i<=n; i+=lowbit(i))
a[i] += d;
}
};
int a[maxn];
int main()
{
int n, m;
scanf("%d%d", &n, &m);
for(int i=1; i<=n; i++)
scanf("%d", a + i);
fenwick_tree<int> bit(n);
while(m--)
{
int op;
scanf("%d", &op);
if(op == 1)
{
int l, r, k;
scanf("%d%d%d", &l, &r, &k);
bit.update(l, k);
if(r < n) bit.update(r + 1, -k);
}
else
{
int x;
scanf("%d", &x);
printf("%d\n", a[x] + bit.prefixSum(x));
}
}
return 0;
}
|
习题
总结
树状数组支持更新、求和两种操作。欢迎大家前来提问或补充~
求三连qwq