GoodCoder666的个人博客

【算法笔记】树状数组/Binary Indexed Tree/Fenwick Tree

2022-08-20 · 13 min read
算法笔记 算法竞赛

前言

树状数组,即树形存储的数组,又称Binary Indexed TreeFenwick Tree
抛开它树形的存储结构,这种神奇的数据结构的应用看起来与「 树」没什么关系:

有一个序列A=(A1,A2,,AN)A=(A_1,A_2,\dots,A_N),在不超过O(logN)\mathcal O(\log N)的时间复杂度内完成下列操作:
 \to~[L,R][L,R]区间内所有数之和。
 \to~指定一个元素AxA_x,将其加上kk

如果想要使求和操作尽可能快,很容易想到前缀和,这样求和操作只要O(1)\mathcal O(1)的时间,但更新操作的时间复杂度就升至O(N)\mathcal O(N),无法满足题目要求;反之,若直接暴力维护AA中所有元素的值,则虽然更新操作只需要O(1)\mathcal O(1),但求和操作的时间又变成了O(N)\mathcal O(N),还是满足不了要求。那有没有一种算法,综合了两种方式的优势,达到题目时间要求呢?

肯定有,那就是今天说的——树状数组。

基本算法

洛谷 P3374【模板】树状数组 1
同“前言”中的部分,1n,m1051\le n,m\le 10^5,其中mm为操作总次数。

由于n,m105n,m\le 10^5,所以O(nm)\mathcal O(nm)的暴力解法肯定行不通,需要使用O(MlogN)\mathcal O(M\log N)的树状数组。其存储结构大致上是这样的:
树状数组结构

是不是已经有些明白了?这里我们我们把BB当作树状数组的内部存储,则据图可知:

  • B1=A1B_1=A_1
  • B2=A1+A2B_2=A_1+A_2
  • B3=A3B_3=A_3
  • B4=A1+A2+A3+A4B_4=A_1+A_2+A_3+A_4
  • B5=A5B_5=A_5
  • B6=A5+A6B_6=A_5+A_6
  • B7=A7B_7=A_7
  • B8=A1+A2+A3+A4+A5+A6+A7+A8B_8=A_1+A_2+A_3+A_4+A_5+A_6+A_7+A_8
  • ..

可以看出,Bi=Ai2k+1+Ai2k+2++AiB_i=A_{i-2^k+1}+A_{i-2^k+2}+\dots+A_i,其中kkii在二进制下末尾00的的个数。换句话说,2k2^k就是ii在二进制中的的lowbit

关于lowbit函数
 \to~lowbit的定义:

  • lowbit(0)\mathrm{lowbit}(0) 无意义。
  • 对于任意x>0x > 0lowbit(x)=2k\mathrm{lowbit}(x)=2^k,其中kkxx在二进制下末尾00的的个数。

 \to~举例:lowbit(10010)=10\mathrm{lowbit}(10010)=10lowbit(10000)=10000\mathrm{lowbit}(10000)=10000
 \to~C/C++实现:

inline int lowbit(int x) {
    return x & -x;
}

或宏定义形式:

#define lowbit(x) (x) & -(x)

根据lowbit函数,上述公式可以写作:

l:=ilowbit(i)+1r:=iBi=j=lrAjl:=i-\mathrm{lowbit}(i)+1\\ r:=i\\ B_i=\sum_{j=l}^{r} A_j

按照这样,就可以在O(logn)\mathcal O(\log n)的时间复杂度内求[0,x][0,x]中整数之和(prefixSum(x))或将AxA_x加上kkupdate(x, k))。
对于[L,R][L,R]的区间之和,可以按照segmentSum(l, r) = prefixSum(r) - prefixSum(l - 1)的方式进行计算。详见代码:

#include <cstdio>
using namespace std;

template <typename value_type>
class fenwick_tree {
private:
	const int n;
	value_type* a;
	inline int lowbit(int x) { return x & -x; }
public:
	inline fenwick_tree(int m): n(m) {
		a = new value_type[n + 1];
		for(int i=0; i<=n; i++)
			a[i] = 0;
	}
	inline ~fenwick_tree() { delete[] a; }
	inline value_type prefixSum(int i) {
		value_type res = 0;
		for(; i; i-=lowbit(i)) res += a[i];
		return res;
	}
	inline value_type segmentSum(int l, int r) {
		return prefixSum(r) - prefixSum(l - 1);
	}
	inline void update(int i, const value_type& d) {
		for(; i<=n; i+=lowbit(i))
			a[i] += d;
	}
};

int main()
{
	int n, m;
	scanf("%d%d", &n, &m);
	fenwick_tree<int> bit(n);
	for(int i=1; i<=n; i++)
	{
		int a;
		scanf("%d", &a);
		bit.update(i, a);
	}
	while(m--)
	{
		int op, x, y;
		scanf("%d%d%d", &op, &x, &y);
		if(op == 1) bit.update(x, y);
		else printf("%d\n", bit.segmentSum(x, y));
	}
	return 0;
}

洛谷 P3374上提交耗时仅572ms572\mathrm{ms},同题用同样为O(logN)\mathcal O(\log N)线段树耗时约2.5s2.5\mathrm{s},可见相比于线段树算法,使用树状数组不仅代码量小、容易实现,还有运行速度快等等优势。

基础算法到此为止,下面来看一些经典的扩展应用。

扩展应用

知识补充:离散化
对于序列A=(A1,A2,,AN)A=(A_1,A_2,\dots,A_N),我们将AA中的每个数都按原先的映射到一个[1,N][1,N]的范围内,这个过程被称为离散化。一般来说,离散化时同样的元素映射到同样的值,不同的元素映射到不同的值,且满足原先的大小关系。换句话说,令原先的序列为(A1,,AN)(A_1,\dots,A_N),离散化后的序列为(B1,,BN)(B_1,\dots,B_N),则满足如下条件:

  • 1BiN1\le B_i\le N1iN1\le i\le N
  • iji \ne j,且Ai<AjA_i<A_j,则Bi<BjB_i<B_j
  • iji \ne j,且Ai=AjA_i=A_j,则Bi=BjB_i=B_j
  • iji \ne j,且Ai>AjA_i>A_j,则Bi>BjB_i>B_j

1. 求逆序对

逆序对问题是经典的序列问题。众所周知,这类问题可以用归并排序在O(NlogN)\mathcal O(N\log N)的时间内解决。不过,既然今天讲的是树状数组,那就不能用归并排序,就主要来说一说树状数组的解法。

洛谷 P1908 逆序对
给定一个整数序列A=(A1,A2,,AN)A=(A_1,A_2,\dots,A_N),求其中逆序对的个数。
一个整数对(i,j)(i,j)被称为“逆序对”,当且仅当如下条件满足:
1i<jN\to1\le i<j\le N
Ai>Aj\to A_i>A_j
数据范围:N105,Ai109N\le 10^5,A_i\le 10^9

由于N105N\le 10^5,所以暴力的O(N2)\mathcal O(N^2)做法肯定不行。
我们考虑使用树状数组,先将数组离散化成[1,N][1,N]之间的数,记离散化后的序列为B=(B1,,BN)B=(B_1,\dots,B_N)。我们按((总数对数量)()-(非逆序对数量)=()=(逆序对数量))的公式计算,其中总数对的数量为1+2++N1=N(N1)21+2+\dots+N-1=\frac {N(N-1)}2用树状数组维护每个数字的出现次数,则非逆序对的数量可以在遍历BB中的每个元素时动态计算。详见代码。

#include <cstdio>
#include <algorithm>
#define maxn 500005
using namespace std;

inline int read() {
	static char c;
	while((c = getchar()) < '0' && c > '9');
	int res = c ^ 48;
	while((c = getchar()) >= '0' && c <= '9')
		res = (res << 3) + (res << 1) + (c ^ 48);
	return res;
}

template <typename value_type>
class fenwick_tree {
private:
	const int n;
	value_type* a;
	inline int lowbit(int x) { return x & -x; }
public:
	inline fenwick_tree(int m): n(m) {
		a = new value_type[n + 1];
		for(int i=0; i<=n; i++)
			a[i] = 0;
	}
	inline ~fenwick_tree() { delete[] a; }
	inline value_type prefixSum(int i) {
		value_type res = 0;
		for(++i; i; i-=lowbit(i)) res += a[i];
		return res;
	}
	inline void update(int i, const value_type& d) {
		for(++i; i<=n; i+=lowbit(i))
			a[i] += d;
	}
};

int a[maxn], rk[maxn];

int main()
{
	int n = read();
	for(int i=0; i<n; i++)
		a[rk[i] = i] = read();
	stable_sort(rk, rk + n, [&](int x, int y) -> bool {
		return a[x] < a[y];
	}); // 因为可能会有重复的数字,所以必须使用稳定的stable_sort排序,用sort只有40分
	fenwick_tree<int> bit(n); // 初始化树状数组,离散化之后大小为n就行
	long long ans = n * (n - 1LL) >> 1LL; // 总数对个数
	for(int i=0; i<n; i++)
	{
		ans -= bit.prefixSum(rk[i]); // 减去非逆序数对,即prefixSum(b[i])
		bit.update(rk[i], 1); // 动态更新当前元素出现次数
	}
	printf("%lld\n", ans);
	return 0;
}

习题:CF1676H2 Maximum Crossings (Hard Version)

2. 区间更新

用过线段树的都知道,树状数组最大的缺点就是无法直接实现区间更新。不过,在一些特殊情况[1]下,我们可以通过差分+离散化间接实现区间的更新。先来看洛谷上的模板:

P3368【模板】树状数组 2
已知一个长为NN的数列,你需要进行下面两种操作:

  • 1 x y k:将[x,y][x,y]区间内的每个数都加上kk
  • 2 x:求第xx个数的值。

运用差分的思想,用树状数组维护AA的差分数组BBBi=AiAi1B_i=A_i-A_{i-1})。
此时,我们可以把“区间[x,y][x,y]中所有元素都加上kk”看作:

  • Bx:=Bx+kB_x:=B_x+k
  • By+1:=By+1kB_{y+1}:=B_{y+1}-k

此时,Ax=B1++BxA_x=B_1+\dots+B_x,正好是树状数组的前缀和操作。
于是,我们在O(NlogN)\mathcal O(N\log N)的时间复杂度内解决了这个问题。

C++实现如下(此实现方式与前面讲的略有不同):

#include <cstdio>
#define maxn 500005
using namespace std;

template <typename value_type>
class fenwick_tree {
private:
	const int n;
	value_type* a;
	inline int lowbit(int x) { return x & -x; }
public:
	inline fenwick_tree(int m): n(m) {
		a = new value_type[n + 1];
		for(int i=0; i<=n; i++)
			a[i] = 0;
	}
	inline ~fenwick_tree() { delete[] a; }
	inline value_type prefixSum(int i) {
		value_type res = 0;
		for(; i; i-=lowbit(i)) res += a[i];
		return res;
	}
	inline void update(int i, const value_type& d) {
		for(; i<=n; i+=lowbit(i))
			a[i] += d;
	}
};

int a[maxn];

int main()
{
	int n, m;
	scanf("%d%d", &n, &m);
	for(int i=1; i<=n; i++)
		scanf("%d", a + i);
	fenwick_tree<int> bit(n);
	while(m--)
	{
		int op;
		scanf("%d", &op);
		if(op == 1)
		{
			int l, r, k;
			scanf("%d%d%d", &l, &r, &k);
			bit.update(l, k);
			if(r < n) bit.update(r + 1, -k);
		}
		else
		{
			int x;
			scanf("%d", &x);
			printf("%d\n", a[x] + bit.prefixSum(x));
		}
	}
	return 0;
}

习题

总结

树状数组支持更新、求和两种操作。欢迎大家前来提问或补充~
求三连qwq


  1. 实际上所有情况都可以,不过其他的非特殊情况实现起来非常繁琐,有时还不如直接用线段树来得方便,因此这里忽略这种情况。 ↩︎