GoodCoder666的个人博客

【算法笔记】位运算详解

2022-10-18 · 20 min read
算法笔记 算法竞赛

0. 前言

突然想到位运算是个好东西,就来水一波文章了……

注意:我把能想到的有关位运算的所有内容都放进来了,所以篇幅较长,请谅解!若有写的不清楚或者不够详细的地方欢迎在评论区补充,谢谢支持!

本文中参考代码均使用C++编写。

废话不多说,下面步入正题。


1. 基本运算

有一定基础的可以跳过该部分。

位运算的简要法则:
位运算法则-简要

详细解释:

1.1 取反

取反(~x)是最简单的位运算操作,只有一个参数xx。将参数上的每一位对应取反即可。例如:
~0011 = 1100
~1011 = 0100
性质:~(~x) = x

1.2 按位与

按位与(x & y)有两个参数xxyy。对于xxyy中的每个对应位,参照下表输出到结果的对应位:

xx yy x & y
00 00 00
00 11 00
11 00 00
11 11 11

例子:
0011 & 1100 = 0000
1010 & 1011 = 1010

性质:

  • 交换律:a & b = b & a
  • 结合律:a & b & c = a & (b & c)
  • 自与:a & a = a
  • 000 & a1 & a2 & a3 & ... = 0
  • \infty(全11):a & inf = a

1.3 按位或

按位与(x | y)有两个参数xxyy。对于xxyy中的每个对应位,参照下表输出到结果的对应位:

xx yy x | y
00 00 00
00 11 11
11 00 11
11 11 11

例子:
1100 | 0011 = 1111
1010 | 0001 = 1011

性质:

  • 交换律:a | b = b | a
  • 结合律:a | b | c = a | (b | c)
  • 自或:a | a = a
  • 00a | 0 = a
  • \infty(全11):a | inf = inf

1.4 异或

异或(xyx\oplus yx ^ y)有两个参数xxyy。对于xxyy中的每个对应位,参照下表输出到结果的对应位:

xx yy xyx\oplus y
00 00 00
00 11 11
11 00 11
11 11 00

举例:
1000 ^ 1011 = 0011
0101 ^ 1010 = 1111

性质:

  • 交换律:ab=baa\oplus b=b\oplus a
  • 结合律:abc=a(bc)a\oplus b\oplus c=a\oplus(b\oplus c)
  • 自异或:aa=0a\oplus a=0
  • 异或00a0=aa\oplus 0=a
  • 多重异或:abb=a(bb)=a0=aa\oplus b\oplus b=a\oplus (b\oplus b)=a\oplus 0=a
  • 异或\infty(全11):a= a\oplus \infty=~~a
  • ab=ca\oplus b=c,则ac=ba\oplus c=b

1.5 位移

位移分为左移(<<)和右移(>>)。

  • a << b:将aa末尾添上bb00的结果。
  • a >> b:从aa末尾删掉bb位的结果。

性质:

  • (a << b) >> b = a
  • a << b =a×2b~=a\times 2^b
  • a >> b =a2b~=\lfloor\frac a {2^b}\rfloor

1.6 练习题

1.6.1 判断22的整数次幂

题意:给定整数NN,判断其是否为22的整数次幂。

1.6.2 洛谷 P1100 高低位交换

题意:给定一个3232位整数xx,在二进制下交换其前1616位与后1616位,输出最终的数。

答案为ans = (x >> 16) | (x << 16),这样解释:

数值 1616 1616
xx AA BB
x >> 16 161600 AA
x << 16 BB 161600
ans BB AA

注意此处使用3232位无符号整数进行计算,这样x << 16会自然溢出,导致前1616位被丢弃,恰好满足要求。

参考程序:

#include <cstdio>
using namespace std;

int main()
{
	unsigned int x;
	scanf("%u", &x);
	printf("%u\n", (x >> 16) | (x << 16));
	return 0;
}

1.6.3 找出不同的数

给定一个序列A=(A1,A2,,A2N+1)A=(A_1,A_2,\dots,A_{2N+1}),其中有NN个数各出现22次,还有一个数正好出现11次。找到这个数。请尽可能优化程序的时间和空间复杂度。

- 时间O(N)\mathcal O(N)O(NlogN)\mathcal O(N\log N),空间O(N)\mathcal O(N)解法
简单统计每个数的出现次数,最后找到正好出现11次的数。

- 时间O(N)\mathcal O(N),空间O(1)\mathcal O(1)解法
考虑所有数的异或和S=A1A2A2N+1S=A_1\oplus A_2\oplus\dots\oplus A_{2N+1},则AA中所有出现两次的数抵消为00,剩下的即为唯一出现一次的数,所以直接输出SS即可。

参考程序:

#include <cstdio>
using namespace std;

int main()
{
	int n;
	scanf("%d", &n);
	n = (n << 1) + 1;
	int ans = 0;
	while(n--)
	{
		int x;
		scanf("%d", &x);
		ans ^= x;
	}
	printf("%d\n", ans);
	return 0;
}

1.6.4 AtCoder Beginner Contest 261 E - Many Operations

解法:对于i=1,2,,Ni=1,2,\dots,N,记录操作1,2,,i1,2,\dots,i后每一位上的0011分别变成什么,可以在O(N)\mathcal O(N)的时间内用类似于前缀和的方法完成;最后用位运算快速模拟NN次连续操作即可,总时间复杂度为O(N)\mathcal O(N)

// https://atcoder.jp/contests/abc261/submissions/33495431
#include <cstdio>
using namespace std;

int main()
{
	unsigned n, c, zero = 0, one = 0xffffffff;
	scanf("%d%d", &n, &c);
	while(n--)
	{
		int t, a;
		scanf("%d%d", &t, &a);
		if(t == 1) one &= a, zero &= a;
		else if(t == 2) one |= a, zero |= a;
		else one ^= a, zero ^= a;
		printf("%d\n", c = (c & one) | (~c & zero));
	}
	return 0;
}

2. 扩展概念&运算

2.1 lowbit

lowbit(x)即为二进制下xx的最低位,如lowbit(10010) = 10lowbit(1) = 1。严格来说00没有lowbit,部分情况下可视为lowbit(0) = 1。利用lowbit函数可实现树状数组等数据结构。

lowbit 计算方式

  1. 暴力计算
    简单粗暴的按位直接计算,如下:
    int lowbit(int x)
    {
    	int res = 1;
    	while(x && !(x & 1))
    		x >>= 1, res <<= 1;
    	return res;
    }
    
    时间复杂度O(logX)\mathcal O(\log X)。缺点:速度慢,代码长,没有体现位运算的优势
  2. x & -x
    巧妙利用lowbit(x) = x & -x。感兴趣的读者可自行尝试证明。
    时间复杂度O(1)\mathcal O(1)。相比(1)来说,代码更短,速度更快。
  3. x & (x - 1)
    注意:x & (x - 1)不是lowbit(x),而是x - lowbit(x)
    这种方法常用于树状数组中,可提升x - lowbit(x)的计算速度。

2.2 popcount

popcount(x)定义为xx在二进制下11的个数,如popcount(10101) = 3popcount(0) = 0

popcount 计算方式

  1. 暴力计算检查
    还是最粗暴的算法,通过枚举每一位并检查是否为11达到目的,时间复杂度为O(logX)\mathcal O(\log X)
    int popcount(int x)
    {
    	int res = 0;
    	while(x)
    	{
    		res += x & 1;
    		x >>= 1;
    	}
    	return res;
    }
    
  2. lowbit 优化
    时间复杂度还是O(logX)\mathcal O(\log X),不过平均用时会比(1)快2~3倍左右。
    int popcount(int x)
    {
    	int res = 0;
    	for(; x; x&=x-1) res ++;
    	return res;
    }
    
  3. builtin 函数(最快)
    详见3.1 __builtin_popcount/__builtin_popcountll

3. builtin 位运算函数

注意:后面带ll的传入long long类型,不带ll接受int类型。本部分内容按常用程度递减排序。
参考:https://blog.csdn.net/zeekliu/article/details/124848210

3.1 __builtin_popcount/__builtin_popcountll

返回参数在二进制下11的个数。

3.2 __builtin_ctz / __buitlin_ctzll

返回参数在二进制下末尾00的个数。

3.3 __buitlin_clz / __buitlin_clzll

返回参数在二进制下前导00的个数。

3.4 __builtin_ffs / __buitlin_ffsll

返回参数在二进制下最后一个1在第几位(从后往前)。
注意:一般来说,builtin_ffs(x) = __builtin_ctz(x) + 1。当x=0x=0时,builtin_ffs(x) = 0

3.5 __builtin_parity / __builtin_parityll

返回参数在二进制下11的个数的奇偶性(偶:0,奇:1),即__builtin_parity(x) = __builtin_popcount(x) % 2
P.S. 这函数,不知是哪位神仙想出来的……


4. 位运算的应用

4.1 子集表示法

对于集合{0,1,,N1}\{0,1,\dots,N-1\},我们使用一个NN位的二进制整数SS来表示它的一个子集。从右往左第ii位表示子集是否包含了ii。容易发现,对于任意子集SSS[0,2N1]S\in [0,2^N-1],且对于任意S[0,2N1]S\in [0,2^N-1]SS都是{0,1,,N1}\{0,1,\dots,N-1\}的一个有效子集。下面我们来讲这种子集表示的具体操作。

4.1.1 子集操作

子集的操作如下(规定NN为集合元素个数):

  • 空集:00
  • 满集:2N12^N-1NN11
  • 集合SS的元素个数:__builtin_popcount(S)__builtin_popcountll(S)
  • 集合SS是否包含iiS >> i & 1
  • ii加入SS(操作前SS是否包含ii不影响操作结果):S |= 1 << i
  • iiSS中删除(操作前SS必须包含ii):S ^= 1 << i
  • iiSS中删除(操作前SS是否包含ii不影响操作结果):S &= ~(1 << i)
  • SSTT的交集(SSTT都包含的集合):S & T
  • SSTT的并集(SSTT中有任意一个包含的集合):S | T
  • SSTT的差集(SSTT中恰好有一个包含的集合):S ^ T

4.1.2 子集枚举

讲了这么多,也该到子集的实际应用了吧。下面我们来看子集最初步的应用——子集枚举。

- 必会:枚举NN个元素的所有子集
这个很简单,直接枚举S[0,2N1]S\in [0,2^N-1]即可。代码如下:

#include <cstdio>
using namespace std;

const int N = 3;

int main()
{
	printf("N = %d\n", N);
	for(int s=0, full=(1<<N)-1; s<=full; s++)
	{
		printf("Subset %d:", s + 1);
		for(int i=0; i<N; i++)
			if(s >> i & 1)
				printf(" %d", i);
		putchar('\n');
	}
	return 0;
}

- 必会:枚举子集的子集
如果我们想枚举{0,1,,N1}\{0,1,\dots,N-1\}的子集的子集,怎么办?这是一个经典套路,常用于状压DP,写法如下:

for(int S=0; S<(1<<N); S++) // 枚举子集S
	for(int T=S; T; T=(T-1)&S) // 枚举子集的子集T
	{
		// Do something...
		printf("%d\n", t);
	}

请注意:这个算法的时间复杂度为O(3N)\mathcal O(3^N),不是O(4N)\mathcal O(4^N),使用此算法时请准确估算时间复杂度。

- 扩展:枚举NN个元素中大小为KK的子集
首先很容易想到先枚举所有{0,1,,N1}\{0,1,\dots,N-1\}的所有子集,再依次检查大小是否为KK。代码如下:

for(int s=0; s<(1<<n); s++)
{
	int cnt = __builtin_popcount(s);
	if(cnt != K) continue;
	// Do something...
}

这种做法虽然正确,也很易懂,但可惜效率太低,2N2^Npopcount操作浪费了很多时间。我们考虑优化。《挑战程序设计竞赛》上给出了一种算法,如下:

int S = (1 << k) - 1;
while(S < 1 << n)
{
	// Do something...
	printf("%d\n", S);
	// 移到下一个合法子集
	int x = S & -S, y = S + x;
	S = ((S & ~y) / x >> 1) | y;
}

这样可保证每次枚举到的都是大小为KK的子集,可以大大提高算法效率。

4.1.3 扩展:std::bitset

bitset,顾名思义,即为用位运算操作的集合。
对于元素个数N[1,64]N\in [1,64],集合{0,1,,N1}\{0,1,\dots,N-1\}的任意子集都可以用一个32326464位整数表示出来,操作时间复杂度为O(1)\mathcal O(1)。那么对于N>64N>64,怎么办?我们可以用多个32326464位无符号整数拼凑为一个NN位的bitset,容易发现其操作的时间复杂度为O(Nw)\mathcal O(\frac Nw)NN位的二进制数可用Nw\lceil\frac Nw\rceilww位无符号整数拼凑而成),其中ww一般为32326464

C++的Standard Template LibrarySTL)为我们提供了<bitset>头文件,用于bitset的定义。

用法如下:
bitset

用法示例:

#include <cstdio>
#include <bitset> // 头文件
using namespace std;

int main()
{
	const int N = 500;
	bitset<N> S; // 定义大小为N的bitset S,初始为全0
	S.set(1);    // 将S的第1位设为1
	S[0] = 1;    // 将S的第0位设为1,注意bitset可使用下标访问和赋值
	S.reset(1);  // 将S的第1位设为0
	printf("S[1]: %d\n", (int)S[1]); // 输出S第2位上的值
	printf("Count: %d\n", (int)S.count()); // S的popcount(二进制下1的个数)
	printf("Size: %d\n", (int)S.size()); // S的二进制位数(N)
	printf("None? %d\n", (int)S.none()); // S是否为空?
	printf("Any?  %d\n", (int)S.any());  // S是否有1?
	bitset<N> T; // 定义一个新的bitset -- T
	T.set(); // T置为全1
	S.set(2), T.reset(2);
	printf("Intersection: %d\n", (int)(S & T).count()); // 交集
	printf("Union: %d\n", (int)(S | T).count()); // 并集
	printf("Difference: %d\n", (int)(S ^ T).count()); // 差集
	return 0;
}
习题:AtCoder Beginner Contest 258 G - Triangle

题意和解法见https://blog.csdn.net/write_1m_lines/article/details/125582361#t15

4.2 深度优先搜索(DFS)的位运算优化

本算法其实还是二进制表示子集的一种优化,不过内容较多,所以单独放了出来。

考虑经典的八皇后问题

有一个8×88\times 8的国际象棋棋盘,要在其中摆88个皇后,求有多少种不同的摆法,使得任意两个皇后之间都没有互相攻击。
注:皇后的攻击范围是一个“米”字,如下图所示:
皇后攻击范围

八皇后问题很容易求解,用一个简单的回溯就可以了。
考虑NN皇后问题,即:

有一个N×NN\times N的国际象棋棋盘,要在其中摆NN个皇后,求有多少种不同的摆法,使得任意两个皇后之间都没有互相攻击。

此时,还是先用标准的「回溯」算法解决问题:

#include <cstdio>
#define maxn 20
using namespace std;

bool row[maxn], diag_left[maxn << 1], diag_right[maxn << 1];
int ans, n;

void dfs(int i)
{
	if(i == n)
	{
		ans ++;
		return;
	}
	for(int j=0; j<n; j++)
		if(!row[j] && !diag_left[i + j] && !diag_right[i - j + n])
		{
			row[j] = diag_left[i + j] = diag_right[i - j + n] = true;
			dfs(i + 1);
			row[j] = diag_left[i + j] = diag_right[i - j + n] = false;
		}
}

int main()
{
	scanf("%d", &n);
	ans = 0;
	dfs(0);
	printf("%d\n", ans);
	return 0;
}

代码很移动,也不是重点,这里就不详细解释了。对于N=13N=13,搜索时间约为243ms243\mathrm{ms}N=14N=141.31s1.31\mathrm sN=15N=158.14s8.14\mathrm sN=16N=16…… 53.4s53.4\mathrm s

明显,这样的算法效率太低,我们来考虑使用位运算优化。
首先,我们把上面程序里的rowdiag_leftdiag_right换成一个int整数,赋值、取值全部改用位运算。但这样对整体的时间优化还是不大,我们要充分发挥位运算的优势——“百发百中”,即利用lowbit算法,确保每次枚举到的都是目前一步可放置的位置,减少不必要的判断。此时,我们改变diag_leftdiag_right的含义,使diag_left表示左下-右上的45°45\degree对角线上当前一步可放置的皇后位置集合,diag_right同理。见代码:

#include <cstdio>
using namespace std;

int ans, mx;

void dfs(int row, int diag_left, int diag_right)
{
	if(row == mx)
	{
		ans ++;
		return;
	}
	int a = mx & ~(row | diag_left | diag_right);
	while(a)
	{
		int p = a & -a; a ^= p;
		dfs(row | p, (diag_left | p) >> 1, (diag_right | p) << 1);
	}
}

int main()
{
	int n;
	scanf("%d", &n);
	ans = 0;
	mx = (1 << n) - 1;
	dfs(0, 0, 0);
	printf("%d\n", ans);
	return 0;
}

此时,计算1616皇后只需6.23s6.23\mathrm s
习题:洛谷 P1092 [NOIP2004 提高组] 虫食算

附:N皇后问题的两种解法耗时对比

本测试中,两种算法耗时均为在Intel i7-12700H CPU上55次程序运行的最快速度。

NN 无优化 位运算优化 速度提升
1313 253ms253\mathrm{ms} 66ms66\mathrm{ms} 2.83x2.83\text x
1414 1.31s1.31\mathrm s 179ms179\mathrm{ms} 6.32x6.32\text x
1515 8.14s8.14\mathrm s 955ms955\mathrm{ms} 7.52x7.52\text x
1616 53.4s53.4\mathrm s 6.23s6.23\mathrm s 7.57x7.57\text x

4.3 其他应用

4.3.1 两数交换

void swap(int& a, int& b)
{
	a ^= b ^= a ^= b;
}

位运算交换法扩展:超快GCD

inline int gcd(int a, int b)
{
	if(b) while(b ^= a ^= b ^= a %= b);
	return a;
}

4.3.2 两数平均数(防溢出)

inline int average1(int x, int y)
{
	return (x >> 1) + (y >> 1) + (x & y & 1);
}

inline int average2(int x, int y)
{
	return (x & y) + ((x ^ y) >> 1);
}

4.3.3 判断一个数是否为22的整数次幂

inline bool ispowof2(int x)
{
	return x > 0 && !(x & x - 1);
}

5. 总结

本文详细讲解了位运算的使用和扩展。


创作不易,各位如果觉得好的话就请给个三连,感谢大家的支持!