【算法笔记】位运算详解

前言

突然想到位运算是个好东西，就来水一波文章了……

注意：我把能想到的有关位运算的所有内容都放进来了，所以篇幅较长，请谅解！若有写的不清楚或者不够详细的地方欢迎在评论区补充，谢谢支持！

本文中参考代码均使用C++编写。

废话不多说，下面步入正题。

基本运算

有一定基础的可以跳过该部分。

位运算的简要法则：

符号	描述	规则
`&`	按位与	两位都为1才为1，不同为0
`\|`	按位或	两位都为0才为0，不同为1
`^`	异或	相同为0，不同为1
`~`	取反	0变1，1变0
`<<`	左移	二进制位向左移动，高位去掉，低位补0
`>>`	右移	二进制位向右移动，低位去掉，高位补0

详细解释：

取反

取反（~x）是最简单的位运算操作，只有一个参数$x$。将参数上的每一位对应取反即可。例如：
~0011 = 1100
~1011 = 0100
性质：~(~x) = x

按位与

按位与（x & y）有两个参数$x$和$y$。对于$x$和$y$中的每个对应位，参照下表输出到结果的对应位：

$x$	$y$	`x & y`
$0$	$0$	$0$
$0$	$1$	$0$
$1$	$0$	$0$
$1$	$1$	$1$

例子：
0011 & 1100 = 0000
1010 & 1011 = 1010

性质：

交换律：a & b = b & a
结合律：a & b & c = a & (b & c)
自与：a & a = a
与$0$：0 & a1 & a2 & a3 & ... = 0
与$\infty$（全$1$）：a & inf = a

按位或

按位与（x | y）有两个参数$x$和$y$。对于$x$和$y$中的每个对应位，参照下表输出到结果的对应位：

$x$	$y$	`x \| y`
$0$	$0$	$0$
$0$	$1$	$1$
$1$	$0$	$1$
$1$	$1$	$1$

例子：
1100 | 0011 = 1111
1010 | 0001 = 1011

性质：

交换律：a | b = b | a
结合律：a | b | c = a | (b | c)
自或：a | a = a
或$0$：a | 0 = a
或$\infty$（全$1$）：a | inf = inf

异或

异或（$x\oplus y$或x ^ y）有两个参数$x$和$y$。对于$x$和$y$中的每个对应位，参照下表输出到结果的对应位：

$x$	$y$	$x\oplus y$
$0$	$0$	$0$
$0$	$1$	$1$
$1$	$0$	$1$
$1$	$1$	$0$

举例：
1000 ^ 1011 = 0011
0101 ^ 1010 = 1111

性质：

交换律：$a\oplus b=b\oplus a$
结合律：$a\oplus b\oplus c=a\oplus(b\oplus c)$
自异或：$a\oplus a=0$
异或$0$：$a\oplus 0=a$
多重异或：$a\oplus b\oplus b=a\oplus (b\oplus b)=a\oplus 0=a$
异或$\infty$（全$1$）：$a\oplus \infty=~$~a
若$a\oplus b=c$，则$a\oplus c=b$。

位移

位移分为左移（<<）和右移（>>）。

a << b：将$a$末尾添上$b$个$0$的结果。
a >> b：从$a$末尾删掉$b$位的结果。

性质：

(a << b) >> b = a
a << b$~=a\times 2^b$
a >> b$~=\lfloor\frac a {2^b}\rfloor$

练习题

判断$2$的整数次幂

题意：给定整数$N$，判断其是否为$2$的整数次幂。

洛谷 P1100 高低位交换

题意：给定一个$32$位整数$x$，在二进制下交换其前$16$位与后$16$位，输出最终的数。

答案为ans = (x >> 16) | (x << 16)，这样解释：

数值	前$16$位	后$16$位
$x$	$A$	$B$
`x >> 16`	$16$个$0$	$A$
`x << 16`	$B$	$16$个$0$
`ans`	$B$	$A$

注意此处使用$32$位无符号整数进行计算，这样x << 16会自然溢出，导致前$16$位被丢弃，恰好满足要求。

参考程序：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


#include <cstdio>
using namespace std;

int main()
{
    unsigned int x;
    scanf("%u", &x);
    printf("%u\n", (x >> 16) | (x << 16));
    return 0;
}

找出不同的数

给定一个序列$A=(A_1,A_2,\dots,A_{2N+1})$，其中有$N$个数各出现$2$次，还有一个数正好出现$1$次。找到这个数。请尽可能优化程序的时间和空间复杂度。

- 时间$\mathcal O(N)$或$\mathcal O(N\log N)$，空间$\mathcal O(N)$解法
简单统计每个数的出现次数，最后找到正好出现$1$次的数。

- 时间$\mathcal O(N)$，空间$\mathcal O(1)$解法
考虑所有数的异或和$S=A_1\oplus A_2\oplus\dots\oplus A_{2N+1}$，则$A$中所有出现两次的数抵消为$0$，剩下的即为唯一出现一次的数，所以直接输出$S$即可。

参考程序：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18


#include <cstdio>
using namespace std;

int main()
{
    int n;
    scanf("%d", &n);
    n = (n << 1) + 1;
    int ans = 0;
    while(n--)
    {
        int x;
        scanf("%d", &x);
        ans ^= x;
    }
    printf("%d\n", ans);
    return 0;
}

AtCoder Beginner Contest 261 E - Many Operations

解法：对于$i=1,2,\dots,N$，记录操作$1,2,\dots,i$后每一位上的$0$和$1$分别变成什么，可以在$\mathcal O(N)$的时间内用类似于前缀和的方法完成；最后用位运算快速模拟$N$次连续操作即可，总时间复杂度为$\mathcal O(N)$。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19


// https://atcoder.jp/contests/abc261/submissions/33495431
#include <cstdio>
using namespace std;

int main()
{
    unsigned n, c, zero = 0, one = 0xffffffff;
    scanf("%d%d", &n, &c);
    while(n--)
    {
        int t, a;
        scanf("%d%d", &t, &a);
        if(t == 1) one &= a, zero &= a;
        else if(t == 2) one |= a, zero |= a;
        else one ^= a, zero ^= a;
        printf("%d\n", c = (c & one) | (~c & zero));
    }
    return 0;
}

扩展概念&运算

lowbit

lowbit(x)即为二进制下$x$的最低位，如lowbit(10010) = 10、lowbit(1) = 1。严格来说$0$没有lowbit，部分情况下可视为lowbit(0) = 1。利用lowbit函数可实现树状数组等数据结构。

lowbit 计算方式

暴力计算
简单粗暴的按位直接计算，如下：

1
2
3
4
5
6
7


int lowbit(int x)
{
    int res = 1;
    while(x && !(x & 1))
        x >>= 1, res <<= 1;
    return res;
}

时间复杂度$\mathcal O(\log X)$。缺点：速度慢，代码长，没有体现位运算的优势

x & -x
巧妙利用lowbit(x) = x & -x。感兴趣的读者可自行尝试证明。
时间复杂度$\mathcal O(1)$。相比(1)来说，代码更短，速度更快。
x & (x - 1)
注意：x & (x - 1)不是lowbit(x)，而是x - lowbit(x)。
这种方法常用于树状数组中，可提升x - lowbit(x)的计算速度。

popcount

popcount(x)定义为$x$在二进制下$1$的个数，如popcount(10101) = 3，popcount(0) = 0。

popcount 计算方式

暴力计算检查
还是最粗暴的算法，通过枚举每一位并检查是否为$1$达到目的，时间复杂度为$\mathcal O(\log X)$。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


int popcount(int x)
{
    int res = 0;
    while(x)
    {
        res += x & 1;
        x >>= 1;
    }
    return res;
}

lowbit 优化
时间复杂度还是$\mathcal O(\log X)$，不过平均用时会比(1)快2~3倍左右。

1
2
3
4
5
6


int popcount(int x)
{
    int res = 0;
    for(; x; x&=x-1) res ++;
    return res;
}

builtin 函数（最快）
详见3.1 __builtin_popcount/__builtin_popcountll。

builtin 位运算函数

注意：后面带ll的传入long long类型，不带ll接受int类型。本部分内容按常用程度递减排序。
参考：https://blog.csdn.net/zeekliu/article/details/124848210

__builtin_popcount/__builtin_popcountll

返回参数在二进制下$1$的个数。

__builtin_ctz / __buitlin_ctzll

返回参数在二进制下末尾$0$的个数。

__buitlin_clz / __buitlin_clzll

返回参数在二进制下前导$0$的个数。

__builtin_ffs / __buitlin_ffsll

返回参数在二进制下最后一个1在第几位（从后往前）。
注意：一般来说，builtin_ffs(x) = __builtin_ctz(x) + 1。当$x=0$时，builtin_ffs(x) = 0。

__builtin_parity / __builtin_parityll

返回参数在二进制下$1$的个数的奇偶性（偶：0，奇：1），即__builtin_parity(x) = __builtin_popcount(x) % 2。
P.S. 这函数，不知是哪位神仙想出来的……

位运算的应用

子集表示法

对于集合$\{0,1,\dots,N-1\}$，我们使用一个$N$位的二进制整数$S$来表示它的一个子集。从右往左第$i$位表示子集是否包含了$i$。容易发现，对于任意子集$S$，$S\in [0,2^N-1]$，且对于任意$S\in [0,2^N-1]$，$S$都是$\{0,1,\dots,N-1\}$的一个有效子集。下面我们来讲这种子集表示的具体操作。

子集操作

子集的操作如下（规定$N$为集合元素个数）：

空集：$0$
满集：$2^N-1$（$N$个$1$）
集合$S$的元素个数：__builtin_popcount(S)或__builtin_popcountll(S)
集合$S$是否包含$i$：S >> i & 1
将$i$加入$S$（操作前$S$是否包含$i$不影响操作结果）：S |= 1 << i
将$i$从$S$中删除（操作前$S$必须包含$i$）：S ^= 1 << i
将$i$从$S$中删除（操作前$S$是否包含$i$不影响操作结果）：S &= ~(1 << i)
$S$和$T$的交集（$S$和$T$都包含的集合）：S & T
$S$和$T$的并集（$S$和$T$中有任意一个包含的集合）：S | T
$S$和$T$的差集（$S$和$T$中恰好有一个包含的集合）：S ^ T

子集枚举

讲了这么多，也该到子集的实际应用了吧。下面我们来看子集最初步的应用——子集枚举。

- 必会：枚举$N$个元素的所有子集
这个很简单，直接枚举$S\in [0,2^N-1]$即可。代码如下：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18


#include <cstdio>
using namespace std;

const int N = 3;

int main()
{
    printf("N = %d\n", N);
    for(int s=0, full=(1<<N)-1; s<=full; s++)
    {
        printf("Subset %d:", s + 1);
        for(int i=0; i<N; i++)
            if(s >> i & 1)
                printf(" %d", i);
        putchar('\n');
    }
    return 0;
}

- 必会：枚举子集的子集
如果我们想枚举$\{0,1,\dots,N-1\}$的子集的子集，怎么办？这是一个经典套路，常用于状压DP，写法如下：

1
2
3
4
5
6


for(int S=0; S<(1<<N); S++) // 枚举子集S
    for(int T=S; T; T=(T-1)&S) // 枚举子集的子集T
    {
        // Do something...
        printf("%d\n", t);
    }

请注意：这个算法的时间复杂度为$\mathcal O(3^N)$，不是$\mathcal O(4^N)$，使用此算法时请准确估算时间复杂度。

- 扩展：枚举$N$个元素中大小为$K$的子集
首先很容易想到先枚举所有$\{0,1,\dots,N-1\}$的所有子集，再依次检查大小是否为$K$。代码如下：

1
2
3
4
5
6


for(int s=0; s<(1<<n); s++)
{
    int cnt = __builtin_popcount(s);
    if(cnt != K) continue;
    // Do something...
}

这种做法虽然正确，也很易懂，但可惜效率太低，$2^N$次popcount操作浪费了很多时间。我们考虑优化。《挑战程序设计竞赛》上给出了一种算法，如下：

1
2
3
4
5
6
7
8
9


int S = (1 << k) - 1;
while(S < 1 << n)
{
    // Do something...
    printf("%d\n", S);
    // 移到下一个合法子集
    int x = S & -S, y = S + x;
    S = ((S & ~y) / x >> 1) | y;
}

这样可保证每次枚举到的都是大小为$K$的子集，可以大大提高算法效率。

扩展：std::bitset

bitset，顾名思义，即为用位运算操作的集合。
对于元素个数$N\in [1,64]$，集合$\{0,1,\dots,N-1\}$的任意子集都可以用一个$32$或$64$位整数表示出来，操作时间复杂度为$\mathcal O(1)$。那么对于$N > 64$，怎么办？我们可以用多个$32$或$64$位无符号整数拼凑为一个$N$位的bitset，容易发现其操作的时间复杂度为$\mathcal O(\frac Nw)$（$N$位的二进制数可用$\lceil\frac Nw\rceil$个$w$位无符号整数拼凑而成），其中$w$一般为$32$或$64$。

C++的Standard Template Library（STL）为我们提供了<bitset>头文件，用于bitset的定义。

用法如下：

函数/操作	作用
`b.any()`	`b`中是否存在至少1位的二进制位？
`b.none()`	`b`中不存在至少1位的二进制位吗？
`b.count()`	`b`中值为1的二进制位的个数
`b.size()`	`b`中二进制位的个数
`b[pos]`	访问`b`中`pos`处的二进制位
`b.test(pos)`	检测`b`中`pos`处的二进制位是否为1
`b.set(pos)`	把`b`中`pos`处的二进制位设置为1
`b.set()`	把`b`中的所有二进制位设置为1
`b.reset(pos)`	把`b`中`pos`处的二进制位设置为0
`b.reset()`	把`b`中的所有二进制位设置为0
`b.flip()`	把`b`中的所有二进制位按位取反
`b.flip(pos)`	把`b`中`pos`处的二进制位按位取反
`b.to_ulong()`	用`b`中所有的二进制位返回`unsigned long`值
`os << b`	把`b`的值输出到流`os`中

用法示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24


#include <cstdio>
#include <bitset> // 头文件
using namespace std;

int main()
{
    const int N = 500;
    bitset<N> S; // 定义大小为N的bitset S，初始为全0
    S.set(1);    // 将S的第1位设为1
    S[0] = 1;    // 将S的第0位设为1，注意bitset可使用下标访问和赋值
    S.reset(1);  // 将S的第1位设为0
    printf("S[1]: %d\n", (int)S[1]); // 输出S第2位上的值
    printf("Count: %d\n", (int)S.count()); // S的popcount（二进制下1的个数）
    printf("Size: %d\n", (int)S.size()); // S的二进制位数（N）
    printf("None? %d\n", (int)S.none()); // S是否为空？
    printf("Any?  %d\n", (int)S.any());  // S是否有1？
    bitset<N> T; // 定义一个新的bitset -- T
    T.set(); // T置为全1
    S.set(2), T.reset(2);
    printf("Intersection: %d\n", (int)(S & T).count()); // 交集
    printf("Union: %d\n", (int)(S | T).count()); // 并集
    printf("Difference: %d\n", (int)(S ^ T).count()); // 差集
    return 0;
}

习题：AtCoder Beginner Contest 258 G - Triangle

题意和解法见我的题解。

深度优先搜索（DFS）的位运算优化

本算法其实还是二进制表示子集的一种优化，不过内容较多，所以单独放了出来。

考虑经典的八皇后问题：

有一个$8\times 8$的国际象棋棋盘，要在其中摆$8$个皇后，求有多少种不同的摆法，使得任意两个皇后之间都没有互相攻击。
注：皇后的攻击范围是一个“米”字，如下图所示：

八皇后问题很容易求解，用一个简单的回溯就可以了。
考虑$N$皇后问题，即：

有一个$N\times N$的国际象棋棋盘，要在其中摆$N$个皇后，求有多少种不同的摆法，使得任意两个皇后之间都没有互相攻击。

此时，还是先用标准的「回溯」算法解决问题：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31


#include <cstdio>
#define maxn 20
using namespace std;

bool row[maxn], diag_left[maxn << 1], diag_right[maxn << 1];
int ans, n;

void dfs(int i)
{
    if(i == n)
    {
        ans ++;
        return;
    }
    for(int j=0; j<n; j++)
        if(!row[j] && !diag_left[i + j] && !diag_right[i - j + n])
        {
            row[j] = diag_left[i + j] = diag_right[i - j + n] = true;
            dfs(i + 1);
            row[j] = diag_left[i + j] = diag_right[i - j + n] = false;
        }
}

int main()
{
    scanf("%d", &n);
    ans = 0;
    dfs(0);
    printf("%d\n", ans);
    return 0;
}

代码很移动，也不是重点，这里就不详细解释了。对于$N=13$，搜索时间约为$243\mathrm{ms}$；$N=14$，$1.31\mathrm s$；$N=15$，$8.14\mathrm s$；$N=16$…… $53.4\mathrm s$。

明显，这样的算法效率太低，我们来考虑使用位运算优化。
首先，我们把上面程序里的row、diag_left和diag_right换成一个int整数，赋值、取值全部改用位运算。但这样对整体的时间优化还是不大，我们要充分发挥位运算的优势——“百发百中”，即利用lowbit算法，确保每次枚举到的都是目前一步可放置的位置，减少不必要的判断。此时，我们改变diag_left和diag_right的含义，使diag_left表示左下-右上的$45\degree$对角线上当前一步可放置的皇后位置集合，diag_right同理。见代码：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30


#include <cstdio>
using namespace std;

int ans, mx;

void dfs(int row, int diag_left, int diag_right)
{
    if(row == mx)
    {
        ans ++;
        return;
    }
    int a = mx & ~(row | diag_left | diag_right);
    while(a)
    {
        int p = a & -a; a ^= p;
        dfs(row | p, (diag_left | p) >> 1, (diag_right | p) << 1);
    }
}

int main()
{
    int n;
    scanf("%d", &n);
    ans = 0;
    mx = (1 << n) - 1;
    dfs(0, 0, 0);
    printf("%d\n", ans);
    return 0;
}

此时，计算$16$皇后只需$6.23\mathrm s$！
习题：洛谷 P1092 [NOIP2004 提高组] 虫食算

附：N皇后问题的两种解法耗时对比

本测试中，两种算法耗时均为在Intel i7-12700H CPU上$5$次程序运行的最快速度。

$N$	无优化	位运算优化	速度提升
$13$	$253\mathrm{ms}$	$66\mathrm{ms}$	$2.83\text x$
$14$	$1.31\mathrm s$	$179\mathrm{ms}$	$6.32\text x$
$15$	$8.14\mathrm s$	$955\mathrm{ms}$	$7.52\text x$
$16$	$53.4\mathrm s$	$6.23\mathrm s$	$7.57\text x$

其他应用

两数交换

1
2
3
4


void swap(int& a, int& b)
{
    a ^= b ^= a ^= b;
}

位运算交换法扩展：超快GCD

1
2
3
4
5


inline int gcd(int a, int b)
{
    if(b) while(b ^= a ^= b ^= a %= b);
    return a;
}

两数平均数（防溢出）

1
2
3
4
5
6
7
8
9


inline int average1(int x, int y)
{
    return (x >> 1) + (y >> 1) + (x & y & 1);
}

inline int average2(int x, int y)
{
    return (x & y) + ((x ^ y) >> 1);
}

判断一个数是否为$2$的整数次幂

1
2
3
4


inline bool ispowof2(int x)
{
    return x > 0 && !(x & x - 1);
}

总结

本文详细讲解了位运算的使用和扩展。

创作不易，各位如果觉得好的话就请给个三连，感谢大家的支持！