「笔记」折半搜索(Meet in the Middle)
阅读原文时间:2022年07月06日阅读:1

先搜索前一半的状态,再搜索后一半的状态,再记录两边状态相结合的答案。

暴力搜索的时间复杂度通常是 \(O(2^{n})\) 级别的。但折半搜索可以将时间复杂度降到 \(O(2 \times 2^{\frac{n}{2}})\),再加上统计答案的时间复杂度,总复杂度几乎缩小了一半。

「CEOI2015 Day2」世界冰球锦标赛

题目链接

Luogu P4799 [CEOI2015 Day2]世界冰球锦标赛

分析

用折半搜索的思想,先搜索 \(0 \sim \lfloor \frac{n}{2} \rfloor\) 的比赛,再搜索 \((\lfloor \frac{n}{2} \rfloor + 1) \sim n\) 的比赛。每个比赛有看与不看两种状态,时间复杂度 \(O(2 \times 2^{\frac{n}{2}})\)。在搜索后半部分的时候,假设该状态的花费是 \(s\),则去前半部分的答案中找到所有花费小于等于 \(m - s\) 的结果,统计答案。

前半部分搜索的时候记录所有的答案,然后排序,这样后半部分统计答案的时候可以二分。

总的时间复杂度为 \(O(2^{\frac{n}{2}} + 2^{\frac{n}{2}} \cdot \log(2^{\frac{n}{2}}))\),可通过本题。

注意 vector 的常数问题:本题如果采用两个 vector 数组,分别记录两边的答案,最后再统计,则会在 \(#45\) 测试点 Time Limit Exceeded(开 \(\text{O2}\) 可过)。

参考代码

#include<iostream>
#include<cstdio>
#include<vector>
#include<algorithm>

using namespace std;

const int N = 50;

int n;
long long m, w[N];
vector <long long> v1; // 存储所有前部部分可以得到的状态的花费(可重)
long long ans;

void dfs1(int p, long long s){ // p -> 当前位置,s -> 当前花费,下同
    if(p >= (n/2)){
        v1.push_back(s); // 记录前半部分状态
        return ;
    }
    dfs1(p+1, s);
    if(s + w[p] <= m){
        dfs1(p+1, s+w[p]);
    }
}

void dfs2(int p, long long s){
    if(p >= n){
        ans += upper_bound(v1.begin(), v1.end(), m - s) - v1.begin(); // 统计前半部分花费小于 (m-s) 的状态数量
        return ;
    }
    dfs2(p+1, s);
    if(s + w[p] <= m){
        dfs2(p+1, s+w[p]);
    }
}

int main(){

    scanf("%d%lld", &n, &m);

    for(int i = 0; i < n; i++){
        scanf("%lld", &w[i]);
    }

    dfs1(0, 0);

    sort(v1.begin(), v1.end()); // 升序排序

    dfs2((n/2), 0);

    printf("%lld\n", ans);

    return 0;
}

「USACO 12 OPEN」Balanced Cow Subsets G

题目链接

Luogu P3067 [USACO12OPEN]Balanced Cow Subsets G

分析

同样折半搜索,先搜索 \(0 \sim \lfloor \frac{n}{2} \rfloor\) 的数,再搜索 \((\lfloor \frac{n}{2} \rfloor + 1) \sim n\) 的数。

每个数有「放第一组」「放第二组」「不选」共三种状态,可以在搜索的时候把「放第一组」记为 \(+\),把「放第二组」记为 \(-\),「不选」就不加也不减,这样两组相等就是和为 \(0\)。

在搜索后半部分的时候,记录答案,假设该状态的和是 \(s\),则去前半部分的答案中找到所有等于 \(-s\) 的结果。

直接这样交会 Wrong Answer \(38\)。仔细看题,要求的是找出一些数,使得它们能被分为两组。比如有四个数 \(a, b, c, d\),满足 \(a + b = c + d\),\(c + d = a + b\),\(a + c = b + d\),\(b + d = a + c\) 之类,就会被重复记录。还有诸如此类的多个数的重复情况。所以要记录选数的情况(有些类似 hash 的思想),比如有 \(a, b, c, d\) 四个数,选了 \(a, c\) 两个,就用二进制数 \(1010\) 记录(\(1\) 表示选,\(0\) 表示不选)。再左移 \(10\) 位(\(n \leq 20\),前半部分最多 \(10\) 个数),并连接上后半部分的选数情况,就得到了形如 \(1010000000xxxx\) 的二进制数,开 bool 数组去重即可。

这样时间复杂度为 \(O(3^{\frac{n}{2}} + 3^{\frac{n}{2}} \cdot \log(3^{\frac{n}{2}}))\),实际远远跑不满,在开 \(\text{O2}\) 的情况下最慢的测试数据也才 \(131ms\)。

代码中 v1[x]vector 类型的,该数组表示所有前半部分答案为 \(x\) 的选数情况记录。

还是注意考虑 vector 的常数问题,必要时善用 \(\text{O2}\)。

参考代码

#include<iostream>
#include<cstdio>
#include<vector>
#include<unordered_map>
#include<algorithm>

using namespace std;

const int N = 30, F = 1 << 21;

int n;
int a[N];
unordered_map <long long, vector <int> > v1;
long long ans;
bool vis[F];

void dfs1(int p, int s, int tp){ // p -> 当前位置,s -> 当前和,tp -> 选数记录(用于去重),下同
    if(p >= (n/2)){
        v1[s].push_back(tp); // 记录选数的情况
        return ;
    }
    dfs1(p+1, s+a[p], (tp<<1)|1); // 放入第一组
    dfs1(p+1, s-a[p], (tp<<1)|1); // 放入第二组
    dfs1(p+1, s, (tp<<1)); // 不选
}

void dfs2(int p, int s, int tp){
    if(p >= n){
        for(int i : v1[-s]){ // 枚举前半部分所有结果为 -s 的
            if(!vis[(i<<10)|tp]){ // 去重
                vis[(i<<10)|tp] = 1;
                ans++;
            }
        }
        return ;
    }
    dfs2(p+1, s+a[p], (tp<<1)|1); // 放入第一组
    dfs2(p+1, s-a[p], (tp<<1)|1); // 放入第二组
    dfs2(p+1, s, (tp<<1)); // 不选
}

int main(){

    scanf("%d", &n);

    for(int i = 0; i < n; i++){
        scanf("%d", &a[i]);
    }

    dfs1(0, 0, 0);

    dfs2((n/2), 0, 0);

    printf("%lld\n", ans-1); // 减去都不选的情况

    return 0;
}