dp优化 | 各种dp优化方式例题精选
阅读原文时间:2023年07月08日阅读:2

前言

本文选题都较为基础,仅用于展示优化方式,如果是要找题单而不是看基础概念,请忽略本文。

本文包含一些常见的dp优化(“√”表示下文会进行展示,没“√”表示暂时还咕着):前缀和优化(√)、单调队列优化(√)、斜率优化(√)、四边形不等式优化、数据结构优化……

由于写本文主要是记录蒟蒻的dp优化学习过程,所以可能很不完善,也会有很多错误 (?) 。推荐看巨佬的:【学习笔记】动态规划—各种 DP 优化 - 辰星凌

1. 前缀和优化dp

进行状态转移时,如果发现需加上前面的一类状态,就可以选择使用数组进行累计操作,以达到降维度的效果。

1.1.1 题目大意

给出 \(n\),\(k\),问 \(1..n\) 的排列中正好有 \(k\) 个逆序对的排列数。

1.1.2 数据范围

\(1 \leq n \leq 100\),\(1 \leq k \leq n * (n - 1) / 2\)。

1.1.3 做法

设 \(f_{i, j}\) 表示 \(1..i\) 的全排列中有 \(j\) 个逆序对的排列数。答案即为 \(f_{n, k}\)。

考虑在 \(1..(i-1)\) 的排列中加入一个 \(i\) 所能贡献的逆序对数量。由于 \(i\) 是最大的,故当它被排在第 \(j\) 个时,相应的逆序对数量会增加 \(i - j\) 个。

不难列出转移式:\(f_{i, j}=\sum_{k = 0}^{min(j, i - 1)}f_{i - 1, j - k}\)。

其中的 \(k\) 表示新增的逆序对数。

同时初始化 \(f_{1, 0}=1\)。

由于此题比较水,所以不优化也能过。

const int N = 110, mod = 10000;
int n, k, f[N][N * N >> 1];
int main() {
    n = read(), k = read();
    f[1][0] = 1;
    for (int i = 2; i <= n; i++)
        for (int j = 0; j <= (i * (i - 1)) >> 1; j++)
            for (int k = 0; k <= min(j, i - 1); k++)
                f[i][j] = (f[i][j] + f[i - 1][j - k]) % mod;
    printf("%d\n", f[n][k]);
    return 0;
}

接下来开始优化

现在把上面转移的式子改一下,方便优化:

\(f_{i, j}=\sum_{k = max(0, j - (i - 1))}^jf_{i - 1, k}\),相应的,代码可以改成这样:

    for (int i = 2; i <= n; i++)
        for (int j = 0; j <= (i * (i - 1)) >> 1; j++)
            for (int k = max(0, j - (i - 1)); k <= j; k++)
                f[i][j] = (f[i][j] + f[i - 1][k]) % mod;

开数组 \(s_{i, j}=\sum_{k = 0}^jf_{i, k}\),那么 \(s_{i, j}=s_{i, j - 1}+f_{i, j}\) 。

相应的,转移式变为 \(f_{i, j}=s_{i - 1,j}-s_{i - 1, j - (i - 1) - 1}\),注意边界问题

for (int i = 1; i <= n; i++) f[i][0] = s[i][0] = 1;
    for (int i = 2; i <= n; i++) {
        for (int j = 1; j <= (i * (i - 1)) >> 1; j++)
            s[i - 1][j] = (s[i - 1][j - 1] + f[i - 1][j]) % mod;
        for (int j = 1; j <= (i * (i - 1)) >> 1; j++)
            f[i][j] = (s[i - 1][j] + mod - ((j - (i - 1) - 1) < 0 ? 0 : s[i - 1][j - (i - 1) - 1])) % mod;
    }

注意到 \(s\) 数组的前一维似乎没有什么用处,考虑使用滚动数组继续优化。

for (int i = 1; i <= n; i++) f[i][0] = 1;
    s[0] = 1;
    for (int i = 2; i <= n; i++) {
        for (int j = 1; j <= (i * (i - 1)) >> 1; j++)
            s[j] = (s[j - 1] + f[i - 1][j]) % mod;
        for (int j = 1; j <= (i * (i - 1)) >> 1; j++)
            f[i][j] = (s[j] + mod - ((j - (i - 1) - 1) < 0 ? 0 : s[j - (i - 1) - 1])) % mod;
    }

1.2.1 题目大意

给出 \(n\),\(k\),问 \(1..n\) 的排列中正好有 \(k\) 个逆序对的排列数。

1.2.2 数据范围

\(1 \leq n, k \leq 1000\)。

1.2.3 做法

乍一眼看是不是和上题一模一样。

如果直接提交上题的代码(改了数据范围),就会得到30分的好成绩。(最后几个点全部MLE)

稍稍计算一下,就会发现 \(499500000\) 的 int 数组是不是有那么亿点点大?

那么如何优化代码呢?

注意到上题的代码中,逆序对数枚举的上限为 \(\frac {n \times (n-1)} {2}\),再瞅一眼本题数据范围,最大逆序对数只有 \(1000\)?!

不难想到改成以下代码:

const int N = 1010, mod = 10000;
int n, k, f[N][N], s[N ];
int main() {
    n = read(), k = read();
    for (int i = 1; i <= n; i++) f[i][0] = 1;
    s[0] = 1;
    for (int i = 2; i <= n; i++) {
        for (int j = 1; j <= min((i * (i - 1)) >> 1, k); j++)
            s[j] = (s[j - 1] + f[i - 1][j]) % mod;
        for (int j = 1; j <= min((i * (i - 1)) >> 1, k); j++)
            f[i][j] = (s[j] + mod - ((j - (i - 1) - 1) < 0 ? 0 : s[j - (i - 1) - 1])) % mod;
    }
    printf("%d\n", f[n][k]);
    return 0;
}

真好,既优化了空间又优化了时间。

2. 单调队列优化dp

OI-Wiki 传送门

借助单调队列的单调性,及时排除不可能的决策,保持候选集合的高度有效性和秩序性。

单调队列尤其适合优化决策取值范围的上、下界均单调变化,每个决策在候选集合中插入或删除至多一侧的问题。

2.1.1 题目大意

给定一个长度为 \(n\) 的数列 \(a\),对于每个 \(i\) 输出 \(min\{a_{i-m},a_{i-m+1},..,a_{i-1}\}\)。

2.1.2 数据范围

\(1\leq m\leq n\leq 2\times10^6\),\(1\leq a_i\leq3\times10^7\)。

2.1.3 做法

好像和单调队列优化dp没什么关系?

此题用于体验单调队列,就不多写了,直接用单调队列模拟操作即可。

const int N = 2000010;
int n, m, s[N], l = 1, r, a[N];
int main() {
    n = read(), m = read();
    printf("0\n");
    for (int i = 1; i <= n - 1; i++) {
        a[i] = read();
        while (r >= l && a[s[r]] > a[i]) r--;
        s[++r] = i;
        while (s[r] - s[l] + 1 > m && l <= r) l++;
        printf("%d\n", a[s[l]]);
    }
    return 0;
}

2.2.1 题目大意

有 \(n\) 个物品,编号 \(1..n\),每个物品有坚固值 \(a_i\)。

进行 \(n\) 次操作,对于每次操作,执行以下步骤:

  1. 取出不超过 \(s\) 个物品。
  2. 放入物品 \(i\)。

其中容器最多容纳 \(w\) 个物品。

每次操作会产生 \(a_i\times 物品数(包括放入的物品)\) 的贡献。

求 \(n\) 次操作后总贡献的最大值。

2.2.2 数据范围

\(1\leq s\leq w\leq n\leq5\times10^3\),\(|a_i|\leq10^9\)。

2.2.3 做法

设 \(f_{i,j}\) 表示正在执行第 \(i\) 次操作,容器内共有 \(j\) 个物品所能得到的最大贡献值。

那么 \(f_{i,j}=\max\{f_{i-1,k}+a_i\times j\}\)。

其中 \(j-1\leq k\leq \min\{w,j-1+s\}\)。

于是就得到了一个45分做法(long long没开全只有35)

const int N = 5010;
const ll INF = 1e18;
int n, w, s;
ll f[N][N], ans = -INF, a[N];
int main() {
    n = read(), w = read(), s = read();
    for (int i = 1; i <= n; i++) a[i] = read();
    for (int i = 0; i <= n; i++)
        for (int j = 0; j <= w; j++)
            f[i][j] = -INF;
    f[0][0] = 0;
    for (int i = 1; i <= n; i++)
        for (int j = 1; j <= w; j++)
            for (int k = j - 1; k <= min(w, j - 1 + s); k++)
                f[i][j] = max(f[i][j], f[i - 1][k] + a[i] * j);
    for (int i = 0; i <= w; i++) ans = max(ans, f[n][i]);
    printf("%lld\n", ans);
    return 0;
}

(不如先动手写个部分分做法?)

考虑优化。先把式子变一下:\(f_{i,j}=\max\{f_{i-1,k}\}+a_i\times j\) \((j-1\leq k\leq \min\{w,j-1+s\})\)。很显然对吧,就是把原来max中重叠的部分提出来而已。虽然说这么一提好像不能优化什么,你会发现,\(\max\{f_{i-1,k}\}\) 好像可以用单调队列优化?!

const int N = 5010;
const ll INF = 1e18;
int n, w, s;
ll f[N][N], ans = -INF, a[N];
int ss[N];
int main() {
    n = read(), w = read(), s = read();
    for (int i = 1; i <= n; i++) a[i] = read();
    for (int i = 0; i <= n; i++)
        for (int j = 0; j <= w; j++)
            f[i][j] = -INF;
    f[0][0] = 0;
    for (int i = 1; i <= n; i++) {
        int l = 1, r = 0;
        ss[++r] = w;
        for (int j = w; j; j--) {
            while (f[i - 1][ss[r]] < f[i - 1][j - 1] && r >= l) r--;
            ss[++r] = j - 1;
            while ((ss[l] - ss[r] + 1) - 1 > s && l <= r) l++;
            f[i][j] = f[i - 1][ss[l]] + j * a[i];
        }
    }
    for (int i = 0; i <= w; i++) ans = max(ans, f[n][i]);
    printf("%lld\n", ans);
    return 0;
}

3. 斜率优化dp

OI-Wiki 传送门

3.1.1 题目大意

有 \(n\) 件物品,第 \(i\) 件物品压缩后占用 \(C_i\) 的长度。

现需把这些物品压缩进一些容器里,制作一个容器的花费为 \((x-L)^2\),其中 \(x\) 表示容器长度。

每个容器中的物品编号需要是连续的,而将编号 \(i\) 到 \(j\) 的所有物品放在一个容器中,占用的空间 \(x=j-i+\sum_{k=i}^j C_k\)。

求压缩完所有物品所需的总花费的最小值。

3.1.2 数据范围

\(1\leq n\leq 5\times10^4\),\(1\leq L\leq10^7\),\(1\leq C_i\leq10^7\)。

3.1.3 做法

设 \(f_i\) 表示压缩到第 \(i\) 件物品所需的最小花费,不难列出转移方程:

\(f_i=\min\{f_j+(i-j-1+\sum_{k=j+1}^i c_k-L)^2\}\)


令 \(sum_i=\sum_{k=1}^i c_k\),原式可转化为:

\(f_i=\min\{f_j+(i-j-1+sum_i-sum_j-L)^2\}\)。

移项得:

\(f_i=\min\{f_j+((i+sum_i)-(j+sum_j)-(L+1))^2\}\)

令 \(pre_i=sum_i+i\),原式可转化为:

\(f_i=\min\{f_j+(pre_i-pre_j-(L+1))^2\}\)


把式子展开再合并:

\(f_i=\min\{f_j+pre_i^2-pre_i\times pre_j-(L+1)\times pre_i-pre_i\times pre_j+pre_j^2+(L+1)\times pre_j-(L+1)\times pre_i+(L+1)\times pre_j+(L+1)^2\}\)

\(f_i=\min\{f_j+pre_i^2+pre_j^2-2\times pre_i\times pre_j-2\times(L+1)\times(pre_i-pre_j)+(L+1)^2\}\)

\(f_i=\min\{f_j+(pre_i-pre_j)^2-2\times(pre_i-pre_j)\times(L+1)+(L+1)^2\}\)

\(f_i=\min\{f_j+(pre_i-pre_j-(L+1))^2\}\)


\(f_i=\min\{f_j+((pre_i-(L+1))-pre_j)^2\}\)

\(f_i=\min\{f_j+(pre_i-(L+1))^2-2\times(pre_i-(L+1))\times pre_j+pre_j^2\}\)

\(f_i-(pre_i-(L+1))^2=\min\{f_j+pre_j^2-2\times(pre_i-(L+1))\times pre_j\}\)


令:

\(\begin{eqnarray}\begin{cases}b_i=f_i-(pre_i-(L+1)^2)\\x_j=pre_j\\y_j=f_j+pre_j^2\\k_i=2\times(pre_i-(L+1))\end{cases}\end{eqnarray}\)

发现原式转化为 \(b_i=\min\{y_j-k_i\times x_j\}\)。

看上去有那么亿点点的像 \(y=kx+b\) 呢……

考虑这个求 \(b_i\) 的最小值的过程,就是在最小化直线的截距。把 \((x_j,y_j)\) 看作平面上的一个点,现在有一条斜率为 \(k_i\) 的直线,从下往上找(最小化),找到的第一个点就是转移决策点。

实际上,只需维护下凸壳的那些点。

对于本题,\(k_i\) 随 \(i\) 的增大而增大,所以可以用单调队列进行维护。

const int N = 50010;
int n, c[N], l = 1, r = 0;;
ll sum[N], s[N], f[N], L;
ll Get(int x) {
    return f[x] + (sum[x] + L) * (sum[x] + L);
}
long double slope(int x, int y) {
    return (Get(y) - Get(x)) * 1.0 / (sum[y] - sum[x]);
}
int main() {
    n = read(), L = read() + 1;
    for (int i = 1; i <= n; i++) c[i] = read();
    for (int i = 1; i <= n; i++) sum[i] = sum[i - 1] + c[i] + 1;
    s[++r] = 0;
    for (int i = 1; i <= n; i++) {
        while (l < r && slope(s[l], s[l + 1]) <= (sum[i] << 1)) l++;
        f[i] = f[s[l]] + (sum[i] - sum[s[l]] - L) * (sum[i] - sum[s[l]] - L);
        while (l <= r && slope(s[r - 1], s[r]) >= slope(s[r - 1], i)) r--;
        s[++r] = i;
    }
    printf("%lld\n", f[n]);
    return 0;
}

N. 参考内容

DP优化 - zuytong

单调队列优化DP - superPG