NOIP 2024 游记赛前训练总结

news/2024/11/28 20:27:17/文章来源:https://www.cnblogs.com/dccy/p/18575106

NOIP 2024 游记 & 赛前训练总结

前面都是比赛前的训练，会含有一些比赛经验。游记写在最后。

day #-18（11.11）

赛时

今天做信友错的模拟赛。

第一题是和最短路有关的，看到 \(n\le 500\) 就想到了 \(n^3\log n\)，然而看了很久都不会做，于是果断火速打了 \(O(n^4)\) 的暴力走人，get 50pts。

然后看第二题，发现是最大异或路径，正好最近刚学了线性基，于是想到之前做的一道线性基的题目，把每个环加入线性基。然后就能做到 \(n^2\)，再补一个树的性质。get 55pts。此时比赛刚过一小时。

很快啊，其他人还在做 T1，我就开了 T3。看了一会想到用并查集维护，再记录修改前的以实现撤销。发现大样例都过了，此时我还以为复杂度是正确的，此时比赛刚刚过半。但是去了一下洗手间，就想到可以构造一条链卡到平方，这个做法只能过随机的性质和不撤销的性质。于是又补了链的性质。get 55pts。

此时光靠暴力已经得到 160pts 了。

比赛刚过半，看了一下第四题，觉得还是要先补一下第一题的性质，补了一个性质 A，多得了 10pts。

这时我去尝试想中间两道题的正解，无获，于是开始打最后一题的暴力。

~~后半程有点松弛。~~

发现暴力分很多啊，在最后 20 分钟写完了 \(n\le 9\) 的 40pts 暴力，然后又补了前两个性质共 8pts。

赛后 & 总结

然后——比赛结束，最后一题 48pts \(\to\) 60pts，最后总分 \(50+55+55+60=230\) 喜提总榜 14，jz 第 3，原来是暴力场。

赛后发现 T1 是线段树分治的思想，还有 Floyd 插入单个点的技巧，我们只以一个点集内的点为中转点转移（插入顺序没有要求），就可以求出只经过（不包括起点终点）这个点集内的点的最短路。

T2 是线性基的结论，\(qmax(i\oplus j)=qmax(i)\oplus qmin(j)\)。

T3 是树剖+线段树的 4K 大数据结构，就是把轻链的贡献全部挂在重链上，有点类似动态 DP 那种。

T4 是论文题，用结论的式子计数。而暴力就是递归，然后在递归过程中进行剪枝就能跑得比较快。

总结：这场比赛时间分配还不错，前面暴力打得比较快，调试也没花多少时间，大概是经验越来越丰富了吧。但可惜后面充裕的时间内没有想出正解，其实正解是不难的，还有提升空间。

改题经验

改 T3 的时候有一个数组没开 long long，幸好很快就查出来了。

改 T1 的时候在分治时把枚举 \([l,mid]\) 写成 \([1,mid]\) 了。

day #-14（11.15）

今天输了！

20:35 开始打 CF div.2。

顺序开题。

T1 是唐题，T2 是唐题。

T3 我蠢了，1 h 时还没过，于是去写 T4。

T4 也想了不少时间，终于想到一个用 set+BIT 的做法。

T5 是树同构，我还以为要换根于是没写。

T6 是交互，没看。

最后成果：T1+T2+T4。

赛后发现 T3 的正解就是我想的那样，结果 tm 的 T5 的同构是有根树下的，又被骗了。

谴责 CF 的题面跟 shi 一样长。

总结：

要有耐心，不要因为前面的题不会，后面就不去想了。
不要花太多时间在一道题目上，扔掉后就不要再去想它了。

day #-13（11.16）

今天又做心有错。

T1 简单题。

后面都不会做，把暴力都拿了。

预计：100+60+60+50=260。

实际：72+60+60+20=212。

T1 我自信地认为 \(n^3\times V\) 不会爆 long long，导致我没有取模。

而 T4 不知道为什么 \(O(n^3)\) 没有拿到第二档分，tm 的 OI 赛制还绑 subtask。

赛后

T2 是对于长度相同的区间的线段树是同构的，运用这个性质记忆化递归。

T3 题面很简单，正解是神奇哈希，被骗啦，哈哈哈，把 shi 题放在 T3 让人以为是科技题。大概是把 \(n\) 个位置用哈希值转化成 \(\sum\) 个字符的不同情况。

T4 是分治，矩形分为跨过分界线和不跨过两种，不跨过是子问题，递归求解；跨过可以暴力做。每次对当前矩形割长的一边，这样复杂度就正确了，时间是 \(T(n)=4T(n/2)+O(n^2)=n^2\log n\)。

总结

要有耐心，要充分利用时间。
要注意数据范围，记得取模，不要想当然。
神奇的题要想想神奇的算法，比如哈希之类的，这又让我想起星战那道奇葩题。

dsy #-9（11.20）

心有错。

赛时

T1 想到二分答案，然后就不会做了，我都要以为是罚坐场了。

前面浪费了一个小时，然后去开 T2，写了一个 \(O(n^2)\) 暴力，对着边权讨论一下，然后终于想到了用线段树模拟最短路的过程，写完已经十一点了。

后面的时间打了剩下三题的暴力，这时感觉 T4 有点像哈希，但是觉得敲不出来了，就没继续想。

赛后

发现 T1 是我不会证的结论（猜结论题），T3 是 SG 函数的规律（打表题），T4 真的是哈希。

之后新学了博弈论相关的知识。

总结

这场比赛在第一题浪费太多时间了，应该猜到题目不按难度排列的，一定要先做擅长的题和有想法的题。

day #-4（11.25）

今天的题都挺好的，但就是我没做出来几道，感觉思维不够敏捷了？这一周一定要努力了。

今天还是做心有错，T1 浪费了我一个半小时，T2 已经接近正解了，T3 用了错解结果过了，T4 其实不算难题但我没看。

T1

TAG：线性筛、质因数分解、最优化分解。

这道题很容易想到 \(O(T\dfrac{\sqrt[k]n}{\ln\sqrt[k]n})\) 的做法，就是当 \(k=3\) 时，质数分解到 \(2^{20}\)，之后枚举所有质数即可。

然后我就绞尽脑汁没想到正解，但我想到和正解很接近的思路：
发现有很多小的质数对答案没有贡献，那怎么去掉它们呢？

然后我并不知道怎么去掉它们，原来只需要把 \(\sqrt[k+1]n\) 的质数筛掉，剩下的最多是三个质数相乘，这个时候直接把剩下的 \(n\) 开根即可，时间复杂度 \(O(T\sqrt[k+1]n)\)，由于 \(k\) 随机所以可过。

细节：我们需要用 powl(n,(long double)1/K) 进行开根，但由于指数是小数，所以还是有精度问题，我们还需要 roundl 进行四舍五入。

T2

TAG：逆序对、二维平面、扫描线。

这题我比赛时想到了：
如果选 \(i,j(i<j)\)，那么答案为 \(1+2\sum_{k=i+1}^j [a_i>a_k>a_j]\)。

赛时写了一个严格 \(O(n^2)\) 的做法，就是预处理 \(f_{i,j}\) 表示前 \(i\) 个数中 \(a_i\) 大于 \(j\) 的个数。

赛时还想到放到二维平面上，把每个位置看成一个点 \((i,a_i)\)，那么就是求一个矩形内点最多有多少个，要满足矩形左上角和右下角是一个点。

赛时觉得左上角应该是一个上凸包，右下角是一个下凸包，然后时间不够了，也没有再深度思考。

而实际上左上角是前缀最大值，右下角是后缀最小值。

发现我们枚举点对 \((i,j)\) 不好统计，而且点对也是 \(O(n^2)\) 的。

考虑 \((k,a_k)\) 对那些 \((i,j)\) 有贡献。

发现满足条件的 \(i\) 是一个区间 \(j\) 也是一个区间，记它们为 \([l_{1,k},r_{1,k}],[l_{2,k},r_{2,k}]\)。

那么再把它放到二维平面上，就是 \(x=[l_{1,k},r_{1,k}],y=[l_{2,k},r_{2,k}]\) 的一个矩形内的点有 \(+1\) 的贡献。

那么线段树扫描线找到被最多矩形覆盖的点即可。

把一个矩形 \([l_{1,k},r_{1,k}],[l_{2,k},r_{2,k}]\)，分为 \((l_{1,k},r_{1,k},l_{2,k},1)\) 和 \((l_{1,k},r_{1,k},r_{2,k}+1,-1)\) 即可。

T3

TAG：最小生成树、Prim、Kruskal、线段树、均摊、启发式合并。

做法 1

考虑 Kruskal。

把点按点权重标号，然后用 vector 和并查集维护每一个连通块内的点与每个点属于哪一个连通块，set 维护当前每个不同的连通块编号。

对于给的边就直接加；对于剩下的边，我们每次尝试向一个不同连通块内的点连边，失败次数是 \(O(m)\) 的，成功次数是 \(O(n)\) 的，于是均摊复杂度就是正确的。

合并 vector 需要启发式合并。

时间复杂度 \(O((n+m)\log n)\)。

考场上想到了均摊，但是没想到如何维护不同的连通块，但是写了一个相似的可以被卡掉的做法，但结果过了。

做法2

考虑 Prim，也就是每次找离连通块内最近的点加入连通块。

可以用线段树维护离连通块的距离与取出一个最近的点。

更新距离时，所有点的更新被给定的边分成了 \(O(m+n)\) 个区间赋 \(a_i\)。

时间复杂度 \(O((n+m)\log n)\)。

T4

发现取带权重心最优。

这题是动态寻找带权重心，用倍增找。然后权值和需要用较复杂的容斥，需要预处理多个树上 DP 数组，同时还需要换根 DP。

用到的算法并不难，一些结论也大概能猜到，就是在计算上的细节比较多。

总结

题目难度不一定顺序，不要花太多时间在看起来很简单的题上。
正难则反，多从不同角度思考问题。
多从学过的算法中找思路和灵感。
使用 powl 时，记得用 ruondl，记得用 long double。
可以尝试把序列上的统计问题放到二维平面上思考。
统计 \(x\) 有多少个 \(y\) 时，可以考虑对于每个 \(y\) 思考它能贡献到哪些 \(x\)。
可以用线段树扫描线做最多覆盖问题，用差分做矩形的扫描线。
用启发式合并合并 set，vector 等。
最短路、最近点可以考虑放到线段树上优化更新和取点。
树上问题多考虑考虑重心或直径，从中寻找性质。

day #-3（11.26）

P1445 [Violet] 樱花

下午做了这一道奇葩的蓝题，我想了一个小时都不会做。

题意大概是给定 \(n,1\le n\le 10^6\)，问 \(1/x+1/y=1/(n!)\) 的正整数解的个数。

大概是这样的：

\[xn!+yn!=xy \]

\[x(y-n!)=yn! \]

\[x=\dfrac{yn!}{y-n!} \]

于是可以得到 \(y>n!\)，那么设 \(y=n!+k\)，\(k\) 是正整数。

带入得

\[x=\dfrac{n!^2+kn!} k \]

\[x=\dfrac {n!^2} k+n! \]

于是对于任意 \(k\) 满足 \(k\mid n!^2\)，都有对应的一个 \(x\)，也就有对应的一组 \((x,y)\)。

于是答案就是 \(d(n!^2)\)，考虑枚举每个质数 \(p\) 的倍数，计算 \(p\) 在每个数中的指数和，记为 \(cnt_p\)，答案就是 \(\prod_p(cnt_p+1)\)。

时间复杂度为 \(O(n\ln n)\)。

day #-2（11.27）

今天挂了 90 pts！！！

原因是 T1 在本地过了大样例后没造大数据，也没写对拍，于是最终的代码数组越界，然而测大样例时数组越界在 windows 下还能正常跑！
以后一定要造大数据或者在虚拟机上跑，windows 不可信。

今天做信友队。

T1

TAG：容斥、枚举。

T1 考虑如果两个点集有交，那么交的部分就减去，枚举一个点，再枚举两个有交点集所在的位置，给它们打上一个减去的标记，这部分是 \(O(nmk^2)\)。

然后枚举两个点集计算答案，这部分是 \(O(n^2m^2)\)。

于是时间和空间都是 \(10^8\) 级别。

T2

TAG：随机化、调整法。

sb 出题人把 sb 脑电波题放在 T2，全场没人过。

题目大意：对于一个 \(n*n\) 的方阵，每个格子是 \(0/1\)，方案数定义为不经过 \(0\) 每次往下或往右，从左上角走到右下角的方案数。求构造一个方案数为 \(L\) 的 \(n\le 30\) 的方阵。

这道题是随机化，然而 sb 题解并没有证明，代码也很好打，就是调整法，每次贪心地调整最大的，多随机几次初始矩阵就可以通过。

T3

TAG：背包、增量构造、多项式、递推。

这题是好题。

题目大意：给你 \(n\) 行 \(m\) 列数字，每行选一个数，求在所有选择方案中选出的数的中位数的期望。

赛时做法

考虑枚举最后的中位数 \(x\)，然后计算中位数为 \(x\) 的方案数，考虑背包设 \(f_{i,j,k}\) 表示前 \(i\) 行选了 \(j\) 个小于 \(x\) 和 \(k\) 个等于 \(x\) 的方案数。

由于 \(k\) 上界的和为 \(O(nm)\) 于是复杂度为 \(O(n^3m)\)。

我真的不懂为什么 \(O(n^4)\) 和 \(O(n^5)\) 都一样只有 20pts，但愿正式赛会好一点。

然后我就想怎么优化，发现这样求方案数的话，不同中位数之间是没有关联的。

考虑求中位数小于等于 \(x\) 的方案数 \(ans_x\)，于是等于的就是 \(ans_x-ans_{x-1}\)。

中位数小于等于 \(x\) 的方案数就要求至少有 \(\dfrac {n+1} 2\) 行选的数要小于等于 \(x\)，发现这只与每一行小于等于 \(x\) 的数的个数有关。

然后我就不会了，觉得这个东西还是需要背包。

正解

我们考虑可以把背包刻画成多项式的形式，如果我们要求中位数小于等于 \(x\) 的，设 \(cnt_i\)为第 \(i\) 行小于等于 \(x\) 的个数，那么就有 \(ans_x=[x^{\frac{n+1} 2}]F(x) =[x^{\frac{n+1}2}]\prod_{i=1}^n [(m-cnt_i)+cnt_ix]\)。

考虑把所有 \(a\) 排序后依次加入 \(cnt\) 中，这样就能算出每个 \(x\) 的 \(ans_x\)。

考虑加入第 \(i\) 行的 \(a\) 后多项式怎么变化，考虑到有 \(O(nm)\) 个数，我们只需 \(O(n)\) 暴力修改多项式即可。

初始时 \(F(x)=m^n\)。

然后 \(cnt_i\to cnt_i+1\)，我们可以先除以再乘上。

先考虑乘上，如果我们乘上 \((a+bx)\)，那么设 \(f_i\) 为 \(i\) 次项系数，则

\[f_0'=af_0 \]

\[f_i'=af_i+bf_{i-1} \]

移项后就能得到除法的式子，如果我们除以 \((a+bx)\)，则

\[f_0=\dfrac {f_0'} a \]

\[f_i=\dfrac {f_i'-bf_{i-1}} a \]

发现乘法要从大往小做，除法要从小往大做。

T4

TAG：期望、DP、高斯消元。

这道题鉴定为没有使用过高斯消元做期望问题，现在会了。

part 1

先判断无解的，对 \(O(n^2)\) 个点建图，从能出去的点跑搜索看哪些点出不去。

part 2

对所有 \((i,v),|v|\le n\) 的点取出来，建边然后跑高斯消元，时间为 \(O(n^6)\)。

part 3

发现如果 \(v>O(\sqrt n)\) 那么前面已经走了 \(O(n)\) 距离，已经走出去了，于是只需要 \(|v|\le O(\sqrt n)\) 的点。

时间复杂度为 \(O((n\sqrt n)^3)=O(n^{4.5})\)。

part 4

再优化点数，考虑把一个点的期望表示成 \(f_i=C+\sum_j a_{i,j} f_j\)，\(C\) 是常数。如果可以那么就能做到 \(O(n^3)\)。

考虑计算从 \((i,0)\) 开始，对于每一个 \(j\) 中间不经过其他 \((x,0)\) 到达 \((j,0)\) 的期望步数、概率，以及直接走出去的期望步数、概率。
这里的期望步数求的是已经乘过概率的，比方说设 \(q_i\) 表示起点走到它的概率，\(c_i\) 表示起点走到它的期望步数（没有乘上 \(q_i\) 的）、我们求的实际上是 \(q_i,C_i(C_i=q_ic_i)\)，因为 \(c_i\) 是不好转移的。
而且我们最后算的也是乘上概率后的期望步数和，即 \(C_i\) 的和。

举例：
\(1\to^{\frac 1 2}\to 2,1\to^{\frac 1 2}\to 3\)。
就有：
\(c_2=c_3=1,q_2=q_3=\frac 1 2,C_2=C_3=\frac 1 2\)。

而就有转移，设 \(p_i\) 为走过出边的概率：

\[q_i=\sum q_j p_j \]

\[C_i=q_i+\sum C_jp_j \]

发现对于 \(j<i\)，一定始终有 \(v<0\)，对于 \(j>i\) 一定始终有 \(v>0\)，即转移的图是一个 DAG。

于是便可以 DP，这一部分是 \(O(n^3)\)。

最后就表示成了，设 \(C'\) 表示直接走出去的期望步数，\(f_i=\sum_j q_{i,j} f_j+C'+\sum_j C_{i,j}\)。

移项得 \(-f_i+\sum _j q_{i,j}f_j=-C'-\sum_jC_{i,j}\)，高斯消元 \(O(n^3)\)。

高斯消元的时候直接把无解的行列全变成 0 即可。

总结

一定要写对拍、造大数据、在虚拟机上过编译。
背包的转移可以尝试刻画成多项式的形式。
期望问题可以高斯消元，高斯消元可以尝试优化点数，可以用 DP 先处理出特殊点之间的关系以尝试优化点数。

day #-1

今天做线下模拟赛，同样的，去实际考场断网做比赛。

今天打的非常好，没有挂分，\(100+100+80+30=310\)，获得了前 \(10\) 名。

赛时

今天是顺序开题，先看 T1，想到在上一次的生成树上改，似乎是经典结论：在树上加一条边后会形成一个环，把环上最大的边取走就可以得到新的生成树，我写的是 \(O(n^2\log n+qn)\) 但实际上可以用 \(Prim\) 做到 \(O(n^2+nq)\)，评测时也是 800ms 惊险地卡过了。
发现有的人 \(O(n^2\log n+qn\log n)\) 被卡了、还有人 \(4*5000^2\) MLE 了。

T2 很 sb 但还是惊险地过了。发现数据随机，想到是神奇的做法。
一开始想到类似某次 ABC 的 G 题那样，查询枚举子集、修改再枚举子集，数据随机可以做到 \(O(n+3^m)\)，但没有优化前景。
然后又打表发现后面的询问的答案都非常小，于是考虑每次从小到大枚举修改的位数，然后发现它跑得飞快，大约 500ms。
其实这个做法和 bfs 搜索是本质相同的，复杂度或许可以证明是正确的，大概就是因为本质是 \(m\) 维空间的最小曼哈顿距离，空间中的点一定会越来越密集，所以跟数据随机并没有什么关系。

打完前题大概是 \(9:30\)，比赛是 \(7:30\) 开始的，经过 2h 了，速度中规中矩。

T3 经过我艰辛的打表，终于发现了 \(A\) 性质的充要条件，我也没有证明，但它对了。

获得 80 pts 后其实还剩一个多小时，但我想先去看 T4。

T4 想到网络流，但是并没有这一档分，想着多骗一点，结果打完了发现建模错了，或许根本不能网络流。
只剩半小时了，赶快去写指数级别的暴力，写完后还剩十多分钟了。

后面就是放到虚拟机上过编译了一下。

其实我知道 T3 的正解和 \(A\) 性质仅差一步之遥，但就亏在 T4 把时间浪费在错解上了，或许也是前面的题花的时间过多了。

而且 T3 的表的规律或许只是运气好，其他人都是考虑放到二维平面上考虑然后得到相同的结论。

赛后

T3 就是在 A 性质上扩展一下，还是 DP 考虑最终序列。

考虑除了第一段的每一段的结尾，它不能是一个隐藏的数，否则这一位填 0 以后和它不能区分，而每一段的除了结尾的位置则可以是隐藏的数。

再考虑每一段最大值的限制，它和第一段有关，如果第一段的结尾是一个隐藏的数，那么如果后面没有出现过最大值，那么无法与第一段的结尾为其它数的序列区分。也就是如果第一段的结尾为隐藏的数，那么后面一定要出现最大值。

那么就设 \(f_{i,j,0/1}\) 表示第 \(i\) 位填了 \(j\)，有没有出现过最大值。
当 \(j\) 等于 0 时，那么上一个数为一段的结尾，就要求上一个数不能隐藏。

总结

写完代码要注意优化常数，看清数据范围。
最小生成树可以使用 \(Prim\) 或 \(Kruskal\)。稠密图 \(Prim\) 优为 \(O(n^2)\)，稀疏图 \(Kruskal\) 优为 \(O(m\log m+\alpha(n))\)。
\(Prim\) 可以用优先队列做到 \(O(m\log m)\)。
打表找规律，但不要找无意义的规律，不要在这方面浪费太多时间。
尝试画图，把数值放到二维平面上或许能很快得到结论。
求经过若干操作得到最终序列有多少个，一般问什么就从什么方向考虑，即直接求最终序列满足的条件，用 DP 等构造最终序列。
写网络流一定要建模正确，不然假了写这么长的网络流就太浪费时间了。