终于补完离线算法了(
莫队是三大离线算法之一(毒瘤且少用的线段树分治不算),同时也是许多人入坑的第一种离线算法。虽然思路比较简单,但是莫队题型多、容易出错、写代码时常常粗心,部分理论可能难以理解,本创作计划旨在帮助读者完善莫队知识盲点、学习带修和回滚莫队的思想(因为网上的资源比较难懂,本人也曾深受其害)。
关于莫队,有个特点是代码比较好写,常数也很小。难绷三大离线算法两个(莫队和整体二分)常数小得逆天容易跑得比同复杂度甚至更优复杂度解法快还特别适合 O2 一个(CDQ 分治)就常数大(使用大量 sort 的话还会明显变慢)然后天天被 K-D 树和多维分块(WorldMachine%%%)打压。
莫队是什么
> 莫队算法是由莫涛提出的算法.在莫涛提出莫队算法之前,莫队算法已经在 Codeforces 的高手圈里小范围流传,但是莫涛是第一个对莫队算法进行详细归纳总结的人.莫涛提出莫队算法时,只分析了普通莫队算法,但是经过 OIer 和 ACMer 的集体智慧改造,莫队有了多种扩展版本.
> 莫队算法可以解决一类离线区间询问问题,适用性极为广泛.同时将其加以扩展,便能轻松处理树上路径询问以及支持修改操作.(from OI-wiki)
从一道模板题入手。
P2709 【模板】莫队 / 小B的询问
题目描述
小 B 有一个长为 nnn 的整数序列 aaa,值域为 [1,k][1,k][1,k]。
他一共有 mmm 个询问,每个询问给定一个区间 [l,r][l,r][l,r],求:
∑i=1kci2\sum\limits_{i=1}^k c_i^2 i=1∑k ci2
其中 cic_ici 表示数字 iii 在 [l,r][l,r][l,r] 中的出现次数。
小 B 请你帮助他回答询问。
输入格式
第一行三个整数 n,m,kn,m,kn,m,k。
第二行 nnn 个整数,表示小 B 的序列。
接下来的 mmm 行,每行两个整数 l,rl,rl,r。
输出格式
输出 mmm 行,每行一个整数,对应一个询问的答案。
说明/提示
【数据范围】
对于 100%100\%100% 的数据,1≤n,m,k≤5×1041\le n,m,k \le 5\times 10^41≤n,m,k≤5×104。
总之就是询问你一个区间里每个数出现次数的平方加起来是多少。
这题维护的东西用普通 ds 和算法维护看上去很不可做。如果用暴力呢?
我们只需要定义一个 cnt 数组,定义 cnticnt_icnti 表示数值 i 在序列中出现的次数。当加入一个新数时,把当前答案加上这个原来出现的次数再 +1 就行了。很容易证明正确性。但是这样复杂度是 O(NM)O(NM)O(NM).
而莫队算法仅用了一个排序的技巧,就优化了时间复杂度。如何做到?
首先,假设我们有大量询问:
(画得丑致歉)
注意到不同区间有很多重复的地方,在询问中会被重复计算,这个地方能不能节省呢?
先看看以下情况:
只需要将粉色区间左端点略微右移,右端点也右移就与绿色区间一样了。
莫队为了节省这些计算,将数列分为 N\sqrt NN 块(假设 N=M),每一块长度为 N\sqrt NN .接下来对询问进行排序,将询问按左端点所在的块从左到右排序,左端点所在块一样则按右端点升序排序。然后按照排序顺序从前到后处理询问,存储上一次询问的左端点和右端点,并对其进行移动使得左端点和右端点与当前询问吻合,然后存储当前答案。
对于本题,左端点和右端点的移动都是 O(1)O(1)O(1) 的。
时间复杂度是多少?
每次处理新的询问,左端点和右端点都会进行移动。对于左端点的移动,由于对左端点所在块排序,所以一个块内询问左端点的移动一次是 O(N)O(\sqrt N)O(N ). 如果要到右边的块,由于一个块长度为 N\sqrt NN , 也只需要 O(N)O(\sqrt N)O(N ) 的时间复杂度进行一次移动。总共进行 M 次移动,因此所有左端点移动的时间复杂度是 O(MN)O(M\sqrt N)O(MN ).
那么右端点的移动呢?对于每个块内的询问,右端点是从小到大递增的,所以一个块内右端点的移动共为 N 次,总共有 N\sqrt NN 个块,所以移动右端点的时间复杂度为 O(NN)O(N\sqrt N)O(NN ).
两者相加,O(MN)+O(NN)=O(NN)O(M\sqrt N)+O(N\sqrt N)=O(N\sqrt N)O(MN )+O(NN )=O(NN )(N=M)
本题要怎么移动左端点和右端点?当左端点向左时,新添加的数 x 给答案做的贡献是 (cntx+1)2−cntx2=2×cntx+1(cnt_x+1)^2-cnt_x^2=2\times cnt_x+1(cntx +1)2−cntx2 =2×cntx +1, 因此我们先将答案加上 2×cntx+12\times cnt_x+12×cntx +1, 再更新 cnt 数组即可。其它移动操作自己推。
本题数据为 1≤n,m,k≤5×1041\le n,m,k \le 5\times 10^41≤n,m,k≤5×104, 时间复杂度正确。
小优化:大部分莫队可以用奇偶性优化减少常数。对于左端点为第奇数块的询问,右端点从左到右排,否则从右到左排。如图所示:
注:实际上是曼哈顿距离,这里为了方便画的是欧式距离。
这个优化最多优化一半的计算量,一般可以提升几十毫秒的速度,但是也有一些数据反而会跑更久。
还有一点需要注意:初始 l=1,r=0. 记住,当莫队需要在 x 和 x+1 直接设置初始位置并向左右分别扩展时,l=x+1,r=x.
以下是本题代码:
这段代码采用的是莫队常用的写法,其中 &1 可以判断一个数是否为奇数。
请对照模板题代码自己理解。
莫队分块
当 N=M 时,分块大小为 N\sqrt NN 最优。但是当 N≠MN\neq MN=M 时,分块为 NM\frac{N}{\sqrt M}M N 是最优的。这时候左端点移动复杂度为 O(M×NM)=O(NM)O(M\times \frac{N}{\sqrt M})=O(N\sqrt M)O(M×M N )=O(NM ), 右端点移动复杂度为 O(M×N)=O(NM)O(\sqrt M\times N)=O(N\sqrt M)O(M ×N)=O(NM ), 总时间复杂度为 O(NM)O(N\sqrt M)O(NM )
普通莫队例题
P1494 [国家集训队] 小 Z 的袜子
自行看题。
如何回答询问?我们需要知道区间内每一种颜色的袜子抽到一样的方案数,除以区间总方案数。区间总方案数的计算是入门的。很明显我们要维护 cntx×(cntx−1)2\frac{cnt_x\times (cnt_x-1)}{2}2cntx ×(cntx −1) . 最后那个 12\frac{1}{2}21 不用维护,因为会约分所以只要总方案数也不乘以 12\frac{1}{2}21 就能抵消了。像上题一样维护 cntx2cnt_x^2cntx2 就行了,维护完还要对每个 xxx 减去 cntxcnt_xcntx (由上式可知), 由于一个区间里所有出现数值 xxx
的出现次数之和就是这个区间的长度,因此求出 ∑cntx\sum{}^{}cnt_x∑cntx 后直接减去区间大小即可。每个查询算完还要进行约分,但是约分时间复杂度较小直接并入总复杂度。以下代码进行了特判,但是似乎这个方法实现不需要特判。
Code:Code:Code:
P1997 FAEBDC 的烦恼
本题其实就是让你求区间众数出现的次数。
普通莫队似乎不能维护删除操作,因为区间众数是回滚莫队才能维护的。但是,不要小看普通莫队啊!
设 maxn 为答案,每个询问不重置 maxn, 仅改动 maxn. 加入操作可以通过 c(cnt) 数组直接维护最大值。那么删除操作如何实现?设 ccicc_icci 为 i 在 c 中出现的次数,删除第 i 个数字时如果 ccci>1cc_{c_i}>1ccci >1 则直接将 cccicc_{c_i}ccci 减一, cic_ici 更新后再将当前 cccicc_{c_i}ccci 加一。当删除元素等于众数且众数只有一个时,依旧维护以上两个数组并将 maxn 减一,因为原来的众数都没了,刚刚删掉一个原来出现了 maxn 次的众数,所以现在这个数出现的次数为 maxn-1.
Code:Code:Code:
P11659 小夫
注意到出题人又让我们维护不是人的东西了,所以容易联想到莫队。怎么维护呢?
维护三个数组:cnt,cnt42,cnt23.
cnticnt_icnti 表示 i 在区间内出现的次数,cnt42icnt42_icnt42i 表示序列中 l≤x<y≤r,ax=4×i,ay=2×il\le x<y\le r,a_x=4\times i,a_y=2\times il≤x<y≤r,ax =4×i,ay =2×i 的二元组数量, cnt23icnt23_icnt23i 表示序列中 l≤x<y≤r,ax=2×i,ay=3×il\le x<y\le r,a_x=2\times i,a_y=3\times il≤x<y≤r,ax =2×i,ay =3×i 的二元组数量。
左端点左移时,加入一个数,先不更新 cnt(因为要用到原来序列的 cnt) ,如果 ala_lal 可以被 4 整除,cnt42al4cnt42_{\frac{a_l}{4}}cnt424al 要加上与 ala_lal 符合 4:2 比的数的个数,即 cntal2cnt_{\frac{a_l}{2}}cnt2al , 同时也更新答案,将答案加上 cnt23al4cnt23_{\frac{a_l}{4}}cnt234al . 如果 ala_lal 可以被 2 整除,cnt23al2cnt23_{\frac{a_l}{2}}cnt232al 要加上 cntal×32cnt_{a_l\times
\frac{3}{2}}cntal ×23 . 其它操作也按这个原理做,注意删除操作要先更新 cnt.
注:数组要开两倍,自己想为什么。
Code:Code:Code:
经过以上锻炼,可以发现莫队的优势是可以维护其它东西很难维护的条件,但是相对应的,莫队是一个离线、不便于修改的算法,具有一定的局限性。
带修莫队
带修莫队有什么用基本没题考
以上的莫队都是只查询不修改的。那要是加上单点修改呢?
对于 CDQ 分治有大量经验的你可能会想到,把时间也看成一个维度进行排序不就行了?将询问进行排序,然后左端点、右端点、时间一起移动成当前询问。时间移动时如果往后移动就按顺序修改,往前就倒序回溯过去。
带修莫队的操作是将元素按左端点所在块排序,一样则按右端点所在块排序,还是一样就按时间从小到大排(一个询问的时间为这个询问前面进行的修改操作的数量)。
但是分块显然要改了,因为如果还是按原来分的话时间维度的总移动复杂度是 O(NM)O(NM)O(NM) ,显然这不是我们想要的。这个时候你会干什么呢?
当块长为 N23N^{\frac{2}{3}}N32 时,左端点移动的时间复杂度是 O(N23×M)=O(MN23)O(N^{\frac{2}{3}}\times M)=O(MN^\frac{2}{3})O(N32 ×M)=O(MN32 ), 右端点移动一样是 O(MN23)O(MN^\frac{2}{3})O(MN32 ), 时间移动是 O(N13×N13×M)=O(MN23)O(N^{\frac{1}{3}}\times N^{\frac{1}{3}}\times M)=O(MN^\frac{2}{3})O(N31 ×N31 ×M)=O(MN32 ), 所以总的时间复杂度还是
O(MN23)O(MN^\frac{2}{3})O(MN32 ).
例题:P1903 【模板】带修莫队 / [国家集训队] 数颜色 / 维护队列
直接上代码。注意本题的单点修改直接将 aci,pa_{c_{i,p}}aci,p 与 ci,colc_{i,col}ci,col 交换(把要修改的原位置值和修改操作的新值调换),这和人不能连续向一个方向跨过同一条河流是一个道理,当你执行了一次修改操作后当前时间就会大于这个操作的所在时间,所以下一次调用这个函数只有一种可能:当前时间在减小,即时间回溯操作,这时候再调换回来即可。
Code:Code:Code:
带修莫队似乎没什么用同时这题还有 O(Nlog2N)O(Nlog^2N)O(Nlog2N) 的树套树和 CDQ 分治解法,学习了 CDQ 分治的读者可以尝试,因为这题其实就是P4690 [Ynoi Easy Round 2016] 镜中的昆虫的弱化版。虽然是 Ynoi easy round 的……
(偷图致歉)
回滚莫队
他们说回滚莫队没用,我觉得有用。
回滚莫队有两种:不删除莫队(有点用)和不添加莫队(有存在必要吗)。不添加莫队我没见过题,更不会做,也不会写,所以不讲,知道怎么计算初始整体状态并且能翻到例题的请容我%%%。
不删除莫队用于莫队算法添加容易删除难的情况。以下是例题:
P14420 [JOISC 2014] 历史的研究 / Historical Research
题目要你求序列内一个数的值乘以这个数出现次数的积的最大值。添加元素只需要将出现次数更新然后取答案最大值就行了。如何删除?
不删除!
接下来我们使用显性分块编码,存储每个位置所在块和每个块的左右端点。
先假设我们的所有询问左右端点都在不同的块上,即右端点所在块在左端点所在块右边。
回滚莫队遍历每一个块,一开始将 l 设为这个块右端点位置+1,r 设在右端点。
然后先扩展右端点。
我们将这个答案保存,然后扩展左端点。
这时候记录答案。这时候,我们将 l 一步步右移,把辅助数组回溯成原来的样子。注意,是回溯不是删除(因为答案没有更改)。
到了下一个询问,初始答案直接设为上次保存的答案就行了,然后在区间基础上扩展右端点,因为右端点是递增的只需要添加,情况又回到了一开始。以此类推,这个块算完了就跳到下一个块。整个过程只用了添加和回溯操作,答案不通过回溯更新(因为答案更新更难)而是直接用上次答案。注意到回溯操作根本不用复杂维护,只要你能确保辅助数组回到上次状态就行。
时间复杂度是多少?左端点的移动一次 O(N)O(\sqrt N)O(N ), 右端点也没变,所以还是 O(NN)O(N\sqrt N)O(NN ) 的时间复杂度。
等等,那左右端点在同一块的询问呢?直接暴力就行了,因为这时候一次暴力 O(N)O(\sqrt N)O(N ).
很容易想到,回滚莫队自然不能用奇偶性优化了。
对于这道例题,我们依旧 cnt 数组,扩展时先更新 cnt 再更新最大值,回溯 cnt 时遇到一个就将它的 cnt 减去 1. 暴力是有手就行的。其实这题就是一道变形的区间众数。
注意看 Code:Code:Code:
闲话:这个模板也是我选的而不是洛谷官方模板,回滚莫队和线段树合并一样都是有一道题既用到知识点又最简单然后被推崇为模板但是官方模板却要经过一定的思考。不过雨天的尾巴这个名字好好听啊你值得模板之名QvQ.
既然已经做出了这道题那么区间众数也很简单了:
P13984 数列分块入门 9
回滚莫队入门9(误)
所以 Ynoi 是不是叫数列分块提高
更新答案时就不用乘以这个数的值了。注意到要求出现次数一样时答案为最小者,所以要保存两个答案:答案出现次数和答案数值大小,方便比较更新。
同时此题告诉我一个很重要的点:调回滚莫队一定要把每次遍历块时初始化的那个(些)变量当作实际维护的答案,不要当成中间值变量。小朋友们不要忘记一开始初始化辅助数组哦。
此题套模板做的 6 分钟一道紫我太强了
Code:Code:Code:
此题的效率也跑到了一个丧心病狂的程度:
接下来是真正的模板题:
P5906 【模板】回滚莫队&不删除莫队
本题独立 3 分钟解出来我太强了我要进省队了
这题可以维护 4 个数组,左端点左移遇到的某数的最左值、左端点右移遇到的某数的最右值、右端点左移遇到的某数的最左值、右端点右移遇到的某数的最右值,最左/最右取左右端点答案的最值即可得到,记得要初始化数组,回溯时将左端点遇到的最左和最右端的值都回溯成初始化时的状态即可。当然我还开了两个数组进行暴力。不会你们学回滚莫队尝试自己默时忘记写暴力了吧。
Code:Code:Code:
回滚莫队的例题有点少,但是当比赛遇到普通莫队题然后删除操作怎么都想不出来时应该可以试试回滚偷 AC.
莫队+根号分治/值域分块
莫队算法需要进行 (N+M)N(N+M)\sqrt N(N+M)N 次增删操作和 MMM 次答案记录操作,这就导致莫队特别适合出一些考察复杂度平衡的题。
P12598 参数要吉祥
别争论扶苏是男的还是女的了,扶苏是一个大语言模型。
由于是非人哉的东西所以可以想到莫队。莫队怎么维护呢?
首先删除和添加可以很容易地维护出现次数 c 和出现次数出现的次数 cc,但是怎么快速地把每个值不为 0 的 ci×cccic_i\times cc_{c_i}ci ×ccci 抓出来呢?
暴力显然不现实。所以……
设分块的大小为 t, 我们先遍历整个数组,把值小于 t(就是 N\sqrt NN ) 的 cic_ici 的值存在一起(这种值最多有 N\sqrt NN 个),另外存储存储满足 ci>tc_i>tci >t 的 i. 因为 c 代表的是一个数出现的次数,而出现次数大于 N\sqrt NN 的数最多只能有 N\sqrt NN 个,所以这部分数的数量最多也是 N\sqrt NN . 随后进入莫队环节,每次移动完区间后遍历这两个表更新答案,每个询问需要 O(N)O(\sqrt N)O(N ) 的时间复杂度,总共 O(MN)O(M\sqrt N)O(MN ), 总体复杂度依然是
O((M+N)N)O((M+N)\sqrt N)O((M+N)N ).
Code:Code:Code:
P4867 GTY的妹子序列
自行读题。
一眼树套树、 K-D 树、 CDQ 分治,但是假设我们除了莫队什么都不会,因为题目的空间是丧心病狂的 32.00MB(说你呢,丧心病狂的 20MB +强制在线的简单题).
有两个约束条件如何莫队?某个金名金钩的大佬发了篇 O((N+M)NlogN)O((N+M)\sqrt Nlog N)O((N+M)N logN) 的所谓题解,但是这题本意完全不是这样,并且这个做法也只有卡常才能过。
本题如果用 O(1)O(1)O(1) 的时间复杂度单点增加或删除一个数、不大于 O(N)O(\sqrt N)O(N ) 的时间查询一个区间内的答案值就可以维持时间复杂度不变,我们只需要更新 cnt, 增加时如果以前没有这个数就按值域插入一个 1, 删除时如果现在没有这个数就设为 0, 最后移动完区间更新答案时求区间值。那么哪里有这样的 ds?
套值域分块模板即可。
Code:Code:Code:
P4396 [AHOI2013] 作业
这题因为没有空间限制所以可以树套树、CDQ 分治、K-D 树。当然也可以从刚才那题的代码上改,新开一个分块存和就行了。2分钟过紫题我进国家集训队吧(其实系复制粘贴上一题然后改)
Code:Code:Code:
结语
莫队其实练的还是基础的一些 ds 和做题的思路,比如我就复习了值域分块,学了 bitset 维护莫队等。应该很久之后才会更新了,不过没有树上莫队和莫队二离的话看这一篇足够了。能不能点个赞大佬们QvQ