快速数论变换(NTT)小结

attack

发布于 2018-05-30 11:35:48

3960

发布于 2018-05-30 11:35:48

文章被收录于专栏：数据结构与算法

NTT

在FFT中，我们需要用到复数，复数虽然很神奇，但是它也有自己的局限性——需要用double类型计算，精度太低

那有没有什么东西能够代替复数且解决精度问题呢？

这个东西，叫原根

原根

原根的定义

设$m$是正整数，$a$是整数，若$a$模$m$的阶等于$\phi(m)$，则称$a$为模$m$的一个原根

定义中用到了群论的一些知识，不过不会也没关系，不影响接下来的学习

我们定义$P$为素数，$g$为$P$的原根

接下来不加证明的扔出一个很重要定理

若$P$为素数，假设一个数$g$是$P$的原根，那么$g^i \mod P (1<g<P,0<i<P)$的结果两两不同

不要问我为什么，因为我也不知道。。

考虑原根为什么能代替单位根进行运算，(这部分可以跳过)

原因很简单，因为它具有和单位根相同的性质

在FFT中，我们用到了单位根的四条性质，而原根也满足这四条性质

1 . 对于所有$\omega_n ^ t (0 \leq t \leq n - 1)$均不相同

这一条可以由上面的定理得到

2 . $\omega_{2n} ^ {2k} = \omega_n ^ k$

通过代换可以得到

3 . $\omega_n ^ { k + \frac{n}{2} } = -\omega_n ^ k$

根据费马小定理和性质1可以得到

4 . $1 + \omega_n ^ k + (\omega_n ^ k) ^ 2 + \dots + (\omega_n ^ k) ^ {n - 1} = 0 $

由性质3和FFT中傅里叶逆变换的定理可以得到

这样我们最终可以得到一个结论

\[\omega_n \equiv g^\frac{p-1}{n} \mod p\]

然后把FFT中的$\omega_n$都替换掉就好了

$p$建议取$998244353$，它的原根为$3$。

如何求任意一个质数的原根呢？

可以证明满足$g^r \equiv 1(\mod p)$的最小的$r$一定是$p-1$的约数

对于质数$p$，质因子分解$p−1$，若$g^{\frac{p-1}{p_i}} \neq 1 \pmod p$恒成立，$g$为$p$的原根

实现

NTT求卷积代码:

确实比FFT快了不少

#include<cstdio>
#define getchar() (p1 == p2 && (p2 = (p1 = buf) + fread(buf, 1, 1<<21, stdin), p1 == p2) ? EOF : *p1++)
#define swap(x,y) x ^= y, y ^= x, x ^= y
#define LL long long 
const int MAXN = 3 * 1e6 + 10, P = 998244353, G = 3, Gi = 332748118; 
char buf[1<<21], *p1 = buf, *p2 = buf;
inline int read() { 
    char c = getchar(); int x = 0, f = 1;
    while(c < '0' || c > '9') {if(c == '-') f = -1; c = getchar();}
    while(c >= '0' && c <= '9') x = x * 10 + c - '0', c = getchar();
    return x * f;
}
int N, M, limit = 1, L, r[MAXN];
LL a[MAXN], b[MAXN];
inline LL fastpow(LL a, LL k) {
    LL base = 1;
    while(k) {
        if(k & 1) base = (base * a ) % P;
        a = (a * a) % P;
        k >>= 1;
    }
    return base % P;
}
inline void NTT(LL *A, int type) {
    for(int i = 0; i < limit; i++) 
        if(i < r[i]) swap(A[i], A[r[i]]);
    for(int mid = 1; mid < limit; mid <<= 1) {  
        LL Wn = fastpow( type == 1 ? G : Gi , (P - 1) / (mid << 1));
        for(int j = 0; j < limit; j += (mid << 1)) {
            LL w = 1;
            for(int k = 0; k < mid; k++, w = (w * Wn) % P) {
                 int x = A[j + k], y = w * A[j + k + mid] % P;
                 A[j + k] = (x + y) % P,
                 A[j + k + mid] = (x - y + P) % P;
            }
        }
    }
}
int main() {
    N = read(); M = read();
    for(int i = 0; i <= N; i++) a[i] = (read() + P) % P;
    for(int i = 0; i <= M; i++) b[i] = (read() + P) % P;
    while(limit <= N + M) limit <<= 1, L++;
    for(int i = 0; i < limit; i++) r[i] = (r[i >> 1] >> 1) | ((i & 1) << (L - 1));  
    NTT(a, 1);NTT(b, 1);    
    for(int i = 0; i < limit; i++) a[i] = (a[i] * b[i]) % P;
    NTT(a, -1); 
    LL inv = fastpow(limit, P - 2);
    for(int i = 0; i <= N + M; i++)
        printf("%d ", (a[i] * inv) % P);
    return 0;
}

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2018-05-02 ，如有侵权请联系 cloudcommunity@tencent.com 删除

double