质数检验有不少算法,一般使用的质数检验复杂度是O(n)O(\sqrt{n})

又如线性筛可以在O(n)O(n)的时间内求出所有1~n的质数

但是,当n非常大,连O(n)O(\sqrt{n})的复杂度也难以接受时,上述算法便不能满足要求

这篇blog记录了一些关于Miller_Rabin算法的内容


大家都知道的著名的费马小定理:

ap11(modp)a^{p-1}\equiv1\pmod p

其中a,pa,p互质

我们猜想,任意选取aa,如果一个数pp满足以上式子,那么它就很有可能是一个质数

但是这个猜想很容易找到反例:a=2a=2p=341,561,645,1105p=341,561, 645, 1105时,费马小定理逆命题不成立,人们把ap11(modp)a^{p-1}\equiv1\pmod p的合数称为以aa为底的“伪素数”

[1,109][1,10^9]中,质数一共有5084753450847534个,而满足2p11(modp)2^{p-1}\equiv1\pmod p的合数pp55975597个,算法出错的概率太高了

一个想法是,同时使用多个a来进行判断,例如同时检验a=2,3a=2,3

[1,109][1,10^9]中,同时以2,32,3为底的伪素数只有12721272个,不到以2为底的14\frac{1}{4}

选取的aa越多时,算法越准确,这便是费马素性检验

(以下内容引自Matrix67的博客)

人们自然会想,如果考虑了所有小于n的底数a,出错的概率是否就可以降到0呢?没想到的是,居然就有这样的合数,它可以通过所有a的测试(这个说法不准确,详见我在地核楼层的回复)。Carmichael第一个发现这样极端的伪素数,他把它们称作Carmichael数。你一定会以为这样的数一定很大。错。第一个Carmichael数小得惊人,仅仅是一个三位数,561。前10亿个自然数中Carmichael数也有600个之多。Carmichael数的存在说明,我们还需要继续加强素性判断的算法。

由此观之,费马素性检验仍不能满足我们的要求,我们需要改进素性检验算法


引理:

对于a<p\forall a<ppp是质数

a21(modp)a^2\equiv1\pmod p

那么有a=1a=1a=p1a=p-1

证明:

a21(modp)a^2\equiv1\pmod p

a21=(a+1)(a1)0(modp)\Rightarrow a^2-1=(a+1)*(a-1)\equiv0\pmod p

Miller_Rabin素数测试的方法是,对于待检验数xx,不断地提取x1x-1中的因子22,把x1x-1表示成2rd2^r*d的形式,那么我们需要计算的东西变成了a2rdmodxa^{2^r*d}\mod x

于是,如果xx是质数,a2rdmodxa^{2^r*d}\mod x要么等于11,要么等于x1x-1

如果a2r1dmodx=1a^{2^{r-1}*d}\mod x =1,定理同样适用于a2r2dmodxa^{2^{r-2}*d}\mod x

不断地开方,直到存在一个i[0,r)i\in[0,r),使得a2idmodx=x1a^{2^i*d}\mod x=x-1

至此,费马素性检验被强化为如下形式:

尽可能提取因子22,将待检验数xx表示为2rd2^r*d的形式,其中dd是一个奇数
如果admodn=1a^d\mod n=1,或者找到一个i[0,r)i\in[0,r),使得a2idmodx=x1a^{2^i*d}\mod x=x-1,那么xx极有可能是一个质数,否则xx就不是一个质数

上文提到极有可能,是因为Miller_Rabin同样是不确定算法,我们称能够通过以aa为底的Miller_Rabin检验的合数称为以aa为底的“强伪素数”,第一个以22为底的强伪素数为20472047,而第一个以2233为底的强伪素数则为1373653

如果选用2,3,7,612,3,7,612425124251作为aa,那么101610^{16}内唯一的强伪素数为46 856 248 255 98146\space856\space248\space255\space981,正确率可以接受


Miller_Rabin核心代码

这里,我采用先将n-1的所有因子2提取出来,再不断地平方回到原来的n-1的枚举方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
typedef long long ll;
const ll a[10]={0,2,3,7,61,24251};

ll fastpow(ll a,ll b,ll p)
{
ll re=1,base=a;
while(b)
{
if(b&1)
re=re*base%p;
base=base*base%p;
b>>=1;
}
return re;
}

bool Miller_Rabin(ll x,ll a)
{
if(x==a)
return true;
if(x%a==0 || x<2)
return false;
ll d=x-1,r=0;
while(!(d&1))
{
d>>=1;
++r;
}
ll k=fastpow(a,d,x);
if(k==1 || k==x-1)
return true;
for(ll i=1;i<r;++i)
{
k=k*k%x;
if(k==x-1)
return true;
}
return false;
}

bool test(ll x)
{
for(int i=1;i<=5;++i)
if(!Miller_Rabin(x,a[i]))
return false;
return true;
}

题外话

由于水平及时间有限,博客中可能存在较多疏漏,希望读者能够指出,非常感谢

撰写过程中,很多内容参考了matrix67的博客,在此表示感谢

参考出处:http://www.matrix67.com/blog/archives/234