【密码学百科】离散对数与配对密码学：从 DLP 到 BLS 签名

在公钥密码学的版图中，离散对数问题（Discrete Logarithm Problem, DLP）与大整数分解问题并驾齐驱，共同构成了绝大多数经典方案的安全根基。从 Diffie-Hellman 密钥交换到 ElGamal 加密，从 DSA 数字签名到椭圆曲线密码体制，几乎每一个被广泛部署的协议都可以追溯到”给定群元素 g 和 h = g^x，求解 x”这一看似简单却在计算上极为困难的数学问题。更进一步，当我们在椭圆曲线上引入双线性配对（Bilinear Pairing）这一强大的代数工具后，离散对数的困难性假设便催生出 BLS 短签名、身份基加密（Identity-Based Encryption, IBE）等一系列革命性的密码学构造。本文将从 DLP 的形式化定义出发，逐层剖析攻击算法的演进、困难性假设的层次体系，以及配对密码学的核心应用。

一、离散对数问题的形式化定义

先看一张图，把这一节的关键关系串起来。

graph TD
    A[DLP] --> B[ECDLP]
    B --> C[配对映射]
    C --> D[GT 上 DLP]
    D --> E[参数与安全级别]

1.1 一般群上的 DLP

设 G 是一个阶为 n 的有限循环群，g 是 G 的一个生成元。给定群元素 h ∈ G，离散对数问题要求找到整数 x ∈ {0, 1, …, n-1}，使得 g^x = h。我们将 x 记作 log_g(h)。在乘法群的记号下，这是一个幂运算的逆问题；在椭圆曲线加法群的记号下，则变成”给定点 P 和 Q = xP，求标量 x”的问题。

DLP 的困难性高度依赖于群的具体结构。在某些群上（例如整数加法群 Z/nZ），离散对数可以用扩展欧几里得算法在多项式时间内求解；而在另一些精心选取的群上（如大素数阶椭圆曲线群），目前已知的最好算法也需要指数级时间。因此，密码学中使用的群必须经过严格筛选。

1.2 椭圆曲线离散对数问题（ECDLP）

设 E 是定义在有限域 F_q 上的椭圆曲线，P 是 E(F_q) 上的一个 n 阶基点。给定点 Q = xP，ECDLP 要求恢复标量 x。ECDLP 是 DLP 在椭圆曲线加法群上的特化形式，其核心优势在于：迄今为止没有已知的亚指数时间算法可以攻破一般椭圆曲线上的 ECDLP。这使得椭圆曲线密码在相同安全等级下，可以使用比有限域乘法群短得多的密钥长度。

1.3 计算性 DH 与判定性 DH

离散对数问题衍生出一系列重要的计算假设。计算性 Diffie-Hellman 假设（Computational Diffie-Hellman, CDH）声称：给定 g、g^a、gb，计算 g^{ab} 在计算上是不可行的。判定性 Diffie-Hellman 假设（Decisional Diffie-Hellman, DDH）则更进一步：给定 g、g^a、gb 和一个群元素 T，判断 T 是否等于 g^{ab} 在计算上与随机猜测无异。显然，DLP 的困难性蕴含 CDH 的困难性，而 CDH 的困难性蕴含 DDH 的困难性，但反过来并不一定成立。这一层次结构在安全性证明中扮演着关键角色。

从更深层的角度看，离散对数问题的困难性引出了密码学中一个根本性的哲学问题：我们凭什么相信 DLP 是困难的？答案令人不安——我们没有证明，只有经验证据。数学家们在这个问题上努力了一个多世纪（如果追溯到高斯对指标的研究则更久），至今未能找到一般椭圆曲线群上的亚指数算法。但「长时间找不到」并不等于「不存在」——RSA 的安全性在 1993 年之前看起来也很稳固，直到数域筛法将大整数分解的复杂度实质性地降低。笔者认为，每一个基于 DLP 的密码系统本质上都是对人类数学创造力有限性的一种赌注。这种赌注在过去五十年中被证明是明智的，但保持对这一事实的清醒认知——我们是在没有证据证明安全的情况下假设安全——是密码学从业者应有的知识诚实。

二、通用攻击算法

所谓”通用”攻击算法，是指仅将群视为黑盒（只使用群运算和等式判断），而不利用群的任何特殊代数结构的算法。Shoup 在 1997 年证明了一个著名的下界：在泛型群模型（Generic Group Model）中，任何求解 DLP 的算法至少需要 O(√n) 次群运算。以下三类算法逼近或达到了这个下界。

2.1 Baby-step Giant-step 算法

Baby-step Giant-step（BSGS）算法由 Daniel Shanks 于 1971 年提出，是一种经典的时空折中（time-space tradeoff）方法。其核心思想是将离散对数 x 写成 x = im + j 的形式，其中 m = ⌈√n⌉，0 ≤ j < m，0 ≤ i < m。算法分两个阶段进行：

Baby-step 阶段：计算并存储所有 g^j（j = 0, 1, …, m-1），将这些值存入哈希表。

Giant-step 阶段：令 γ = g^{-m}，依次计算 h·γ^i（i = 0, 1, 2, …），并在哈希表中查找匹配。一旦找到 h·γ^i = g^j，则 x = im + j。

该算法的时间复杂度和空间复杂度均为 O(√n)，达到了泛型群模型下的最优渐近复杂度。以下是一个简洁的 Python 实现：

import math

def baby_step_giant_step(g: int, h: int, p: int, n: int) -> int:
    """
    求解离散对数 g^x ≡ h (mod p)，其中 g 的阶为 n。
    使用 Baby-step Giant-step 算法，时间与空间复杂度均为 O(√n)。
    """
    m = math.isqrt(n) + 1

    # Baby-step: 构建查找表 {g^j mod p : j}
    table = {}
    power = 1
    for j in range(m):
        table[power] = j
        power = power * g % p

    # Giant-step: 计算 g^{-m} mod p
    giant_stride = pow(g, -m, p)

    # 逐步搜索匹配
    current = h
    for i in range(m):
        if current in table:
            x = i * m + table[current]
            return x % n
        current = current * giant_stride % p

    raise ValueError("未找到离散对数（请检查输入参数）")

if __name__ == "__main__":
    # 示例：在模 p = 1019 的乘法群中求解 2^x ≡ 5 (mod 1019)
    p = 1019
    g = 2
    h = 5
    n = p - 1  # Z/pZ* 的阶为 p-1
    x = baby_step_giant_step(g, h, p, n)
    print(f"离散对数 x = {x}")
    assert pow(g, x, p) == h, "验证失败"
    print("验证通过：g^x ≡ h (mod p)")

2.2 Pohlig-Hellman 算法

当群的阶 n 可以分解为小素数的乘积时，Pohlig-Hellman 算法能够将 DLP 分解为若干阶更小的子问题。具体而言，若 n = p_1^{e_1} · p_2^{e_2} · … · p_k^{e_k}，则可以分别在每个 p_i^{e_i} 阶子群上求解离散对数，再用中国剩余定理（CRT）将结果合并。每个子问题的规模仅与 p_i 有关，因此当 n 的所有素因子都很小时，Pohlig-Hellman 算法可以高效求解 DLP。

这正是密码学中要求群阶含有大素因子的根本原因。实践中，我们通常选取阶为大素数 n 的循环群，使得 Pohlig-Hellman 算法退化为对整个群的直接攻击，无法获得任何加速。

2.3 Pollard’s rho 与 kangaroo 算法

Pollard’s rho 算法是一种随机化的碰撞搜索方法。它定义一个伪随机迭代函数 f: G → G，从某个初始值出发不断迭代，寻找一对碰撞 f^i(x_0) = f^j(x_0)（i ≠ j）。由于群是有限的，迭代序列必然进入一个循环，其形状类似希腊字母 ρ，算法因此得名。利用 Floyd 的环检测算法或 Brent 的改进版本，Pollard’s rho 算法可以在期望 O(√n) 次群运算和 O(1) 空间内求解 DLP，相较于 BSGS 在空间复杂度上有显著优势。

Pollard’s kangaroo 算法（又称 lambda 算法）则适用于已知离散对数 x 落在某个区间 [a, b] 内的场景。它通过模拟两只”袋鼠”在群上跳跃来寻找碰撞，期望复杂度为 O(√(b-a))。此外，Pollard’s rho 算法天然适合并行化：van Oorschot 和 Wiener 提出的”杰出点”方法（distinguished points）使得 M 个处理器可以将运行时间降低为 O(√n / M)，具有理想的线性加速比。这也是当前评估 ECDLP 实际安全性时最重要的参考算法。

三、Index Calculus 与亚指数算法

3.1 算法框架

Index Calculus 是攻击有限域乘法群 (Z/pZ)* 上 DLP 的最有效方法，也是使得有限域 DLP 与椭圆曲线 DLP 在安全等级上产生本质差异的核心原因。其基本框架分为三个阶段：

因子基选取：选定一个由小素数组成的因子基 B = {p_1, p_2, …, p_k}。因子基的大小 k 是算法效率的关键参数。

关系收集：随机选取指数 r，计算 g^r mod p，检验其是否为 B-光滑数（即所有素因子都在因子基中）。若是，则得到一个形如 r ≡ ∑ e_i · log_g(p_i) (mod n) 的线性关系。重复此步骤直到收集到足够多（略多于 k 个）的线性无关关系。

线性代数求解：在模 n 的整数环上求解所收集的线性方程组，得到因子基中每个元素的离散对数 log_g(p_i)。

目标计算：对目标元素 h，随机选取 s，计算 h · g^s mod p 直到得到一个 B-光滑数，然后利用已知的 log_g(p_i) 即可算出 log_g(h)。

3.2 复杂度与光滑数概率

Index Calculus 的复杂度取决于”随机整数为 B-光滑的概率”。由数论中的 Canfield-Erdos-Pomerance 定理，当因子基的界选为 L(p) = exp(c · (ln p)^{1/2} · (ln ln p)^{1/2}) 时，算法达到亚指数复杂度 L_p(1/2, c)。更精细的变体——数域筛法（Number Field Sieve, NFS）将复杂度进一步降低到 L_p(1/3, (64/9)^{1/3})，这是当前攻击大素数有限域 DLP 的最优渐近算法。

3.3 为何 Index Calculus 不适用于椭圆曲线

Index Calculus 的核心依赖于两个前提：一是群元素可以自然地”分解”为更小的”因子”；二是光滑元素在群中以可观的概率出现。在有限域乘法群中，整数的素因数分解天然提供了这种结构。然而，在椭圆曲线群上，点的坐标虽然是有限域中的元素，但椭圆曲线群运算与有限域乘法之间没有保持因子分解结构的同态映射。换言之，两个椭圆曲线点的和在坐标层面并不表现为坐标的某种”乘积”或”组合”。尝试将椭圆曲线点”分解”为更小点的方案迄今都未能产生有效的亚指数算法。

这一本质差异解释了为什么 256 位椭圆曲线群能提供与 3072 位有限域乘法群相当的安全性——前者只能被 O(2^{128}) 的通用攻击所威胁，而后者会被亚指数复杂度的 Index Calculus 削弱。

3.4 NFS 与 TNFS 的复杂度对比

数域筛法（Number Field Sieve, NFS）及其塔式变体（Tower NFS, TNFS）是当前攻击有限域 DLP 最重要的算法家族。理解它们的复杂度差异对于正确评估配对密码学的安全参数至关重要。

首先回顾 L-记号的定义。对于正整数 N，L-记号定义为：

L_N[α, c] = exp(c · (ln N)^α · (ln ln N)^{1-α})

当 α = 0 时退化为多项式复杂度，α = 1 时退化为指数复杂度，0 < α < 1 则表示亚指数复杂度。NFS 类算法的复杂度均处于 α = 1/3 的亚指数区间。

以下是各变体的复杂度对比：

算法	复杂度	目标	备注
一般数域筛法（GNFS）	L_p[1/3, (64/9)^{1/3}] ≈ L_p[1/3, 1.923]	Z/pZ	素数域 DLP 的标准攻击
特殊数域筛法（SNFS）	L_p[1/3, (32/9)^{1/3}] ≈ L_p[1/3, 1.526]	特殊形式的 Z/pZ	适用于 p 具有稀疏多项式表示的情形
塔式数域筛法（TNFS）	L_{p^k}[1/3, c]，c 取决于 k	F_{p^k}	Kim-Barbulescu 2016 年提出
扩展塔式数域筛法（exTNFS）	L_{p^k}[1/3, c’]	F_{p^k}，扩展次数为合数	目前最具攻击性的变体

TNFS 的出现对配对密码学的参数选择产生了深远影响。在 Kim 和 Barbulescu 于 2016 年发表相关工作之前，人们在评估扩域 F_{p^k} 上 DLP 的难度时，通常直接将扩域视为一个整体，使用 GNFS 的复杂度 L_{p^k}[1/3, 1.923] 来估计安全强度。以 BN256 曲线为例（p ≈ 2^{256}，嵌入度 k = 12），其目标域 F_{p^{12}} 的规模约为 3072 比特。按照 GNFS 的估计，攻击复杂度对应约 128 比特安全性。然而，TNFS 充分利用了扩域的塔式结构（即 F_{p^k} 可以通过中间子域逐层构建），使得筛选过程的效率大幅提升。经 TNFS 重新评估后，BN256 曲线的实际安全强度降至约 100-110 比特，远低于此前的预期。

这一发现直接驱动了配对友好曲线的参数迁移。社区从 BN254（p ≈ 2^{254}）转向 BLS12-381（p ≈ 2^{381}），后者的目标域规模为 k · log₂(p) ≈ 12 × 381 ≈ 4572 比特，在 TNFS 攻击模型下重新提供了约 128 比特的安全余量。这也是为什么 Zcash、Ethereum 2.0 等项目均选择 BLS12-381 作为其配对运算的标准曲线——它在当前已知攻击技术下具有充足的安全边际。

下表总结了 TNFS 出现前后，达到 128 比特安全等级所需的配对友好曲线参数变化：

参数	BN-254（TNFS 前）	BN-384（过渡方案）	BN-461（保守方案）	BLS12-381（当前标准）
素数域 p 比特数	254	384	461	381
目标域 F_{p^{12}} 比特数	3048	4608	5532	4572
GNFS 估计安全强度	~128 bit	~192 bit	~224 bit	~186 bit
TNFS 修正安全强度	~100 bit	~126 bit	~138 bit	~128 bit
G_1 点压缩大小（字节）	32	48	58	48
G_2 点压缩大小（字节）	64	96	116	96

可以看出，TNFS 攻击使得原本”刚好够用”的 BN-254 参数变得明显不足。社区曾讨论过直接放大 BN 曲线的素数域（如 BN-384、BN-461）来恢复安全余量，但最终选择了 BLS12-381 曲线——它在 TNFS 攻击模型下提供约 128 比特安全性，同时在配对运算效率上优于同等安全强度的 BN 曲线（BLS 曲线的参数结构更适合 optimal ate 配对的优化实现）。

从工程角度而言，TNFS 的教训十分深刻：有限域扩域上 DLP 的安全性评估不能简单地将域规模代入 GNFS 公式，而必须考虑扩域的内部代数结构。这意味着配对密码学的参数选择需要持续跟踪 NFS 家族算法的最新进展，任何新的筛法改进都可能导致现有参数的安全余量缩水。

四、ECDLP 的特殊性

4.1 无已知亚指数攻击

如上所述，一般椭圆曲线上的 ECDLP 目前没有已知的亚指数时间算法。最优的通用攻击仍然是 Pollard’s rho，其复杂度为 O(√n) ≈ O(2^{n/2})（n 为群阶的比特长度）。这意味着 256 位曲线提供约 128 位安全性，521 位曲线提供约 260 位安全性。

但需要强调的是，这一结论仅适用于”一般”椭圆曲线。某些特殊类型的曲线存在额外的攻击向量，密码学实践中必须仔细规避。

4.2 GHS 攻击与 Weil 下降

Gaudry、Hess 和 Smart 于 2002 年提出的 GHS 攻击（也称 Weil 下降攻击）利用了定义在二元扩域 F_{2^n} 上的椭圆曲线的特殊结构。其核心思想是：通过 Weil 限制（restriction of scalars），将 F_{2^n} 上的椭圆曲线 ECDLP 转化为 F_2 上更高亏格代数曲线的 Jacobian 群上的 DLP。如果转化后曲线的亏格足够大，就可以对其 Jacobian 群应用 Index Calculus 的变体算法。

GHS 攻击对某些特定参数的二元曲线是有效的，这直接影响了标准化建议。例如，NIST 曲线中的某些二元曲线（如 B-163 在特定条件下）受到了 GHS 攻击的威胁，这也是近年来密码学界逐渐转向大素数域曲线（如 Curve25519、P-256）的原因之一。

4.3 超奇异曲线与 MOV 攻击

超奇异椭圆曲线（Supersingular Elliptic Curves）的嵌入度（embedding degree）很小（对于特征大于 3 的域，嵌入度至多为 2）。Menezes、Okamoto 和 Vanstone 于 1993 年指出，可以利用 Weil 配对将超奇异曲线上的 ECDLP 归约到有限域扩域的乘法群 DLP，后者可以用 Index Calculus 攻击。这就是著名的 MOV 攻击。类似地，Frey 和 Ruck 利用 Tate 配对给出了更一般的归约。

MOV 攻击告诉我们，并非所有椭圆曲线都适合用于密码学——曲线的嵌入度必须足够大，使得归约后的有限域扩域足够大，Index Calculus 在该扩域上仍然不可行。然而有趣的是，配对密码学恰恰是反过来利用这些配对：选取嵌入度适中的曲线，使得配对可以高效计算，同时归约后的有限域上 DLP 仍然困难。

五、DLP 的困难性假设家族

现代密码学方案的安全性证明通常不直接归约到 DLP 本身，而是归约到一系列精细化的困难性假设。这些假设之间存在清晰的蕴含关系层次。

5.1 核心假设链

DLP（离散对数假设）：给定 g 和 g^x，求 x 是困难的。这是最强的假设，意味着如果 DLP 可解，则以下所有假设都被打破。

CDH（计算性 Diffie-Hellman）：给定 g、g^a、gb，计算 g^{ab} 是困难的。CDH 弱于 DLP——能解 DLP 自然能解 CDH，但反过来不一定。然而在许多实际群上，两者被认为是等价的。

DDH（判定性 Diffie-Hellman）：给定 (g, g^a, g^b, T)，判断 T = g^{ab} 还是 T 是随机群元素，在计算上是不可行的。DDH 是最弱的，也是最常用于安全性证明的假设。ElGamal 加密的 IND-CPA 安全性就归约到 DDH。

蕴含关系为：DLP 困难 ⟹ CDH 困难 ⟹ DDH 困难。

5.2 Gap-DH 假设

在某些群上，DDH 是容易的（例如存在高效配对的椭圆曲线群），但 CDH 仍然是困难的。这种群被称为 Gap-DH 群。形式化地，Gap-DH 假设声称：即使给定一个可以高效判断 DDH 元组的预言机（oracle），计算 CDH 仍然是困难的。BLS 签名方案的安全性正是建立在 Gap-CDH 假设之上。

5.3 SXDH 与外部 DH 假设

在非对称配对（Type III pairing）e: G_1 × G_2 → G_T 的设定中，对称外部 Diffie-Hellman 假设（Symmetric External Diffie-Hellman, SXDH）声称 DDH 在 G_1 和 G_2 上都是困难的。这要求 G_1 和 G_2 之间不存在高效的同态映射。SXDH 是构造高效的基于配对的密码方案（特别是 Groth-Sahai 证明系统和许多属性基加密方案）的重要基础假设。

5.4 困难性假设的层次关系图

下图以文本形式展示了 DLP 相关假设之间的蕴含关系。箭头方向表示「困难性蕴含」，即左侧假设的困难性蕴含右侧假设的困难性：

                      核心假设链（标准群）
                      ==================
              DLP ====> CDH ====> DDH
         （求离散对数）  （计算 g^ab）  （判定 g^ab vs 随机）
              |
              |  能解 DLP => 能解 CDH => 能解 DDH
              |  但反向不一定成立
              v

                    Gap 假设（配对群）
                    ================
           在存在 DDH 预言机的条件下，CDH 仍然困难
           Gap-CDH：BLS 签名的安全基础
           （配对使 DDH 变得容易，但 CDH 依然困难）

                  配对相关假设
                  ============
           DBDH：判定 e(g,g)^{abc} vs 随机
               （Boneh-Franklin IBE 的安全基础）
           SXDH：DDH 在 G_1 和 G_2 上同时困难
               （Groth-Sahai 证明系统的安全基础）

                  q-type 假设（参数化假设）
                  ========================
           q-SDH：给定 (g, g^s, g^{s^2}, ..., g^{s^q})，
                  计算 (c, g^{1/(s+c)}) 仍然困难
               （Boneh-Boyen 短签名的安全基础）
           q-BDHE：给定 g^{s^i} (i≠q+1)，
                  计算 e(g,g)^{s^{q+1}} 仍然困难
               （广播加密、ABE 方案的安全基础）

上述假设的一般规律是：越靠近 DLP 的假设越「强」（越难被打破），方案设计者希望归约到尽可能弱的假设（越接近 DDH 或标准假设越好），而 q-type 假设和配对假设则是为了实现特定高级功能而不得不引入的「代价」。

个人思考。 假设层次结构在实践中的意义远比理论论文中的一句「安全性归约到 X 假设」要深刻得多。它本质上回答了一个关乎方案寿命的问题：当攻击技术进步时，你的方案能撑多久？归约到 DDH 的方案，只要 DDH 不被打破就安然无恙；而归约到某个 q-type 假设的方案，其安全性取决于一个参数化的、研究历史更短的假设——一旦该假设被发现存在非平凡攻击，方案就可能瞬间失效。这就是为什么密码学家在设计新方案时总是追求「假设最小化」——不是出于审美偏好，而是因为更弱的假设意味着更大的安全余量，你的方案在攻击者和数学家的持续进攻下能够存活更久。在我看来，选择密码方案时查看其依赖的假设层级，应该像查看食品保质期一样成为一种本能。

六、双线性配对回顾

6.1 定义与性质

双线性配对是一个映射 e: G_1 × G_2 → G_T，其中 G_1、G_2 是阶为素数 r 的加法群（通常是椭圆曲线群），G_T 是同阶的乘法群（通常是有限域扩域的乘法子群）。配对满足三个关键性质：

双线性（Bilinearity）：对所有 P ∈ G_1、Q ∈ G_2 和整数 a、b，有 e(aP, bQ) = e(P, Q)^{ab}。

非退化性（Non-degeneracy）：存在 P ∈ G_1、Q ∈ G_2 使得 e(P, Q) ≠ 1_{G_T}。

可计算性（Computability）：存在高效算法计算 e(P, Q)。

Weil 配对和 Tate 配对（及其优化变体 ate 配对、optimal ate 配对）是实践中最重要的两类配对构造。

6.2 配对的类型分类

根据 G_1 与 G_2 的关系，双线性配对被分为三类：

Type I（对称配对）：G_1 = G_2。这要求使用超奇异曲线。优点是方案设计简单，缺点是可选参数受限，效率通常较低。

Type II（非对称配对，存在高效同态）：G_1 ≠ G_2，但存在高效可计算的同态 ψ: G_2 → G_1。这提供了更灵活的方案设计空间。

Type III（非对称配对，无已知高效同态）：G_1 ≠ G_2，且不存在已知的高效同态。Type III 配对提供了最高的效率和最丰富的困难性假设（如 SXDH），是当前实践中的首选。

6.3 配对友好曲线

高效计算配对要求椭圆曲线的嵌入度 k 适中——太小则安全性不足（MOV 攻击），太大则配对计算代价过高。常见的配对友好曲线族包括：

BN 曲线（Barreto-Naehrig）：嵌入度 k = 12，长期以来是 128 位安全等级的标准选择。但近年来由于 NFS 在 F_{p^{12}} 上的改进攻击，BN 曲线的参数需要增大，效率优势有所削弱。

BLS 曲线（Barreto-Lynn-Scott）：嵌入度 k = 12 或 k = 24 等。BLS12-381 曲线因被 Zcash 和 Ethereum 2.0 采用而成为事实标准，在当前安全性评估下提供约 128 位安全性。

KSS 曲线（Kachisa-Schaefer-Scott）：提供更高嵌入度的选择，适用于需要更高安全等级的场景。

七、BLS 签名

7.1 方案描述

BLS 签名方案由 Boneh、Lynn 和 Shacham 于 2001 年提出，是配对密码学最成功的应用之一。其最显著的优点是签名极短——在 BLS12-381 曲线上，一个签名仅需 48 字节（压缩后的 G_1 点），而 ECDSA 签名在相同安全等级下需要 64 字节。

密钥生成：随机选取私钥 sk ∈ Z_r，计算公钥 pk = sk · P_2 ∈ G_2，其中 P_2 是 G_2 的生成元。

签名：将消息 m 哈希到 G_1 上的点 H(m) ∈ G_1，计算签名 σ = sk · H(m) ∈ G_1。

验证：检查等式 e(σ, P_2) = e(H(m), pk) 是否成立。

验证的正确性源于配对的双线性性质：e(sk · H(m), P_2) = e(H(m), P_2)^{sk} = e(H(m), sk · P_2) = e(H(m), pk)。

BLS 签名的安全性在随机预言模型下可以归约到 Gap-CDH 假设：攻击者即使能判断 DDH 元组（通过配对），也无法伪造签名，因为这需要解决 CDH 问题。

7.2 签名聚合

BLS 签名最强大的特性之一是支持高效的签名聚合（Signature Aggregation）。给定 n 个不同签名者对各自消息 m_1, m_2, …, m_n 生成的签名 σ_1, σ_2, …, σ_n，聚合签名只需计算 σ_agg = σ_1 + σ_2 + … + σ_n（G_1 上的点加法）。验证聚合签名时，检查 e(σ_agg, P_2) = ∏_{i=1}^{n} e(H(m_i), pk_i) 即可。

聚合签名将 n 个独立签名压缩为一个群元素，验证时只需一次配对运算加 n 次哈希到曲线的运算（实际上可以通过多配对优化进一步加速）。这在需要批量验证大量签名的场景中具有巨大优势。

当所有签名者签署同一条消息（如区块链共识中的投票）时，情况更加简洁：聚合公钥 pk_agg = ∑ pk_i，验证只需 e(σ_agg, P_2) = e(H(m), pk_agg) 两次配对运算，与签名者数量无关。

7.3 门限 BLS 签名

BLS 签名的代数结构天然支持门限签名（Threshold BLS）。在 (t, n) 门限方案中，n 个参与者各自持有私钥的一个份额 sk_i（通过 Shamir 秘密共享分发），任意 t 个参与者可以合作产生有效签名，而少于 t 个参与者无法获得任何签名信息。

每个参与者 i 计算部分签名 σ_i = sk_i · H(m)，收集 t 个部分签名后，利用拉格朗日插值系数 λ_i 计算完整签名 σ = ∑ λ_i · σ_i。由于椭圆曲线群上的标量乘法和点加法都是线性运算，最终得到的 σ 与使用完整私钥 sk 直接签名的结果完全相同。

7.4 Ethereum 2.0 中的应用

Ethereum 2.0（信标链）的共识机制大量依赖 BLS 签名。每个验证者（validator）使用 BLS12-381 曲线上的 BLS 签名对区块提议和证明（attestation）进行投票。由于验证者数量可达数十万，签名聚合的效率优势至关重要——每个 epoch 中，委员会成员的签名被聚合为单一签名，使得信标链节点只需验证少量聚合签名即可确认共识结果，而非逐一验证数万个独立签名。

此外，Ethereum 的 EIP-2537 提案将 BLS12-381 曲线上的配对运算引入为 EVM 预编译合约，使得智能合约可以在链上高效验证 BLS 签名，为零知识证明验证和跨链桥等应用提供了基础设施。

笔者认为，BLS 签名代表了配对密码学最「干净」的应用——它在一次配对计算中实现了传统方案需要多轮交互才能达到的效果。对比 Schnorr 签名：Schnorr 的安全性证明需要依赖「分叉引理」（Forking Lemma），本质上是通过倒带（rewinding）论证来模拟交互式协议的不可伪造性。而 BLS 签名的安全性直接归约到 Gap-CDH 假设，证明结构简洁得多。更重要的是，BLS 签名的聚合特性不是一个后来「发现」的附加功能，而是配对代数结构的必然推论——群上的线性性使得聚合成为免费的群运算。这种「功能从结构中自然涌现」的特质，在密码学设计中是极为罕见的——大多数密码构造的功能都是工程师刻意「塞进去」的，而 BLS 的聚合性和门限性几乎是数学送给我们的礼物。

八、基于配对的高级构造

8.1 身份基加密（IBE）

Boneh 和 Franklin 于 2001 年提出了第一个实用的身份基加密方案，解决了 Shamir 在 1984 年提出的开放问题。在 IBE 中，用户的公钥直接是其身份标识（如电子邮件地址），无需预先交换公钥证书。

系统建立：可信的密钥生成中心（Private Key Generator, PKG）选取主密钥 s ∈ Z_r，公开系统参数 (P_1, sP_2)。

密钥提取：对于身份为 ID 的用户，PKG 计算 Q_{ID} = H_1(ID) ∈ G_1（将身份哈希到曲线上的点），然后发放私钥 d_{ID} = s · Q_{ID}。

加密：发送方要给身份为 ID 的用户加密消息 M，随机选取 r ∈ Z_r，计算密文 C = (rP_2, M ⊕ H_2(e(Q_{ID}, sP_2)^r))。

解密：接收方使用私钥 d_{ID} 计算 e(d_{ID}, rP_2) = e(sQ_{ID}, rP_2) = e(Q_{ID}, P_2)^{sr} = e(Q_{ID}, sP_2)^r，恢复掩码后即可得到明文 M。

IBE 的安全性在随机预言模型下可归约到判定性双线性 Diffie-Hellman 假设（DBDH）。该方案的意义不仅在于其自身的实用价值，更在于它开创了利用配对构造功能丰富的密码原语这一研究方向。

8.2 属性基加密（ABE）

属性基加密将 IBE 推广到更细粒度的访问控制。在密文策略属性基加密（Ciphertext-Policy ABE, CP-ABE）中，加密者指定一个访问策略（如”部门=研发 AND 级别≥3”），只有属性满足该策略的用户才能解密。在密钥策略属性基加密（Key-Policy ABE, KP-ABE）中，策略与密钥绑定，而密文与属性集合绑定。

配对的双线性性质使得这种灵活的访问控制成为可能：通过在指数层面编码策略树（线性秘密共享方案或单调布尔公式），配对运算在解密时自动”检查”属性是否满足策略。Goyal、Pandey、Sahai 和 Waters 以及 Bethencourt、Sahai 和 Waters 的开创性工作奠定了 ABE 的理论基础。

8.3 函数加密简述

函数加密（Functional Encryption, FE）是 ABE 的进一步推广。在 FE 中，持有函数密钥 sk_f 的用户可以从密文 Enc(x) 中计算 f(x)，但无法获知 x 的其他信息。ABE 可以视为 FE 的一个特例，其中函数 f 是访问控制判断（输出”允许”或”拒绝”）。

基于配对的 FE 构造目前仍主要限于内积函数加密（Inner Product FE）等相对简单的函数类别。对于一般函数类的 FE，通常需要依赖更强的假设（如不可区分混淆或多线性映射），这些仍是活跃的研究前沿。

九、DLP 与量子计算

9.1 Shor 算法的威胁

1994 年，Peter Shor 提出的量子算法可以在多项式时间内求解整数分解问题和离散对数问题。具体而言，Shor 算法可以在 O((log n)^2 · log log n) 次量子门运算内求解阶为 n 的群上的 DLP。这意味着所有基于 DLP 困难性的经典密码方案——包括 Diffie-Hellman、ElGamal、DSA、ECDSA 以及所有基于配对的方案——在大规模容错量子计算机面前都将变得不安全。

Shor 算法的核心是量子傅里叶变换（Quantum Fourier Transform, QFT）。对于 DLP 的求解，算法将问题转化为隐藏子群问题（Hidden Subgroup Problem, HSP），然后利用量子并行性和 QFT 高效提取子群的生成元信息。对于 n 比特的群元素，Shor 算法大约需要 2n 个逻辑量子比特和 O(n^3) 个量子门。

9.2 对各类 DH/ECC/配对方案的影响

Shor 算法对基于离散对数的密码方案的影响是全面性的：

Diffie-Hellman 与 ElGamal：群无论是有限域乘法群还是椭圆曲线群，DLP 都被量子算法攻破。密钥交换和加密方案完全失效。

ECDSA/EdDSA：签名方案的安全性依赖于 ECDLP，量子攻击者可以从公钥恢复私钥，进而伪造任意签名。

BLS 签名与 IBE：配对密码学方案的安全性同时依赖于配对所涉及的多个群上的 DLP（G_1、G_2 和 G_T 上的 DLP），Shor 算法可以攻破其中任何一个。

值得注意的是，虽然 Grover 算法可以对对称密码提供二次加速（将 128 位安全性降为 64 位），但对 DLP 的威胁远不如 Shor 算法。DLP 的量子脆弱性是指数级的，这与对称密码的情况有本质区别。

9.3 量子资源估计与工程距离

尽管 Shor 算法在理论上宣告了 DLP 的死刑，但从理论到实际威胁之间的距离仍需通过量子资源估计来量化。

从理论层面看，Shor 算法求解 n 比特群阶的 DLP 至少需要 2n + 3 个逻辑量子比特——其中 2n 个用于存储量子态叠加，额外的比特用于辅助运算和量子傅里叶变换。量子门复杂度为 O(n³)，其中主要开销来自模幂运算中的受控乘法电路。然而，理论渐近复杂度与工程实现所需的具体资源之间存在巨大鸿沟。

以下是攻破主流曲线所需的具体资源估计：

目标曲线	群阶比特数	逻辑量子比特	T 门/Toffoli 门数量	来源
P-256 / Curve25519	256	~2330	~1.26 × 10¹¹ Toffoli	Roetteler et al. 2017
P-256（优化电路）	256	~2048	~7.3 × 10¹⁰ T 门	Häner et al. 2020
BN-254（G_1 上 ECDLP）	254	~2300	~1.2 × 10¹¹ Toffoli	与 P-256 同量级
BLS12-381（G_1 上 ECDLP）	255	~2340	~1.3 × 10¹¹ Toffoli	与 P-256 同量级
RSA-2048（对比参考）	2048	~4098	~2.3 × 10¹² Toffoli	Gidney & Ekera 2021

需要注意的是，对于配对友好曲线，攻击者只需攻破 G_1、G_2、G_T 三个群中最弱的一个。G_1 上的 ECDLP 与普通椭圆曲线的量子资源需求相当（均约 2330 个逻辑量子比特），而 G_T = F_{p^{12}}* 上的 DLP 虽然群阶更大，但 Shor 算法同样适用。实际评估中以 G_1 上的 ECDLP 为主要参考。

从逻辑量子比特到物理量子比特的转换才是真正的瓶颈。在基于表面码（surface code）的容错量子计算架构中，假设物理量子比特的错误率约为 10⁻³（当前实验室可达到的较好水平），每个逻辑量子比特需要约 4000-6000 个物理量子比特来实现纠错。这意味着攻破 256 比特 ECDLP 总共需要约 1000 万到 1400 万个物理量子比特。

对照当前量子硬件的发展状况：IBM 的 Heron 处理器已超过 1000 个物理量子比特（但噪声水平仍较高），Google 的 Willow 芯片拥有约 105 个量子比特并展示了改进的纠错能力。以下对比突出了当前的工程鸿沟：

当前量子硬件 vs 攻破 ECC 的需求
===================================
                     当前最先进       攻破 P-256 所需
物理量子比特数         ~1,000          ~10,000,000
逻辑量子比特数         ~10（实验性）    ~2,330
门保真度              ~99.5%          >99.9%（纠错阈值）
相干时间              ~100 μs         需维持数小时计算
差距量级              ————            约 4 个数量级（物理比特）

即便考虑最乐观的硬件路线图，当前的量子比特规模距离攻破 ECC 所需的量级仍差 3-4 个数量级，更不用说纠错能力和门保真度等质量指标上的差距。

在时间线估计方面，密码学界的共识存在较大不确定性。多数密码学家和量子计算研究者估计，具有密码学意义的大规模容错量子计算机可能在 15-30 年后出现。但这一估计的置信区间极宽——既有乐观者认为 10 年内可能实现突破性进展，也有悲观者认为物理限制可能使这一目标推迟到 50 年以后。

尽管时间线存在高度不确定性，「先收割，后解密」（harvest now, decrypt later）攻击模型使得量子威胁对长寿命机密数据而言已经是现实问题。攻击者可以在今天截获和存储加密通信，等到未来拥有量子计算机时再进行解密。对于国家安全信息、医疗记录、长期商业秘密等需要保护数十年的数据，即使量子计算机在 20 年后才出现，今天传输的数据也已经处于风险之中。这使得后量子迁移的紧迫性远高于量子计算机实际出现的时间节点。

9.4 前/后量子混合部署策略

面对量子威胁的不确定时间线，密码学界提出了混合（hybrid）部署策略作为过渡方案。其核心思想是：将一个经典密码算法（如 X25519 密钥交换）与一个后量子算法（如 ML-KEM-768）组合使用，使得整体安全性在任意一方保持安全的条件下即可得到保障。这种「取两者之长」的策略规避了一个关键风险——后量子算法的安全性尚未经历与经典算法同等时长的密码分析检验，贸然全面替换可能引入新的脆弱性。

混合 KEM 的技术实现通常遵循以下模式——以 X25519+ML-KEM-768 为例：

混合密钥封装流程
================
1. 客户端同时生成两组临时密钥对：
   (ek_ecdh, dk_ecdh) ← X25519.KeyGen()
   (ek_pq, dk_pq)     ← ML-KEM-768.KeyGen()

2. 将两个公钥拼接后发送给服务端：
   ClientHello.key_share = ek_ecdh || ek_pq

3. 服务端分别执行两种封装：
   (ss_ecdh, ct_ecdh)  ← X25519.Encaps(ek_ecdh)
   (ss_pq, ct_pq)      ← ML-KEM-768.Encaps(ek_pq)

4. 服务端使用 HKDF 将两个共享密钥合并派生会话密钥：
   session_key = HKDF-Expand(
       HKDF-Extract(salt, ss_ecdh || ss_pq),
       info="hybrid-kem", L=32
   )

关键设计原则是两个共享密钥通过密钥派生函数（HKDF）合并，而非简单异或——HKDF 提供了域分离和密钥独立性保证。只要 ss_ecdh 或 ss_pq 中任意一个保持不可预测，最终的 session_key 就是安全的。

在标准化层面，多个 IETF 草案正在推进混合方案的规范化。RFC 9370 定义了 IKEv2 中混合密钥交换的通用框架，允许将经典 DH 与后量子 KEM 组合使用。针对 TLS 1.3，draft-ietf-tls-hybrid-design 提出了混合密钥交换的具体编码方式，将两种算法的密钥份额和密文打包在单个 key_share 扩展中，保持与现有 TLS 1.3 握手流程的兼容性。

NIST 在其 SP 800-227 指南中明确推荐在过渡期间采用混合方案。其核心论点是：经典算法经受了数十年的分析且在非量子世界中被认为是安全的，而后量子算法虽然抵抗量子攻击，但其基础数学问题（如格上的最短向量问题）的困难性研究历史相对较短。混合方案确保在两类算法中任何一类出现意外弱点时，系统仍然具有安全保障。

美国国家安全局的 CNSA 2.0（Commercial National Security Algorithm Suite 2.0）则设定了更具约束力的时间表：

2025 年：软件和固件签名必须过渡到 ML-DSA 或 SLH-DSA。
2026 年：Web 服务端和浏览器必须支持 ML-KEM 密钥交换。
2030 年：所有国家安全系统中的传统公钥算法（包括基于 DLP 的方案）必须完全淘汰。
2033 年：对称密码的最低密钥长度提升至 256 比特以抵抗 Grover 算法。

CNSA 2.0 的严格时间线使得「先收割，后解密」（harvest now, decrypt later）攻击模型成为决策的核心驱动力。攻击者可以在今天截获和存储加密通信，等到未来拥有量子计算机时再进行解密。对于国家安全信息、医疗记录、长期商业秘密等需要保护数十年的数据，即使量子计算机在 20 年后才出现，今天传输的数据也已经处于风险之中。这使得后量子迁移的紧迫性远高于量子计算机实际出现的时间节点——数据的保密期限，而非量子计算机的到来时间，才是决定迁移窗口的关键变量。

在 TLS 协议层面，混合密钥交换已进入实际部署阶段。X25519+ML-KEM-768 的组合方案已在 Chrome 浏览器和 Cloudflare 的服务端投入使用。该方案在 TLS 1.3 握手中同时执行经典的 X25519 ECDH 密钥交换和后量子的 ML-KEM-768 密钥封装，最终会话密钥由两者的输出共同派生。

然而，混合方案在数字签名领域面临更大的工程挑战。证书链中的签名体积是核心瓶颈：ML-DSA-65（原 CRYSTALS-Dilithium）的签名长度约为 3300 字节，而 Ed25519 的签名仅有 64 字节——相差约 50 倍。在一条典型的三级证书链中，混合签名方案将使证书数据膨胀数千字节，这对 TLS 握手延迟和低带宽环境的影响不可忽视。

从性能角度来看，混合 TLS 握手的延迟开销约为 10-15%，主要来源于更大的密钥交换消息（ML-KEM-768 的公钥约 1184 字节，密文约 1088 字节）导致的额外网络传输。对于绝大多数互联网应用而言，这一开销在可接受范围内，但对延迟敏感的场景（如高频交易）可能需要更细致的权衡。

综合以上分析，建议的迁移路线如下：

2024-2025 年：在 TLS 和 VPN 等关键通信协议中启用混合 KEM（如 X25519+ML-KEM-768），优先保护传输中数据免受「先收割，后解密」攻击。
2025-2027 年：针对高价值证书（如根 CA 证书、代码签名证书）过渡到混合签名方案，同时推动证书生态对更大签名体积的兼容。
2027 年以后：随着后量子算法的实现经验积累和生态系统成熟，逐步向纯后量子方案过渡，最终淘汰对 DLP 类经典算法的依赖。

9.5 参数迁移时间线

密码学界和标准化组织已经为”后量子”迁移制定了路线图：

短期（2024-2028）：NIST 已于 2024 年正式发布了首批后量子密码标准，包括基于格的 ML-KEM（原 CRYSTALS-Kyber）和基于格及哈希的签名方案 ML-DSA（原 CRYSTALS-Dilithium）与 SLH-DSA（原 SPHINCS+）。组织应开始清点现有系统中对 DLP 类方案的依赖。

中期（2028-2032）：预计大规模部署混合方案——将传统的 ECDH/ECDSA 与后量子方案组合使用，确保即使其中一方被攻破，整体安全性仍然保持。TLS 1.3 的混合密钥交换草案和 Chrome/Firefox 的实验部署已经走在前列。

长期（2032 之后）：随着对后量子方案的信心逐步建立以及量子计算威胁的日益具体化，纯后量子方案将逐步替代传统方案。基于 DLP 的方案——包括 BLS 签名和配对密码学构造——将退出对安全性有长期要求的应用场景。

然而，迁移并非一蹴而就。配对密码学所提供的独特功能（如 IBE、ABE、高效聚合签名）在后量子世界中尚无完美替代。基于格的配对类似物（如基于格的 IBE）虽然在理论上可行，但在效率和功能丰富性上仍与配对方案有显著差距。这意味着配对密码学在中期仍将在对量子安全要求不那么迫切的场景中继续发挥重要作用，同时学术界将持续努力缩小后量子方案与经典配对方案之间的功能鸿沟。

综合来看，离散对数问题从一个纯粹的数论概念出发，经由计算复杂性理论的精细刻画和椭圆曲线代数几何的深刻联系，最终在双线性配对的桥梁上绽放出身份基加密、属性基加密和聚合签名等一系列具有深远应用价值的密码学构造。尽管量子计算的阴影日渐迫近，DLP 及其衍生假设在当下仍然是公钥密码学不可或缺的基石，而理解其攻击算法的演进和安全边界的变迁，则是每一位密码学从业者的必修课题。

密码学百科系列 · 第 36 篇

← 上一篇：椭圆曲线代数 | 系列目录 | 下一篇：格密码数学基础 →

同主题继续阅读

把当前热点继续串成多页阅读，而不是停在单篇消费。

2026-04-05 · cryptography

文章导航

目录