gmssl-python
是GmSSL密码库 https://github.com/guanzhi/GmSSL 的Python语言封装,以ctypes
方式实现,通过Python类和函数提供了如下密码接口:
目前gmssl-python
功能可以覆盖除SSL/TLS/TLCP之外的国密算法主要应用开发场景。
由于gmssl-python
以ctypes
方式实现,因此所有密码功能都是通过调用本地安装的GmSSL动态库 (如/usr/local/lib/libgmssl.so
)实现的,在安装和调用gmssl-python
之前必须首先在系统上安装GmSSL,然后通过Python的包管理工具pip
从Python代码仓库安装,或者从gmssl-python
项目的代码仓库https://github.com/GmSSL/GmSSL-Python 下载最新的源代码,从本地安装。
首先在https://github.com/guanzhi/GmSSL 项目上下载最新的GmSSL代码GmSSL-master.zip,编译并安装。GmSSL代码是C语言编写的,需要安装GCC、CMake来编译,在Ubuntu/Debian系统上可以执行
sudo install build-essentials cmake
安装依赖的编译工具,然后解压GmSSL源代码,进入源码目录GmSSL-master
并执行如下指令:
$ mkdir build
$ cd build
$ cmake ..
$ make
$ make test
$ sudo make install
安装完成后可以执行gmssl
命令行工具检查是否安装完毕。
$ gmssl help
由于gmssl-python
需要libgmssl
动态库,因此GmSSL安装时不要改变配置,仅以静态库安装时gmssl-python
是不可用的。安装后执行gmssl
命令可能提示找不到动态库,在Ubuntu系统下可以执行sudo ldconfig
来发现新安装的动态库,在CentOS系统上需要在/etc/ld.so.conf
配置文件中将libgmssl
动态库的目录/usr/local/lib
加入到配置文件中。
gmssl-python
gmssl-python
会定期发布到Python代码仓库中,可以通过pip
工具安装
$ pip install gmssl-python
$ pip show gmssl-python
通过pip show
命令可以查看当前安装的gmssl-python
的版本信息。
从代码仓库中安装的gmssl-python
通常不是最新版本,可以下载最新的GmSSL-Python代码 GmSSL-Python-main.zip,本地安装。
解压缩并进入源代码目录GmSSL-Python-main
。由于最新代码可能还处于开发过程中,在安装前必须进行测试确保全部功能正确,gmssl-python
中提供了测试,执行如下命令
运行测试
$ python -m unittest -v
................
----------------------------------------------------------------------
Ran 16 tests in 1.407s
OK
上面的输出表明测试通过。
然后可以通过pip
命令安装当前目录下的代码
$ pip install .
$ pip show gmssl-python
注意gmssl-python
包中只包含一个gmssl
模块(而不是gmssl_python
模块)。
可以在Python交互环境中做简单的测试
>>> import gmssl
>>> gmssl.GMSSL_PYTHON_VERSION
>>> gmssl.GMSSL_LIBRARY_VERSION
分别查看当前gmssl-python
的版本和libgmssl
的版本。
编写一个简单的测试程序sm3.py
from gmssl import *
sm3 = Sm3()
sm3.update(b'abc')
dgst = sm3.digest()
print("sm3('abc') : " + dgst.hex())
执行这个程序
$ python demo.py
sm3('abc') : 66c7f0f462eeedd9d1f2d46bdc10e4e24167c4875cf2f7a2297da02b8f4ba8e0
可以看到运行成功。通过gmssl
命令行验证输出是正确的
echo -n abc | gmssl sm3
可以看到输出相同的SM3哈希值
函数rand_bytes
实现随机数生成功能。
rand_bytes(size : int) -> bytes
输入参数size
是输出字节数组长度,返回值为size
长度的随机字节数组。
通过rand_bytes
方法生成的是具备密码安全性的随机数,可以用于密钥、IV或者其他随机数生成器的随机种子。
>>> import gmssl
>>> key = gmssl.rand_bytes(16)
>>> print(key.hex())
rand_bytes
是通过调用操作系统的密码随机数生成器(如/dev/urandom
)实现的。由于底层操作系统的限制,在一次调用rand_bytes
时不要指定明显超过密钥长度的输出长度,例如参数size
的值不要超过128,否则可能导致阻塞,或者产生错误和异常。如果应用需要大量的随机数据,不应使用rand_bytes
,而是应该考虑其他伪随机数生成算法。
需要注意的是,rand_bytes
的安全性依赖于底层的操作系统随机数生成器的安全性。在服务器、笔记本等主流硬件和Windows、Linux、Mac主流服务器、桌面操作系统环境上,当计算机已经启动并且经过一段时间的用户交互和网络通信后,rand_bytes
可以输出高质量的随机数。但是在缺乏用户交互和网络通信的嵌入式设备中,rand_bytes
返回的随机数可能存在随机性不足的问题,在这些特殊的环境中,开发者需要提前或在运行时检测rand_bytes
是否能够提供具有充分的随机性。
SM3密码杂凑函数可以将任意长度的输入数据计算为固定32字节长度的哈希值。
模块gmssl
中包含如下SM3的常量
SM3_DIGEST_SIZE
即SM3哈希值的字节长度类Sm3
实现了SM3功能,类Sm3
的对象是由构造函数生成的
gmssl.Sm3()
对象sm3的方法:
sm3.update(data : bytes)
要哈希的消息是通过update
方法输入的,输入data
的数据类型是bytes
类型,如果输入的数据是字符串,需要通过字符串的encode
方法转换成bytes
,否则无法生成正确的哈希值。sm3.digest() -> bytes
在通过update
输入完所有消息后,就可以通过digest
方法获得输出的哈希值,输出的结果类型为bytes
类型,长度为SM3_DIGEST_SIZE
。sm3.reset()
在SM3对象完成一个消息的哈希后,可以通过reset
方法重置对象状态,效果等同于构造函数,重置后可以通过update
、digest
计算新一个消息的哈希值。reset
方法使得应用可以只创建一个Sm3
的对象,计算任意数量的哈希值。下面的例子展示了如何通过类Sm3
计算字符串的SM3哈希值。
>>> from gmssl import *
>>> sm3 = Sm3()
>>> sm3.update(b'abc')
>>> sm3.digest().hex()
注意这里提供的消息字符串是bytes
格式的。这个例子的源代码在examples/sm3.py
文件中,编译并运行这个例子。
$ python examples/sm3.py
打印出的66c7f0f462eeedd9d1f2d46bdc10e4e24167c4875cf2f7a2297da02b8f4ba8e0
就是字符串abc
的哈希值。字符串abc
的哈希值也是SM3标准文本中给出的第一个测试数据,通过对比标准文本可以确定这个哈希值是正确的。
也可以通过gmssl
命令行来验证Sm3
类的计算是正确的。
$ echo -n abc | gmssl sm3
66c7f0f462eeedd9d1f2d46bdc10e4e24167c4875cf2f7a2297da02b8f4ba8e0
可以看到输出的结果是一样。
注意,如果将字符串abc
写入到文本文件中,文本编辑器通常会在文本结尾处增加格外的结束符,如0x0a
字符,那么计算出的哈希值将不是上面的结果,比如可能是12d4e804e1fcfdc181ed383aa07ba76cc69d8aedcbb7742d6e28ff4fb7776c34
。如果命令echo
不使用-n
的参数,也会出现同样的错误。这是很多开发者在初次进行哈希函数开发时容易遇到的错误,哈希函数的安全性质保证,即使输入的消息只差一个比特,那么输出的哈希值也完全不同。
如果需要哈希的数据来自于网络或者文件,那么应用可能需要多次读取才能获得全部的数据。在通过Sm3
计算哈希值时,应用不需要通过保存一个缓冲区来保存全部的数据,而是可以通过多次调用update
方法,将数据输入给Sm3
对象,在数据全都输入完之后,最后调用digest
方法得到全部数据的SM3哈希值。下面的代码片段展示了这一用法。
>>> from gmssl import *
>>> sm3 = Sm3()
>>> sm3.update(b"Hello ")
>>> sm3.update(b"world!")
>>> dgst = sm3.digest()
这个例子中两次调用了update
方法,效果等同于
sm3.update(b"Hello world!");
注意,SM3算法也支持生成空数据的哈希值,因此下面的代码片段也是合法的。
>>> from gmssl import *
>>> sm3 = Sm3()
>>> dgst = sm3.digest()
GmSSL-Python其他类的update
方法通常也都提供了这种形式的接口。在输入完所有的数据之后,通过调用digest
方法就可以获得所有输入数据的SM3哈希值了。digest
方法输出的是长度为SM3_DIGEST_SIZE
字节(即32字节)的二进制哈希值。
如果应用要计算多组数据的不同SM3哈希值,可以通过reset
方法重置Sm3
对象的状态,然后可以再次调用update
和digest
方法计算新一组数据的哈希值。这样只需要一个Sm3
对象就可以完成多组哈希值的计算。
>>> from gmssl import *
>>> sm3 = Sm3()
>>> sm3.update(b"abc")
>>> dgst1 = sm3.digest()
>>>
>>> sm3.reset()
>>> sm3.update(b"Hello ")
>>> sm3.update(b"world!")
>>> dgst2 = sm3.digest()
GmSSL-Python的部分其他类也提供了reset
方法。
HMAC-SM3是基于SM3密码杂凑算法的消息认证码(MAC)算法,消息认证码算法可以看作带密钥的哈希函数,主要用于保护消息不受篡改。通信双方需要事先协商出一个密钥,比如32字节的随机字节序列,数据的发送方用这个密钥对消息计算MAC值,并且把MAC值附在消息后面。消息的接收方在收到消息后,用相同的密钥计算消息的MAC值,并且和发送消息附带的MAC值做对比,如果一致说明消息没有被篡改,如果不一致,说明消息被篡改了。
模块gmssl
中包含如下Sm3Hmac的常量:
SM3_HMAC_MIN_KEY_SIZE
SM3_HMAC_MAX_KEY_SIZE
SM3_HMAC_SIZE
HMAC-SM3密钥长度,与SM3哈希值的长度相等Sm3Hmac
类实现了基于SM3的HMAC消息认证码算法,类Sm3Hmac
的对象是由构造函数生成的。
gmssl.Sm3Hmac(key)
对象Sm3Hmac的方法:
Sm3Hmac.update(data : bytes)
Sm3Hmac.generate_mac() -> bytes
Sm3Hmac.reset()
HMAC-SM3算法可以看作是带密钥的SM3算法,因此在生成Sm3Hmac
对象时需要传入一个密钥key
作为输入参数。虽然HMAC-SM3在算法和实现上对密钥长度没有限制,但是出于安全性、效率等方面的考虑,HMAC-SM3算法的密钥长度建议采用32字节(等同于SM3哈希值的长度),不应少于16字节,采用比32字节更长的密钥长度会增加计算开销而不会增加安全性。
下面的例子显示了如何用HMAC-SM3生成消息abc
的MAC值。
>>> from gmssl import *
>>> key = rand_bytes(SM3_HMAC_MIN_KEY_SIZE)
>>> sm3_hmac = Sm3Hmac(key)
>>> sm3_hmac.update(b'abc')
>>> sm3_hmac.generate_mac().hex()
Sm3Hmac
也通过update
方法来提供输入消息,应用可以多次调用update
。
应用在通过update
完成数据输入后,调用generate_mac
可以获得消息认证码。
常用软件如Word、PDF、WinRAR等支持基于口令的文件加密,字符串形式的口令相对于随机的密钥字节序列对用户来说更容易记忆和输入,对用户更加友好。但是由于口令中存在的信息熵远低于随机的二进制密钥,直接将口令字符串作为密钥,甚至无法抵御来自个人计算机的暴力破解攻击。一种典型的错误用法是直接用哈希函数计算口令的哈希值,将看起来随机的哈希值作为密钥使用。但是由于口令的空间相对较小,攻击者仍然可以尝试所有可能口令的哈希值,对于暴力破解来说,破解口令的哈希值和原始口令,在攻击难度上没有太大差别。
安全和规范的做法是采用一个基于口令的密钥导出函数(Password-Based Key Derivation Function, PBKDF)从口令中导出密钥。通过PBKDF导出密钥并不会降低攻击者在暴力破解时尝试的口令数量,但是可以防止攻击者通过查预计算表的方式来加速破解,并且可以大大增加攻击者尝试每一个可能口令的计算时间。PBKDF2是安全的并且使用广泛的PBKDF算法标准之一,算法采用哈希函数作为将口令映射为密钥的主要部件,通过加入随机并且公开的盐值(Salt)来抵御预计算,通过增加多轮的循环计算来增加在线破解的难度,并且支持可变的导出密钥长度。
模块gmssl
中包含如下Sm3Pbkdf2的常量
SM3_PBKDF2_MIN_ITER
SM3_PBKDF2_MAX_ITER
SM3_PBKDF2_MAX_SALT_SIZE
SM3_PBKDF2_DEFAULT_SALT_SIZE
SM3_PBKDF2_MAX_KEY_SIZE
函数Sm3Pbkdf2
实现了基于SM3的PBKDF2算法。
sm3_pbkdf2(passwd, salt, iterator, keylen)
其中:
passwd
用于导出密钥的用户口令。salt
是用于抵御与计算的盐值。这个值需要用随机生成(比如通过Random
类),并且具有一定的长度。Salt值不需要保密,因此在口令加密数据时,可以直接将这个值附在密文前,传输给接收方。Salt值越长,抵御预计算攻击的效果就更好。例如当Salt为8字节(64比特)长的随机值时,攻击者预计算表就要扩大$2^{64}$倍。Sm3Pbkdf2
提供一个推荐的Salt值长度SM3_PBKDF2_DEFAULT_SALT_SIZE
常量,并且在实现上不支持超过SM3_PBKDF2_MAX_KEY_SIZE
长度的Salt值。iterator
参数用于表示在导出密钥时调用SM3算法的循环次数,iterator
值越大,暴力破解的难度越大,但是同时用户在调用这个函数时的开销也增大了。一般来说iterator
值的应该选择在用户可接收延迟情况下的最大值,比如当iterator = 10000
时,用户延迟为100毫秒,但是对于用户来说延迟感受不明显,但是对于暴力攻击者来说iterator = 10000
意味着攻击的开销增加了大约1万倍。Sm3Pbkdf2
通过SM3_PBKDF2_MIN_ITER
和SM3_PBKDF2_MAX_ITER
两个常量给出了iterator
值的范围,用户可以根据当前计算机的性能及用户对延迟的可感知度,在这个范围内选择合适的值。keylen
参数表示希望导出的密钥长度,这个长度不可超过常量SM3_PBKDF2_MAX_KEY_SIZE
。下面的例子展示了如何从口令字符串导出一个密钥。
>>> from gmssl import *
>>> passwd = "Password"
>>> salt = rand_bytes(SM3_PBKDF2_DEFAULT_SALT_SIZE)
>>> iterator = SM3_PBKDF2_MIN_ITER
>>> keylen = 32
>>> sm3_pbkdf2(passwd, salt, iterator, keylen).hex()
SM4算法是分组密码算法,其密钥长度为128比特(16字节),分组长度为128比特(16字节)。SM4算法每次只能加密或者解密一个固定16字节长度的分组,不支持加解密任意长度的消息。分组密码通常作为更高层密码方案的一个组成部分,不适合普通上层应用调用。如果应用需要保护数据和消息,那么应该优先选择采用SM4-GCM模式,或者为了兼容已有的系统,也可以使用SM4-CBC或SM4-CTR模式。
模块gmssl
中包含如下SM4的常量
SM4_KEY_SIZE
SM4_BLOCK_SIZE
SM4
类实现了基本的SM4分组密码算法,类SM4
的对象是由构造函数生成的。
gmssl.Sm4(key, encrypt)
对象SM4的方法:
Sm4.encrypt(block : int) -> bytes
Sm4
对象在创建时需要提供SM4_KEY_SIZE
字节长度的密钥,以及一个布尔值DO_ENCRYPT
表示是用于加密还是解密。方法encrypt
根据创建时的选择进行加密或解密,每次调用encrypt
只处理一个分组,即读入SM4_BLOCK_SIZE
长度的输入。
下面的例子展示SM4分组加密
>>> from gmssl import *
>>> key = rand_bytes(SM4_KEY_SIZE)
>>> plaintext = rand_bytes(SM4_BLOCK_SIZE)
>>> sm4_enc = Sm4(key, DO_ENCRYPT)
>>> ciphertext = sm4_enc.encrypt(plaintext)
>>> sm4_dec = Sm4(key, DO_DECRYPT)
>>> decrypted = sm4_dec.encrypt(ciphertext)
多次调用Sm4
的分组加密解密功能可以实现ECB模式,由于ECB模式在消息加密应用场景中并不安全,因此GmSSL中没有提供ECB模式。如果应用需要开发SM4的其他加密模式,也可以基于Sm4
类来开发这些模式。
CBC模式是应用最广泛的分组密码加密模式之一,虽然目前不建议在新的应用中继续使用CBC默认,为了保证兼容性,应用仍然可能需要使用CBC模式。
模块gmssl
中包含如下Sm4Cbc的常量:
SM4_CBC_IV_SIZE
Sm4Cbc
类实现了基本的SM4-CBC分组密码算法,类Sm4Cbc
的对象是由构造函数生成的。
gmssl.Sm4Cbc(key, iv, encrypt)
对象Sm4Cbc的方法:
Sm4Cbc.update(data : bytes)
Sm4Cbc.finish() -> bytes
Sm4Cbc
类实现了SM4的带填充CBC模式,可以实现对任意长度数据的加密。由于需要对明文进行填充,因此Sm4Cbc
输出的密文长度总是长于明文长度,并且密文的长度是整数个分组长度。
通过Sm4Cbc
加密时,key
和iv
都必须为16字节长度。由于CBC模式中加密和解密的计算过程不同,因此必须通过布尔值DO_ENCRYPT
指定是加密还是解密。
由于Sm4Cbc
在加解密时维护了内部的缓冲区,因此update
的输出长度可能不等于输入长度,应该保证输出缓冲区的长度至少比输入长度长一个SM4_CBC_IV_SIZE
长度。
下面的例子显示了采用SM4-CBC加密和解密的过程。
>>> from gmssl import *
>>> key = rand_bytes(SM4_KEY_SIZE)
>>> iv = rand_bytes(SM4_CBC_IV_SIZE)
>>> plaintext = b'abc'
>>> sm4_enc = Sm4Cbc(key, iv, DO_ENCRYPT)
>>> ciphertext = sm4_enc.update(plaintext)
>>> ciphertext += sm4_enc.finish()
>>> sm4_dec = Sm4Cbc(key, iv, DO_DECRYPT)
>>> decrypted = sm4_dec.update(ciphertext)
>>> decrypted += sm4_dec.finish()
CTR加密模式可以加密任意长度的消息,和CBC模式不同,并不需要采用填充方案,因此SM4-CTR加密输出的密文长度和输入的明文等长。对于存储或传输带宽有限的应用场景,SM4-CTR相对SM4-CBC模式,密文不会增加额外长度。
模块gmssl
中包含如下Sm4Ctr的常量:
SM4_CTR_IV_SIZE
Sm4Ctr
类实现了基本的SM4-CBC分组密码算法,类Sm4Ctr
的对象是由构造函数生成的。
gmssl.Sm4Ctr(key, iv)
对象Sm4Cbc的方法:
Sm4Ctr.update(data : bytes)
Sm4Ctr.finish() -> bytes
SM4-CTR在加密和解密时计算过程一样,因此在初始化时不需要指定加密或解密,因此没有Sm4Cbc
中的DO_ENCRYPT
参数。其他过程和SM4-CBC是一样的。
由于Sm4Ctr
在加解密时维护了内部的缓冲区,因此update
的输出长度可能不等于输入长度,应该保证输出缓冲区的长度至少比输入长度长一个SM4_BLOCK_SIZE
长度。
注意 ,SM4-CBC和SM4-CTR模式都不能保证消息的完整性,在使用这两个模式时,应用还需要生成一个独立的HMAC-SM3密钥,并且生成密文的MAC值。
SM4的GCM模式是一种认证加密模式,和CBC、CTR等加密模式的主要区别在于,GCM模式的加密过程默认在密文最后添加完整性标签,也就是MAC标签,因此应用在采用SM4-GCM模式时,没有必要再计算并添加SM3-HMAC了。在有的应用场景中,比如对消息报文进行加密,对于消息头部的一段数据(报头字段)只需要做完整性保护,不需要加密,SM4-GCM支持这种场景。在Sm4Gcm
类的init
方法中,除了key
、iv
参数,还可以提供aad
字节数字用于提供不需要加密的消息头部数据。
模块gmssl
中包含如下Sm4Gcm的常量:
SM4_GCM_MIN_IV_SIZE
SM4_GCM_MAX_IV_SIZE
SM4_GCM_DEFAULT_IV_SIZE
SM4_GCM_DEFAULT_TAG_SIZE
SM4_GCM_MAX_TAG_SIZE
Sm4Gcm
类实现了基本的SM4-CBC分组密码算法,类Sm4Gcm
的对象是由构造函数生成的。
gmssl.Sm4Gcm(key, iv, aad, taglen = SM4_GCM_DEFAULT_TAG_SIZE, encrypt = True)
对象Sm4Gcm的方法:
Sm4Gcm.update(data : bytes)
Sm4Gcm.finish() -> bytes
GCM模式和CBC、CTR、HMAC不同之处还在于可选的IV长度和MAC长度,其中IV的长度必须在SM4_GCM_MIN_IV_SIZE
和SM4_GCM_MAX_IV_SIZE
之间,长度为SM4_GCM_DEFAULT_IV_SIZE
有最佳的计算效率。MAC的长度也是可选的,通过init
方法中的taglen
设定,其长度不应低于8字节,不应长于SM4_GCM_DEFAULT_TAG_SIZE = 16
字节。
下面例子展示SM4-GCM加密和解密的过程。
>>> from gmssl import *
>>> key = rand_bytes(SM4_KEY_SIZE)
>>> iv = rand_bytes(SM4_GCM_DEFAULT_IV_SIZE)
>>> aad = b'Additional auth-data'
>>> plaintext = b'abc'
>>> taglen = SM4_GCM_DEFAULT_TAG_SIZE
>>> sm4_enc = Sm4Gcm(key, iv, aad, taglen, DO_ENCRYPT)
>>> ciphertext = sm4_enc.update(plaintext)
>>> ciphertext += sm4_enc.finish()
>>> sm4_dec = Sm4Gcm(key, iv, aad, taglen, DO_DECRYPT)
>>> decrypted = sm4_dec.update(ciphertext)
>>> decrypted += sm4_dec.finish()
通过上面的例子可以看出,SM4-GCM加密模式中可以通过指定了一个不需要加密的字段aad
,注意aad
是不会在update
中输出的。由于GCM模式输出个外的完整性标签,因此update
和finish
输出的总密文长度会比总的输入明文长度多taglen
个字节。
祖冲之密码算法(ZU Cipher, ZUC)是一种序列密码,密钥和IV长度均为16字节。作为序列密码ZUC可以加密可变长度的输入数据,并且输出的密文数据长度和输入数据等长,因此适合不允许密文膨胀的应用场景。在国密算法体系中,ZUC算法的设计晚于SM4,在32位通用处理器上通常比SM4-CBC明显要快。
在安全性方面,不建议在一组密钥和IV的情况下用ZUC算法加密大量的数据(比如GB级或TB级),避免序列密码超长输出时安全性降低。另外ZUC算法本身并不支持数据的完整性保护,因此在采用ZUC算法加密应用数据时,应考虑配合HMAC-SM3提供完整性保护。ZUC的标准中还包括针对移动通信底层数据报文加密的128-EEA3方案和用于消息完整性保护的128-EIA3算法,目前GmSSL-Python中不支持这两个算法。
模块gmssl
中包含如下Sm4Gcm的常量:
ZUC_KEY_SIZE
ZUC_IV_SIZE
Zuc
类实现了基本的Zuc序列密码算法,类Zuc
的对象是由构造函数生成的。
gmssl.Zuc(key, iv)
对象Sm4Cbc的方法:
Zuc.update(data : bytes)
Zuc.finish() -> bytes
Zuc
类的接口说明如下:
Zuc
对象时不需要格外的参数表明加密还是解密。Zuc
和Sm4Cbc
的接口是完全一致的。Zuc
实现加解密过程中也有内部的状态缓冲区,因此update
的输出长度可能和输入长度不一致,调用方应该保证输出缓冲区长度比输入长度长BLOCK_SIZE
个字节。注意,BLOCK_SIZE
的实际值在未来也有可能会变化。下面的例子展示了Zuc
的加密和解密过程。
>>> from gmssl import *
>>> iv = rand_bytes(ZUC_IV_SIZE)
>>> plaintext = b'abc'
>>> zuc_enc = Zuc(key, iv)
>>> ciphertext = zuc_enc.update(plaintext)
>>> ciphertext += zuc_enc.finish()
>>> zuc_dec = Zuc(key, iv)
>>> decrypted = zuc_dec.update(ciphertext)
>>> decrypted += zuc_dec.finish()
SM2是国密标准中的椭圆曲线公钥密码,包含数字签名算法和公钥加密算法。SM2相关的功能由类Sm2Key
和Sm2Signature
实现,其中Sm2Key
实现了SM2密钥对的生成、基础的加密和签名方案,Sm2Signature
类实现了对任意长度消息签名的签名方案。
模块gmssl
中包含如下Sm2Key的常量:
SM2_DEFAULT_ID
SM2_MAX_SIGNATURE_SIZE
SM2_MIN_PLAINTEXT_SIZE
SM2_MAX_PLAINTEXT_SIZE
SM2_MIN_CIPHERTEXT_SIZE
SM2_MAX_CIPHERTEXT_SIZE
Sm2Key
类实现了基本的SM4-CBC分组密码算法,类Sm2Key
的对象是由构造函数生成的。
gmssl.Sm2Key()
对象Sm2Key的方法:
Sm2Key.generate_key()
Sm2Key.compute_z()
Sm2Key.export_encrypted_private_key_info_pem()
Sm2Key.import_encrypted_private_key_info_pem()
Sm2Key.export_public_key_info_pem()
Sm2Key.import_public_key_info_pem()
Sm2Key.sign()
Sm2Key.verify()
Sm2Key.encrypt()
Sm2Key.decrypt()
需要注意的是,通过构造函数生成的新Sm2Key
对象是一个空白的对象,可以通过generate_key
方法生成一个新的密钥对,或者通过导入函数从外部导入密钥。Sm2Key
一共提供了2个不同的导入方法:
import_encrypted_private_key_info_pem
从加密的PEM文件中导入SM2私钥,因此调用时需要提供PEM文件的路径和解密的口令(Password)。import_public_key_info_pem
从PEM文件中导入SM2公钥,只需要提供文件的路径,不需要提供口令。上面2个导入函数也都有对应的导出函数。从PEM文件中导入导出公钥私钥和gmssl
命令行工具的默认密钥格式一致,并且在处理私钥时安全性更高。因此建议在默认情况下,在导入导出私钥时默认采用加密的PEM文件格式。
下面的代码片段展示了Sm2Key
密钥对和导出为加密的PEM私钥文件:
>>> sm2 = Sm2Key()
>>> sm2.generate_key()
>>>
>>> sm2.export_encrypted_private_key_info_pem('sm2.pem', 'password')
>>> private_key = Sm2Key()
>>> private_key.import_encrypted_private_key_info_pem('sm2.pem', 'password')
用文本编辑器打开sm2.pem
文件可以看到如下内容
-----BEGIN ENCRYPTED PRIVATE KEY-----
MIIBBjBhBgkqhkiG9w0BBQ0wVDA0BgkqhkiG9w0BBQwwJwQQaADudE4Ycenuoth4
ZqcewgIDAQAAAgEQMAsGCSqBHM9VAYMRAjAcBggqgRzPVQFoAgQQ9aUmOaXn0mZD
7xhBdd+FlQSBoKc0GG7US2SsmQIrppPNQeyDFpG8xthNI6G4R/YbSPJCvSMJ/9y3
LQ/jrdUumuKevgg9miAcjbKndm7HC07lMYUk1ZXlaEG/1awER4RJsRvZ64GlBQOV
D7jbu93mSs9t3SDt4TniDua5WyXo5Y8S6DjkkUD5epHRzYZ4uFFC/8pTeehK7X+S
p2b6CndfB6H4LrvCGuRnjX4l5Q5AgfWDmWU=
-----END ENCRYPTED PRIVATE KEY-----
下面的代码片段展示了Sm2Key
导出为PEM公钥文件,这是一个标准的PKCS #8 EncryptPrivateKeyInfo类型并且PEM编码的私钥文件格式,openssl pkeyutil
命令行工具也默认采用这个格式的私钥,但是由于GmSSL在私钥文件中采用SM4-CBC、HMAC-SM3组合加密了SM2的私钥,因此对于默认使用3DES的openssl
等工具可能无法解密这个私钥(即使这个工具包含SM2算法的实现)。
>>> sm2.export_public_key_info_pem('sm2pub.pem')
>>> public_key = Sm2Key()
>>> public_key.import_public_key_info_pem('sm2pub.pem')
用文本编辑器打开sm2pub.pem
文件可以看到如下内容
-----BEGIN PUBLIC KEY-----
MFkwEwYHKoZIzj0CAQYIKoEcz1UBgi0DQgAE5djp+Gw/Wdg9JwVwYDiQn1AocezI
C2qT54fqJBNWevCNru8ENwj4t/52Yf50LF5+fMlcoWPbfm/TcCgYPb49jw==
-----END PUBLIC KEY-----
由于公钥文件是不加密的,因此这个公钥可以被支持SM2的第三方工具、库打开和访问。
Sm2Key
类除了generate_key
方法之外,提供了compute_z
、sign
、verify
、encrypt
、decrypt
这几个密码计算相关的方法。
其中compute_z
是由公钥和用户的字符串ID值计算出一个称为“Z值”的哈希值,用于对消息的签名。由于Sm2Signature
类中提供了SM2消息签名的完整功能,因此这个compute_z
方法只是用于实验验证。
>>> z = public_key.compute_z(SM2_DEFAULT_ID)
类Sm2Key
的sign
和verify
方法实现了SM2签名的底层功能,这两个方法不支持对数据或消息的签名,只能实现对SM3哈希值的签名和验证,并没有实现SM2签名的完整功能。应用需要保证调用时提供的dgst
参数的字节序列长度为32。只有密码协议的底层开发者才需要调用compute_z
、sign
、verify
这几个底层方法。
>>> dgst = sm3.digest()
>>> sig = private_key.sign(dgst)
>>> ret = public_key.verify(dgst, sig)
类Sm2Key
的encrypt
和decrypt
方法实现了SM2加密和解密功能。注意,虽然SM2标准中没有限制加密消息的长度,但是公钥加密应该主要用于加密较短的对称密钥、主密钥等密钥数据,因此GmSSL库中限制了SM2加密消息的最大长度。应用在调用encrypt
时,需要保证输入的明文长度不超过SM2_MAX_PLAINTEXT_SIZE
的限制。如果需要加密引用层的消息,应该首先生成对称密钥,用SM4-GCM加密消息,再用SM2加密对称密钥。
>>> ciphertext = public_key.encrypt(plaintext)
>>> decrypted = private_key.decrypt(ciphertext)
类Sm2Signatue
提供了对任意长消息的签名、验签功能。
模块gmssl
中包含如下Sm2Signatue的常量:
DO_ENCRYPT = True
DO_DECRYPT = False
DO_SIGN = True
DO_VERIFY = False
Sm2Signatue
类实现了基本的SM4-CBC分组密码算法,类Sm2Signatue
的对象是由构造函数生成的。
gmssl.Sm2Signatue(sm2_key, signer_id = SM2_DEFAULT_ID, sign = DO_SIGN)
对象Sm2Signatue的方法:
Sm2Signatue.update()
Sm2Signatue.sign()
Sm2Signatue.verify()
在生成Sm2Signature
对象时,不仅需要提供Sm2Key
,还需要提供签名方的字符串ID,以满足SM2签名的标准。如果提供的Sm2Key
来自于导入的公钥,那么这个Sm2Signature
对象只能进行签名验证操作,即在构造时DO_SIGN = False
,并且只能调用verify
方法,不能调用sign
方法。
signer = Sm2Signature(private_key, SM2_DEFAULT_ID, DO_SIGN)
signer.update(b'abc')
sig2 = signer.sign()
verifier = Sm2Signature(public_key, SM2_DEFAULT_ID, DO_VERIFY)
verifier.update(b'abc')
ret = verifier.verify(sig2)
不管是Sm2Key
的sign
还是Sm2Signature
的sign
方法输出的都是DER编码的签名值。这个签名值的第一个字节总是0x30
,并且长度是可变的,常见的长度包括70字节、71字节、72字节,也可能短于70字节。一些SM2的实现不能输出DER编码的签名,只能输出固定64字节长度的签名值。可以通过签名值的长度以及首字节的值来判断SM2签名值的格式。
类Sm2Certificate
实现了SM2证书的导入、导出、解析和验证等功能。这里的“SM2证书”含义和“RSA证书”类似,是指证书中的公钥字段是SM2公钥,证书中签名字段是SM2签名,证书格式就是标准的X.509v3证书。由于GmSSL库目前只支持SM2签名算法,不支持ECDSA、RSA、DSA等签名算法,因此Sm2Certificate
类无法支持其他公钥类型的证书。注意,有一种不常见的情况,一个证书可以公钥是SM2公钥而数字签名是RSA签名,这种证书可能是采用RSA公钥的CA中心对SM2证书请求签发而产生的,由于目前GmSSL不支持SM2之外的签名算法,因此Sm2Certificate
不支持此类证书。
类Sm2Certificate
只支持SM2证书的解析和验证等功能,不支持SM2证书的签发和生成,如果应用需要实现证书申请(即生成CSR文件)或者自建CA签发证书功能,那么可以通过GmSSL库或者gmssl
命令行工具实现,GmSSL-Python目前不考虑支持证书签发、生成的相关功能。
模块gmssl
中包含如下Sm2Certificate的常量:
ZUC_KEY_SIZE
ZUC_IV_SIZE
Sm2Certificate的方法:
Sm2Certificate.import_pem()
Sm2Certificate.get_raw()
Sm2Certificate.export_pem()
Sm2Certificate.get_serial_number()
Sm2Certificate.get_issuer()
Sm2Certificate.get_subject()
Sm2Certificate.get_subject_public_key()
Sm2Certificate.get_validity()
Sm2Certificate.verify_by_ca_certificate()
新生成的Sm2Certificate
对象中的证书数据为空,必须通过导入证书数据才能实现真正的初始化。证书有很多种不同格式的编码,如二进制DER编码的crt
文件或者文本PEM编码的cer
文件或者pem
文件,有的证书也会把二进制的证书数据编码为一串连续的十六进制字符串,也有的CA会把多个证书构成的证书链封装在一个PKCS#7格式的密码消息中,而这个密码消息可能是二进制的,也可能是PEM编码的。
在这些格式中最常用的格式是本文的PEM格式,这也是Sm2Certificate
类默认支持的证书格式。下面这个例子中就是一个证书的PEM文件内容,可以看到内容是由文本构成的,并且总是以-----BEGIN CERTIFICATE-----
一行作为开头,以-----END CERTIFICATE-----
一行作为结尾。PEM格式的好处是很容易用文本编辑器打开来,容易作为文本被复制、传输,一个文本文件中可以依次写入多个证书,从而在一个文件中包含多个证书或证书链。因此PEM格式也是CA签发生成证书使用的最主流的格式。由于PEM文件中头尾之间的文本就是证书二进制DER数据的BASE64编码,因此PEM文件也很容易和二进制证书进行手动或自动的互相转换。
-----BEGIN CERTIFICATE-----
MIIBszCCAVegAwIBAgIIaeL+wBcKxnswDAYIKoEcz1UBg3UFADAuMQswCQYDVQQG
EwJDTjEOMAwGA1UECgwFTlJDQUMxDzANBgNVBAMMBlJPT1RDQTAeFw0xMjA3MTQw
MzExNTlaFw00MjA3MDcwMzExNTlaMC4xCzAJBgNVBAYTAkNOMQ4wDAYDVQQKDAVO
UkNBQzEPMA0GA1UEAwwGUk9PVENBMFkwEwYHKoZIzj0CAQYIKoEcz1UBgi0DQgAE
MPCca6pmgcchsTf2UnBeL9rtp4nw+itk1Kzrmbnqo05lUwkwlWK+4OIrtFdAqnRT
V7Q9v1htkv42TsIutzd126NdMFswHwYDVR0jBBgwFoAUTDKxl9kzG8SmBcHG5Yti
W/CXdlgwDAYDVR0TBAUwAwEB/zALBgNVHQ8EBAMCAQYwHQYDVR0OBBYEFEwysZfZ
MxvEpgXBxuWLYlvwl3ZYMAwGCCqBHM9VAYN1BQADSAAwRQIgG1bSLeOXp3oB8H7b
53W+CKOPl2PknmWEq/lMhtn25HkCIQDaHDgWxWFtnCrBjH16/W3Ezn7/U/Vjo5xI
pDoiVhsLwg==
-----END CERTIFICATE-----
通过gmssl certparse
命令可以打印这个证书的内容
$ gmssl certparse -in ROOTCA.pemCertificate
tbsCertificate
version: v3 (2)
serialNumber: 69E2FEC0170AC67B
signature
algorithm: sm2sign-with-sm3
parameters: NULL
issuer
countryName: CN
organizationName: NRCAC
commonName: ROOTCA
validity
notBefore: Sat Jul 14 11:11:59 2012
notAfter: Mon Jul 7 11:11:59 2042
subject
countryName: CN
organizationName: NRCAC
commonName: ROOTCA
subjectPulbicKeyInfo
algorithm
algorithm: ecPublicKey
namedCurve: sm2p256v1
subjectPublicKey
ECPoint: 0430F09C6BAA6681C721B137F652705E2FDAEDA789F0FA2B64D4ACEB99B9EAA34E655309309562BEE0E22BB45740AA745357B43DBF586D92FE364EC22EB73775DB
extensions
Extension
extnID: AuthorityKeyIdentifier (2.5.29.35)
AuthorityKeyIdentifier
keyIdentifier: 4C32B197D9331BC4A605C1C6E58B625BF0977658
Extension
extnID: BasicConstraints (2.5.29.19)
BasicConstraints
cA: true
Extension
extnID: KeyUsage (2.5.29.15)
KeyUsage: keyCertSign,cRLSign
Extension
extnID: SubjectKeyIdentifier (2.5.29.14)
SubjectKeyIdentifier: 4C32B197D9331BC4A605C1C6E58B625BF0977658
signatureAlgorithm
algorithm: sm2sign-with-sm3
parameters: NULL
signatureValue: 304502201B56D22DE397A77A01F07EDBE775BE08A38F9763E49E6584ABF94C86D9F6E479022100DA1C3816C5616D9C2AC18C7D7AFD6DC4CE7EFF53F563A39C48A43A22561B0BC2
可以看到一个证书的主要内容是包含证书持有者信息的tbsCertificate字段,以及权威机构对tbsCertificate字段的签名算法signatureAlgorithm和签名值signatureValue。因为这个证书是SM2证书,因此其中的签名算法是sm2sign-with-sm3
,签名值是0x30
开头的DER编码的可变长度签名值。
证书中持有者信息包含如下字段:
v3
。0x04
开头,后跟总共64字节的点的X、Y坐标。cA: true
字段不存在,那么这个证书不能作为CA证书使用。Sm2Certificate
类只支持第3版证书的解析,因此没有提供getVersion
方法获取证书的版本号。GmSSL支持常用扩展的解析和验证,如果某个证书中有GmSSL不支持的非关键扩展,那么GmSSL会忽略这个扩展,如果存在GmSSL不识别或无法验证的关键性扩展,那么GmSSL在解析证书的时候会返回失败,因此如果Sm2Certificate
类import_pem
成功,说明证书的格式、内容是可以识别的并且是正确的。
拿他其他人提供的证书还必须验证该证书是否有效,首先需要检查证书的有效期。目前很多CA中心的策略是颁发有效期尽可能短的证书(比如3个月有效期),因此拿到的证书很有可能已经过期了。可以通过get_validity()
方法获得有效期时间,判断当前时间点是否在有效期范围内。如果要验证过去某个时间点证书支持者的操作是否合法,那么应该检查那个时间点是否在证书的有效期范围内。
对证书最重要的验证之一是这个证书是否是由权威机构签发的。证书用户需要先通过get_issuer
方法获得签发机构的名字,确认这个签发机构是否可信。例如,如果一个北京市政府机构的证书中的签发机构是一个商业性CA中心,那么这个证书的有效性就是存疑的。在确认CA中心名字(即整个issuer字段)无误之后,还需要通过Issuer字段从可信的渠道获得这个CA中心的证书,然后调用verify_by_ca_certificate
方法,用获得的CA证书验证当前证书中的签名是否正确。在典型的应用中,开发者和软件发行方应该将所有可信的CA中心的证书硬编码到软件中,或者内置到软件或系统的证书库中,避免应用的用户需要手动添加、导入CA证书。
所有的私钥都有泄露的可能,安全性不佳的自建CA有被攻击者渗透的可能,商业性的小CA甚至有被收购、收买的可能,因此有效期范围内的证书也存在被作废的可能。检查证书是否作废主要是通过证书作废列表CRL文件检查,或者通过证书状态在线检查协议OCSP来在线查询。目前Sm2Certificate
类没有支持证书作为查询的功能,开发者暂时可以通过GmSSL
库或者gmssl
命令行工具进行CRL的检查。
在完成所有证书检查之后,应用可以完全信任从证书中读取的持有者身份信息(subject)和支持有的公钥了,这两个信息分别通过get_subject()
和get_subject_public_key
方法获得。
SM9算法属于基于身份的密码。基于身份的密码是一种“高级”的公钥密码方案,在具备常规公钥密码加密、签名等密码功能的同时,基于身份的密码体系不需要CA中心和数字证书体系。SM9方案的基本原理是,可以由用户的唯一身份ID(如对方的电子邮件地址、域名或ID号等),从系统的全局主密钥中导出对应的私钥或公钥,导出密钥的正确性是由算法保证的,因此在进行加密、验签的时候,只需要获得解密方或签名方的ID即可,不再需要对方的数字证书了。因此如果应用面对的是一个内部的封闭环境,所有参与用户都是系统内用户,那么采用SM9方案而不是SM2证书和CA的方案,可以简化系统的开发、设计和使用,并降低后续CA体系的维护成本。
对应数字证书体系中的CA中心,SM9体系中也存在一个权威中心,用于生成全局的主密钥(MasterKey),并且为系统中的每个用户生成、分配用户的私钥。和SM2密钥对一样,SM9的主密钥也包含私钥和公钥,其中主公钥(PublicMasterKey)是可以导出并公开给系统中全体用户的。而SM9中用户的密钥对比较特殊,其中的公钥并不能从私钥中导出,SM9用户密钥需要包含用户的ID起到公钥的作用,在加密和验证签名等密码计算中,真正的用户公钥是在计算中,在运行时通过用户ID从主公钥中导出的。因此从应用的角度看,SM9中用户的公钥就是一个字符串形式的ID。
SM9算法体系中包括SM9加密、SM9签名和SM9密钥交换协议,GmSSL-Java中实现了SM9加密和SM9签名,没有实现SM9密钥交换。其中SM9加密功能包含Sm9EncMasterKey
类和Sm9EncKey
类,分别实现了SM9加密主密钥和SM9加密用户密钥,SM9签名功能包含Sm9SignMasterKey
类、Sm9SignKey
类和Sm9Signature
类,分别实现了SM9签名主密钥、SM9签名用户密钥和SM9签名功能。
和SM2算法中相同的密钥对既可以用于加密又可以用于签名不同,SM9中加密、签名的主密钥、用户密钥的组成是完全不同的,因此GmSSL中分别实现为不同的类。SM9签名由于需要特殊的哈希过程,因此SM9用户签名私钥不提供直接签哈希值的底层签名功能实现,只能通过Sm9Signature
实现对消息的签名、验证。
模块gmssl
中包含如下Sm9EncMasterKey的常量:
SM9_MAX_ID_SIZE
SM9_MAX_PLAINTEXT_SIZE
SM9_MAX_CIPHERTEXT_SIZE
SM9加密主密钥由类Sm9EncMasterKey
实现。
gmssl.Sm9EncMasterKey()
对象Sm9EncMasterKey的接口包括:
Sm9EncMasterKey.generate_master_key()
主密钥的生成Sm9EncMasterKey.extract_key()
用户私钥的生成Sm9EncMasterKey.import_encrypted_master_key_info_pem()
主密钥的导入,注意Sm2Key
的对应接口类似,这里主密钥都是以口令加密的方式导出到文件上的Sm9EncMasterKey.export_encrypted_master_key_info_pem()
主密钥的导出Sm9EncMasterKey.export_public_master_key_pem()
主公钥(主密钥的公钥部分)的导入Sm9EncMasterKey.import_public_master_key_pem()
主公钥(主密钥的公钥部分)的导出Sm9EncMasterKey.encrypt()
数据加密这个类的用户包括两个不同角色,权威中心和用户。其中权威中心调用主密钥的生成、主密钥的导入导出、主公钥导出和用户私钥生成这几个接口,而用户调用主公钥导入和加密这两个接口。
类Sm9EncKey
对象是由Sm9SEncMasterKey
的extract_key
方法生成的。
gmssl.Sm9EncKey()
对象Sm9EncKey的方法:
Sm9EncKey.get_id()
Sm9EncKey.import_encrypted_private_key_info_pem()
Sm9EncKey.export_encrypted_private_key_info_pem()
Sm9EncKey.decrypt()
类Sm9EncKey
提供了解密、导入导出等接口,由于在SM9中用户密钥总是包含私钥的,因此导出的是经过口令加密的密钥。
下面的例子中给出了SM9加密方案的主密钥生成、用户密钥导出、加密、解密的整个过程。
master_key = Sm9EncMasterKey()
master_key.generate_master_key()
print("SM9 master key generated")
master_key.export_encrypted_master_key_info_pem('enc_msk.pem', 'password')
master_key.export_public_master_key_pem('enc_mpk.pem')
print("Export master key and public master key")
# Encrypt
master_pub = Sm9EncMasterKey()
master_pub.import_public_master_key_pem('enc_mpk.pem')
plaintext = rand_bytes(SM4_KEY_SIZE + SM3_HMAC_MIN_KEY_SIZE)
receiver_id = 'Alice'
ciphertext = master_pub.encrypt(plaintext, receiver_id)
# Decrypt
master = Sm9EncMasterKey()
master.import_encrypted_master_key_info_pem('enc_msk.pem', 'password')
receiver_key = master.extract_key(receiver_id)
decrypted = receiver_key.decrypt(ciphertext)
SM9签名功能由Sm9SignMasterKey
、Sm9SignKey
和Sm9Signature
几个类实现,前两者在接口上和SM9加密非常类似,只是这两个类不直接提供签名、验签的功能。
gmssl.Sm9SignMasterKey()
gmssl.Sm9SignKey(owner_id)
对象Sm9SignMasterKey的方法:
Sm9SignMasterKey.generate_master_key()
Sm9SignMasterKey.extract_key()
Sm9SignMasterKey.import_encrypted_master_key_info_pem()
Sm9SignMasterKey.export_encrypted_master_key_info_pem()
Sm9SignMasterKey.export_public_master_key_pem()
Sm9SignMasterKey.import_public_master_key_pem()
对象Sm9SignKey的方法:
Sm9SignKey.get_id()
Sm9SignKey.import_encrypted_private_key_info_pem()
Sm9SignKey.export_encrypted_private_key_info_pem()
类Sm9Signature
实现对数据的SM9签名和验证功能。SM9签名时需要提供Sm9SignKey
类型的签名方私钥(其中包含签名者的ID),在验证签名时需要提供Sm9SignMasterKey
格式的系统主公钥和签名方的ID。Sm9Signature
和Sm2Signature
提供类似的update
、sign
、verify
接口,只是在验证的时候需要提供的不是公钥,而是系统的主公钥和签名方的ID。
gmssl.Sm9Signature(sign = DO_SIGN)
模块gmssl
中包含如下Sm9Signature的常量:
SM9_SIGNATURE_SIZE
对象Sm9Signature的方法:
Sm9Signature.reset()
Sm9Signature.update()
Sm9Signature.sign()
Sm9Signature.verify()
下面的例子展示了SM9签名的主密钥生成、用户私钥生成、签名、验证的过程。
master_key = Sm9SignMasterKey()
master_key.generate_master_key()
print("SM9 master key generated")
master_key.export_encrypted_master_key_info_pem('sign_msk.pem', 'password')
master_key.export_public_master_key_pem('sign_mpk.pem')
print("Export master key and public master key")
master = Sm9SignMasterKey()
master.import_encrypted_master_key_info_pem('sign_msk.pem', 'password')
signer_id = 'Alice'
key = master.extract_key(signer_id)
message = "Message to be signed"
sign = Sm9Signature(DO_SIGN)
sign.update(message.encode('utf-8'))
sig = sign.sign(key)
master_pub = Sm9SignMasterKey()
master_pub.import_public_master_key_pem('sign_mpk.pem')
verify = Sm9Signature(DO_VERIFY)
verify.update(message.encode('utf-8'))
ret = verify.verify(sig, master_pub, signer_id)