。
中包含一个长度的零的特殊字,称之为空字,记为ε。对
中的任意两个字 x 和 y,将 y 排在 x 后面得到 xy,xy显然还是
中的一个字,即运算即为字的拼接运算。显然,
对拼接运算为带幺半群,单位元为空字 ε。
的一个子集。如果对任意
,当
时,一定有 m=n,并且
,则称 C 为字母表 A 上的一个码。码 C 中的字称为码字。如果码 C 中的码字长度都相同,则称 C 为定长码;否则称其为变长码。如果 ∣A∣=n,则称 C 为 n 元码。
在编码理论中,字母表 A 一般取为有限域 GF(q)。设
表示 GF(q)上的 n 维向量空间。V(n,q) 中的向量
通常记为
。
分组码是定长码,一个 q 元 (n,M)码的所有码字长度都是 n。编码理论中主要讨论的就是分组码。
性质 显然,汉明距离作为一个距离度量,满足距离度量的三大性质:非负性、对称性以及三角不等式。
。x 中非零分量的个数称为汉明重量,记为 W(x)。设
,对于
,定义
显然
性质
的最小重量定义为 C 中所有非零码字的最小重量,记为 W(C),即
,并且y 可能不是一个码字。将 y 译为与 y 汉明距离最小的码字
是合理的。这种译码策略称为最近邻译码。
一般地,对于 q 元对称信道而言,最近邻译码就是最大似然译码。
码的最小距离是刻画码的检错和纠错性能的一个重要参数。一般用 (n,M,d) 表示码长为 n,码字个数为 M,最小距离为 d 的一个码。
。
因此,设 C 是一个码,其最小距离为 d,则码 C 至多可以检查 d−1个错误,至多纠正
个错误。
一个好的 q 元 (n,M,d) 码应具有如下性质:
码,如果汉明界等号成立,即
则称 C 为完备码。
在代数编码理论中,通常取 M=qkM = q^kM=qk。一个 qqq 元 (n,qk)(n, q^k)(n,qk) 码可以对 V(k,q)V(k, q)V(k,q) 中的全体向量进行编码。
在系统码中,信息位和校验位是截然分开的。但在非系统码中,信息位和校验位无法截然分开。校验位就是冗余位,用于在信道的接收端纠正码字在信道传输过程中发生的错误。
我们可以利用一个已知的码来构造新码:
将一个码中每个码字都增加一个或多个分量,称为码的延长。最常用的码的延长方法是对每个码字都增加一个奇偶校验位。
码的截短是码的延长的逆过程。将一个码中的每个码字都删去一个或多个分量,称为码的截短。
对一个码增加一个或多个码字后所得到的码称为扩张码。
从一个码中去掉一个或多个码字后所得到的码称为删除码。
另一种是关于字母表
的置换,称为换元型置换,记为 σ2: