CRC的原理和实现

ting123 | 当前状态：在线 总积分：11075 2025年可用积分：0 注册时间： 2009-06-24 最后登录时间： 2011-10-07 空间发短消息加为好友: CRC的原理和实现

ting123 发表于 2009/7/25 7:32:15 726 查看 1 回复 [上一主题] [下一主题]

手机阅读

1.差错检测
----------
数据通信中，接收端需要检测在传输过程中是否发生差错，常用的技术有奇偶校验(Parity
Check)，校验和(Checksum)和CRC(Cyclic Redundancy Check)。它们都是发送端对消息按照
某种算法计算出校验码，然后将校验码和消息一起发送到接收端。接收端对接收到的消息按
照相同算法得出校验码，再与接收到的校验码比较，以判断接收到消息是否正确。

奇偶校验只需要1位校验码，其计算方法也很简单。以奇检验为例，发送端只需要对所有消息
位进行异或运算，得出的值如果是0，则校验码为1，否则为0。接收端可以对消息进行相同计
算，然后比较校验码。也可以对消息连同校验码一起计算，若值是0则有差错，否则校验通过。
通常说奇偶校验可以检测出1位差错，实际上它可以检测出任何奇数位差错。

校验和的思想也很简单，将传输的消息当成8位(或16/32位)整数的序列，将这些整数加起来
而得出校验码，该校验码也叫校验和。校验和被用在IP协议中，按照16位整数运算，而且其
MSB(Most Significant Bit)的进位被加到结果中。

显然，奇偶校验和校验和都有明显的不足。奇偶校验不能检测出偶数位差错。对于校验和，

PLC

如果整数序列中有两个整数出错，一个增加了一定的值，另一个减小了相同的值，这种差错
就检测不出来。

2.CRC算法的基本原理
-------------------
CRC算法的是以GF(2)(2元素伽罗瓦域)多项式算术为数学基础的，听起来很恐怖，但实际上它
的主要特点和运算规则是很好理解的。

GF(2)多项式中只有一个变量x，其系数也只有0和1，如：
    1*x^7 + 0*x^6 + 1*x^5 + 0*x^4 + 0*x^3 + 1*x^2 +1*x^1 + 1*x^0
即：
    x^7 + x^5 + x^2 + x + 1
(x^n表示x的n次幂)

GF(2)多项式中的加减用模2算术执行对应项上系数的加减，模2就是加减时不考虑进位和借位，
即：
    0 + 0 = 0    0 - 0 = 0
    0 + 1 = 1    0 - 1 = 1
    1 + 0 = 1    1 - 0 = 1
    1 + 1 = 0    1 - 1 = 0

PLC

显然，加和减是一样的效果(故在GF(2)多项式中一般不出现"-"号)，都等同于异或运算。例
如P1 = x^3 + x^2 + 1，P2 = x^3 + x^1 + 1，P1 + P2为：

    x^3 + x^2 　　+ 1
+ x^3        + x + 1
    ------------------
           x^2 + x

GF(2)多项式乘法和一般多项式乘法基本一样，只是在各项相加的时候按模2算术进行，例如
P1 * P2为：

    (x^3 + x^2 + 1)(x^3 + x^1 + 1)
    = (x^6 + x^4 + x^3
     + x^5 + x^3 + x^2
     + x^3 + x + 1)
    = x^6 + x^5 + x^4 + x^3 + x^2 + x + 1

GF(2)多项式除法也和一般多项式除法基本一样，只是在各项相减的时候按模2算术进行，例
如P3 = x^7 + x^6 + x^5 + x^2 + x，P3 / P2为：

                                       x^4 + x^3           + 1 PLC
                    ------------------------------------------
        x^3 + x + 1 )x^7 + x^6 + x^5 +             x^2 + x
                     x^7       + x^5 + x^4
                     ---------------------
                           x^6       + x^4
                           x^6       + x^4 + x^3

PLC

                           ---------------------
                                             x^3 + x^2 + x
                                             x^3       + x + 1
                                             -----------------

PLC

x^2 + 1

CRC算法将长度为m位的消息对应一个GF(2)多项式M，比如对于8位消息11100110，如果先传输
MSB，则它对应的多项式为x^7 + x^6 + x^5 + x^2 + x。发送端和接收端约定一个次数为r的
GF(2)多项式G，称为生成多项式，比如x^3 + x + 1，r = 3。在消息后面加上r个0对应的多
项式为M'，显然有M' = Mx^r。用M'除以G将得到一个次数等于或小于r - 1的余数多项式R，
其对应的r位数值则为校验码。如下所示：

             11001100 PLC
         -------------
    1011 )11100110000
          1011.......
          ----.......
           1010......
           1011......
           ----......
              1110...
              1011...
              ----...
               1010.. PLC资料网
               1011..
               ----
                  100 <---校验码

发送端将m位消息连同r位校验码(也就是M' + R)一起发送出去，接收端按同样的方法算出收
到的m位消息的校验码，再与收到的校验码比较。接收端也可以用收到的全部m + r位除以生
成多项式，再判断余数是否为0。这是因为，M' + R = (QG + R) + R = QG，这里Q是商。显
然，它也可以像发送端一样，在全部m + r后再增加r个0，再除以生成多项式，如果没有差错
发生，余数仍然为0。

1楼 0 0 回复

ting123   |   当前状态：在线

总积分：11075  2025年可用积分：0

注册时间： 2009-06-24

最后登录时间： 2011-10-07

空间发短消息加为好友

ting123   发表于 2009/7/25 7:32:15

------------------ PLC资料网
很明显，不同的生成多项式，其检错能力是不同的。如何选择一个好的生成多项式需要一定
的数学理论，这里只从一些侧面作些分析。显然，要使用r位校验码，生成多项式的次数应为
r。生成多项式应该包含项"1"，否则校验码的LSB(Least Significant Bit)将始终为0。如果
消息(包括校验码)T在传输过程中产生了差错，则接收端收到的消息可以表示为T + E。若E不
能被生成多项式G除尽，则该差错可以被检测出。考虑以下几种情况：
    1)1位差错，即E = x^n = 100...00，n >= 0。只要G至少有2位1，E就不能被G除尽。这
      是因为Gx^k相当于将G左移k位，对任意多项式Q，QG相当于将多个不同的G的左移相加。
      如果G至少有两位1，它的多个不同的左移相加结果至少有两位1。

    2)奇数位差错，只要G含有因子F = x + 1，E就不能被G除尽。这是因为QG = Q'F，由1)
      的分析，F的多个不同的左移相加结果1的位数必然是偶数。

    3)爆炸性差错，即E = (x^n + ... + 1)x^m = 1...100...00，n >= 1，m >= 0，显然只 PLC
      要G包含项"1"，且次数大于n，就不能除尽E。

    4)2位差错，即E = (x^n + 1)x^m = 100...00100...00，n >= 0。设x^n + 1 = QG + R，
      则E = QGx^m + Rx^m，由3)可知E能被G除尽当且仅当R为0。因此只需分析x^n + 1，根
      据[3]，对于次数r，总存在一个生成多项式G，使得n最小为2^r - 1时，才能除尽x^n
      + 1。称该生成多项式是原始的(primitive)，它提供了在该次数上检测2位差错的最高
      能力，因为当n = 2^r - 1时，x^n + 1能被任何r次多项式除尽。[3]同时指出，原始
      生成多项式是不可约分的，但不可约分的的多项式并不一定是原始的，因此对于某些
      奇数位差错，原始生成多项式是检测不出来的。

以下是一些标准的CRC算法的生成多项式：

    标准            多项式                                           16进制表示
PLC

    ---------------------------------------------------------------------------
    CRC12           x^12 + x^11 + x^3 + x^2 + x + 1                  80F
    CRC16           x^16 + x^15 + x^2 + 1                            8005
    CRC16-CCITT     x^16 + x^12 + x^5 + 1                            1021
    CRC32           x^32 + x^26 + x^23 + x^22 + x^16 + x^12 + x^11   04C11DB7
                    + x^10 + x^8 + x^7 + x^5 + x^4 + x^2 + x + 1 PLC资料网

16进制表示去掉了最高次项，CCITT在1993年改名为ITU-T。CRC12用于6位字节，其它用于8位
字节。CRC16在IBM的BISYNCH通信标准。CRC16-CCITT被广泛用于XMODEM, X.25和SDLC等通信
协议。而以太网和FDDI则使用CRC32，它也被用在ZIP，RAR等文件压缩中。在这些生成多项式
中，CRC32是原始的，而其它3个都含有因子x + 1。

4.CRC算法的实现
---------------
要用程序实现CRC算法，考虑对第2节的长除法做一下变换，依然是M = 11100110，G = 1011，
其系数r为3。

             11001100                      11100110000
PLC资料网

         -------------                     1011
    1011 )11100110000                      -----------
          1011.......                       1010110000
          ----.......                      1010110000
           1010......                      1011 PLC资料网
           1011......        ===>          -----------
           ----......                       001110000
              1110...                      1110000
              1011...                      1011
              ----...                      ----------- PLC资料网
               1010..                       101000
               1011..                      101000
               ----                        1011
                  100 <---校验码          -----------
                                            00100
PLC资料网

                                            100           <---校验码

程序可以如下实现：
    1)将Mx^r的前r位放入一个长度为r的寄存器；
    2)如果寄存器的首位为1，将寄存器左移1位(将Mx^r剩下部分的MSB移入寄存器的LSB)，
      再与G的后r位异或，否则仅将寄存器左移1位(将Mx^r剩下部分的MSB移入寄存器的LSB)；
    3)重复第2步，直到M全部Mx^r移入寄存器；
    4)寄存器中的值则为校验码。

用CRC16-CCITT的生成多项式0x1021，其C代码(本文所有代码假定系统为32位，且都在VC6上
PLC

编译通过)如下：

unsigned short do_crc(unsigned char *message, unsigned int len)
{
    int i, j;
    unsigned short crc_reg;

    crc_reg = (message[0] << 8) + message[1];
    for (i = 0; i < len; i++)
    {
        if (i < len - 2)
            for (j = 0; j <= 7; j++)
            {
                if ((short)crc_reg < 0)
                    crc_reg = ((crc_reg << 1) + (message[i + 2] >> (7 - i))) ^ 0x1021;
                else PLC
                    crc_reg = (crc_reg << 1) + (message[i + 2] >> (7 - i));
            }
         else
            for (j = 0; j <= 7; j++)
            {
                if ((short)crc_reg < 0)
                    crc_reg = (crc_reg << 1) ^ 0x1021;
                else
                    crc_reg <<= 1;
PLC

            }
    }
    return crc_reg;
}

显然，每次内循环的行为取决于寄存器首位。由于异或运算满足交换率和结合律，以及与0异
或无影响，消息可以不移入寄存器，而在每次内循环的时候，寄存器首位再与对应的消息位
异或。改进的代码如下：

unsigned short do_crc(unsigned char *message, unsigned int len)
{
    int i, j;
    unsigned short crc_reg = 0;
    unsigned short current;

    for (i = 0; i < len; i++)
    {
        current = message[i] << 8;
        for (j = 0; j < 8; j++)
        {
PLC

            if ((short)(crc_reg ^ current) < 0)
                crc_reg = (crc_reg << 1) ^ 0x1021;
            else
                crc_reg <<= 1;
            current <<= 1;
        }
    }
    return crc_reg;
}

以上的讨论中，消息的每个字节都是先传输MSB，CRC16-CCITT标准却是按照先传输LSB，消息
右移进寄存器来计算的。只需将代码改成判断寄存器的LSB，将0x1021按位颠倒后(0x8408)与
寄存器异或即可，如下所示：

unsigned short do_crc(unsigned char *message, unsigned int len) PLC
{
    int i, j;
    unsigned short crc_reg = 0;
    unsigned short current;

    for (i = 0; i < len; i++)
    {
        current = message[i];
        for (j = 0; j < 8; j++)
        {
            if ((crc_reg ^ current) & 0x0001)
                crc_reg = (crc_reg >> 1) ^ 0x8408;
            else
                crc_reg >>= 1;
            current >>= 1;            PLC资料网
        }
    }
    return crc_reg;
}

该算法使用了两层循环，对消息逐位进行处理，这样效率是很低的。为了提高时间效率，通
常的思想是以空间换时间。考虑到内循环只与当前的消息字节和crc_reg的低字节有关，对该
算法做以下等效转换：

unsigned short do_crc(unsigned char *message, unsigned int len)
{
    int i, j;
    unsigned short crc_reg = 0;
    unsigned char index;
    unsigned short to_xor;

    for (i = 0; i < len; i++)
    {
        index = (crc_reg ^ message[i]) & 0xff;
        to_xor = index;
        for (j = 0; j < 8; j++)
PLC资料网

        {
            if (to_xor & 0x0001)
                to_xor = (to_xor >> 1) ^ 0x8408;
            else
                to_xor >>= 1;
        }
        crc_reg = (crc_reg >> 8) ^ to_xor;
    }
    return crc_reg;
}
2楼 回复本楼

引用 ting123 2009/7/25 7:32:15 发表于2楼的内容

总共 1, 当前 1/1

高级回复 | 发新主题

发表新帖

控制工程师论坛

2016年积分排行