这里复习、细讲ASCII码表,为后面的知识做铺垫。
一、128个字符的ASCII码表
重新认识一下128字符的ASCII码表。基础ascii码值最大值是0x7f=127,扩展ascii码值最大值是0xFF=255。
Dec | Hex | 缩写/字符 | 解释 |
---|---|---|---|
0 | 00 | NUL(null) | 空字符 |
1 | 01 | SOH(start of headline) | 标题开始 |
2 | 02 | STX (start of text) | 正文开始 |
3 | 03 | ETX (end of text) | 正文结束 |
4 | 04 | EOT (end of transmission) | 传输结束 |
5 | 05 | ENQ (enquiry) | 请求 |
6 | 06 | ACK (acknowledge) | 收到通知 |
7 | 07 | BEL (bell) | 响铃 |
8 | 08 | BS (backspace) | 退格 |
9 | 09 | HT (horizontal tab) | 水平制表符 |
10 | 0A | LF (NL line feed, new line) | 换行键 |
11 | 0B | VT (vertical tab) | 垂直制表符 |
12 | 0C | FF (NP form feed, new page) | 换页键 |
13 | 0D | CR (carriage return) | 回车键 |
14 | 0E | SO (shift out) | 不用切换 |
15 | 0F | SI (shift in) | 启用切换 |
16 | 10 | DLE (data link escape) | 数据链路转义 |
17 | 11 | DC1 (device control 1) | 设备控制1 |
18 | 12 | DC2 (device control 2) | 设备控制2 |
19 | 13 | DC3 (device control 3) | 设备控制3 |
20 | 14 | DC4 (device control 4) | 设备控制4 |
21 | 15 | NAK (negative acknowledge) | 拒绝接收 |
22 | 16 | SYN (synchronous idle) | 同步空闲 |
23 | 17 | ETB (end of trans. block) | 传输块结束 |
24 | 18 | CAN (cancel) | 取消 |
25 | 19 | EM (end of medium) | 介质中断 |
26 | 1A | SUB (substitute) | 替补 |
27 | 1B | ESC (escape) | 换码(溢出) |
28 | 1C | FS (file separator) | 文件分割符 |
29 | 1D | GS (group separator) | 分组符 |
30 | 1E | RS (record separator) | 记录分离符 |
31 | 1F | US (unit separator) | 单元分隔符 |
32 | 20 | (space) | 空格 |
33 | 21 | ! | |
34 | 22 | “ | |
35 | 23 | # | |
36 | 24 | $ | |
37 | 25 | % | |
38 | 26 | & | |
39 | 27 | ‘ | |
40 | 28 | ( | |
41 | 29 | ) | |
42 | 2A | * | |
43 | 2B | + | |
44 | 2C | , | |
45 | 2D | - | |
46 | 2E | . | |
47 | 2F | / | |
48 | 30 | 0 | |
49 | 31 | 1 | |
50 | 32 | 2 | |
51 | 33 | 3 | |
52 | 34 | 4 | |
53 | 35 | 5 | |
54 | 36 | 6 | |
55 | 37 | 7 | |
56 | 38 | 8 | |
57 | 39 | 9 | |
58 | 3A | : | |
59 | 3B | ; | |
60 | 3C | < | |
61 | 3D | = | |
62 | 3E | > | |
63 | 3F | ? | |
64 | 40 | @ | |
65 | 41 | A | |
66 | 42 | B | |
67 | 43 | C | |
68 | 44 | D | |
69 | 45 | E | |
70 | 46 | F | |
71 | 47 | G | |
72 | 48 | H | |
73 | 49 | I | |
74 | 4A | J | |
75 | 4B | K | |
76 | 4C | L | |
77 | 4D | M | |
78 | 4E | N | |
79 | 4F | O | |
80 | 50 | P | |
81 | 51 | Q | |
82 | 52 | R | |
83 | 53 | S | |
84 | 54 | T | |
85 | 55 | U | |
86 | 56 | V | |
87 | 57 | W | |
88 | 58 | X | |
89 | 59 | Y | |
90 | 5A | Z | |
91 | 5B | [ | |
92 | 5C | \ | |
93 | 5D | ] | |
94 | 5E | ^ | |
95 | 5F | _ | |
96 | 60 | ` | |
97 | 61 | a | |
98 | 62 | b | |
99 | 63 | c | |
100 | 64 | d | |
101 | 65 | e | |
102 | 66 | f | |
103 | 67 | g | |
104 | 68 | h | |
105 | 69 | i | |
106 | 6A | j | |
107 | 6B | k | |
108 | 6C | l | |
109 | 6D | m | |
110 | 6E | n | |
111 | 6F | o | |
112 | 70 | p | |
113 | 71 | q | |
114 | 72 | r | |
115 | 73 | s | |
116 | 74 | t | |
117 | 75 | u | |
118 | 76 | v | |
119 | 77 | w | |
120 | 78 | x | |
121 | 79 | y | |
122 | 7A | z | |
123 | 7B | { | |
124 | 7C | | | |
125 | 7D | } | |
126 | 7E | ~ | |
127 | 7F | DEL (delete) | 删除 |
二、ASCII码表带来的现象
2.1 Modbus协议模式选择
在Modbus通讯协议中,分为RTU & ASCII 模式。在底层的串口配置中,RTU模式只能配置 8-e-1,8-o-1,8-n-1的8位数据位;而ASCII模式不仅可以配置以上的模式,还可以配置7-e-1,7-o-1,7-n-1。
这里的原因,就是因为ASCII基本码就是128个,完全(刚好)能用7个bit来表示。而RTU发送十六进制的数据,则需要8个bit(0xff),被去掉了一位,因为是不支持7位的数据位发送。
这里又暗示了串口的一个理解上的误区。串口发送的最小单位和数据帧的最小单位。假如串口模式是7位的数据位,你发的是数据基本单位是0xff(8bit);例如你发 0xff 0x12 0x34 ,此时串口会截取掉高位,只发每个数据单元的7bit。不会说这先发这个数据的7bit,多出来的 1bit 下次再填进去补给你(下次一定)。
2.2 中文字符乱码
从上面延伸出来的串口发送知识误区,得到一种 中文字符乱码 的现象。假如一个产品,有中英文,可以通过串口打印出数据;你会发现一旦串口配置为7位数据位,英文版本打印正常,而中文版本打印异常。
这就是因为汉字是双字的,拆分出来两个8bit(0xff),假如串口使用7位的数据位,就会截取掉高位;而英文是ASCII,只需要7bit,因此英文显示正常。
2.3 对字符的解析
常见于几种情况,举例如下:
- 制作裸机不带enwin的嵌入式led驱动
- 与GSM模块等通讯
- 通讯协议的数据包的识别区分(例如X-modem协议)
led驱动的字符显示驱动,把要显示的字符串,截取成逐个的字符,做显示;显示会做判断两种情况,:
- *s < 128 , 显示ASCII码库的字符
- *s > 128 , 显示自己写的(汉字)库的字符(汉字双字节 0xffff 明显超过 0x7f)
与GSM模块进行通讯配置的时候,而且这种通讯是字符的。
1 | if((uint32_t)cmd<=0XFF) |
如果是有写过类似GSM模块通讯的,应该都看过类似上面语句。主控发给模块的指令,先分解逐个字符;再根据是否小于0xff,是直接发还是用字符串打印函数。
如果是小于0xff,当然是可以用串口8位的数据位进行发送;但是什么时候才会大于0xff,就是该 cmd 非ASCII的时候(而是字符串),例如汉字。
X-modem协议的数据包的识别区分。当利用Xmodem协议进行传输文本文件,因为数据包的结束符 CTRL-Z(0x1A) 不是前128个ascii码中的通用可见字母字符( 0x1A 对应 SUB[替补],非文本文件的字符 )。