编码错误导致的乱码类型对照表
文本内容
| 名称 | 示例 | 特点 | 产生原因 |
|---|---|---|---|
| 古文码 | 鏨辨湥瑕佽ソ濂藉囗涔豺ぉ澶┿悭涓? | 大都为不认识的古文,并加杂日韩文 | 以GBK方式读取UTF-8编码的中文 |
| 口字码 | �����Ç�¨²�мх������ | 大部分字符为小方块 | 以UTF-8的方式读取GBK编码的中文 |
| 符号码 | ç ±æ è¦ å¥½å¥½å¦ä¹ 天天å�¦ | 大部分字符为各种符号 | 以ISO8859-1方式读取UTF-8编码的中文 |
| 拼音码 | ÓÉÔÂÒàºÃÕÂѧϰììììòÉÏ | 大部分字符为头顶带有各种类似声调符号的字母 | 以ISO8859-1方式读取GBK编码的中文 |
| 问句码 | 由月要好好学习天天向?? | 字符串长度为偶数时正确,长度为奇数时最后的字符变为问号 | 以GBK方式读取UTF-8编码的中文,然后又用UTF-8的格式再次读取 |
| 锟拷码 | 锟斤拷锟斤拷要锟矫猴拷学习锟斤拷锟斤拷锟斤拷锟斤拷 | 全中文字符,且大部分字符为“锟斤拷”这几个字符 | 以UTF-8方式读取GBK编码的中文,然后又用GBK的格式再次读取 |
整体描述
这是一张整理了六种因编码格式不匹配导致的乱码类型的对照表,包含古文码、口字码、符号码、拼音码、问句码、锟拷码等,每种乱码都给出了示例、特点和产生原因,清晰展示了不同编码(UTF-8、GBK、ISO8859-1)互相错误读取时产生的不同乱码表现,帮助识别乱码的成因,是实用的计算机编码知识科普内容。
来源说明
这是一张计算机编码相关的知识整理图,由编程或计算机领域的从业者/爱好者制作,用于科普不同编码错误读取时产生的乱码类型,大概率首发于CSDN、知乎等技术社区,帮助遇到乱码问题的用户快速定位乱码成因,解决编码适配问题。