å¦è¿è®¡ç®æºç人é½ç¥é ASCII ç ï¼æ»å ±æ 128 个ï¼ç¨ä¸ä¸ªåèçä½ 7 ä½è¡¨ç¤ºï¼0~31 æ¯æ§å¶å符å¦æ¢è¡å车å é¤çï¼32~126 æ¯æå°å符ï¼å¯ä»¥éè¿é®çè¾å ¥å¹¶ä¸è½å¤æ¾ç¤ºåºæ¥ãã
128 个å符æ¾ç¶æ¯ä¸å¤ç¨çï¼äºæ¯ ISO ç»ç»å¨ ASCII ç åºç¡ä¸åå¶å®äºä¸äºåæ åç¨æ¥æ©å± ASCII ç¼ç ï¼å®ä»¬æ¯ ISO-8859-1~ISO-8859-15ï¼å ¶ä¸ ISO-8859-1 涵çäºå¤§å¤æ°è¥¿æ¬§è¯è¨å符ï¼ææåºç¨çæ广æ³ãISO-8859-1 ä»ç¶æ¯ååèç¼ç ï¼å®æ»å ±è½è¡¨ç¤º 256 个å符ããã
å®çå ¨ç§°æ¯ãä¿¡æ¯äº¤æ¢ç¨æ±åç¼ç å符é åºæ¬éãï¼å®æ¯ååèç¼ç ï¼æ»çç¼ç èå´æ¯ A1-F7ï¼å ¶ä¸ä» A1-A9 æ¯ç¬¦å·åºï¼æ»å ±å å« 682 个符å·ï¼ä» B0-F7 æ¯æ±ååºï¼å å« 6763 个æ±åãã
å ¨ç§°å«ãæ±åå ç æ©å±è§èãï¼æ¯å½å®¶ææ¯çç£å±ä¸º windows95 æå¶å®çæ°çæ±åå ç è§èï¼å®çåºç°æ¯ä¸ºäºæ©å± GB2312ï¼å å ¥æ´å¤çæ±åï¼å®çç¼ç èå´æ¯ 8140~FEFEï¼å»æ XX7Fï¼æ»å ±æ 23940 个ç ä½ï¼å®è½è¡¨ç¤º 21003 个æ±åï¼å®çç¼ç æ¯å GB2312 å ¼å®¹çï¼ä¹å°±æ¯è¯´ç¨ GB2312 ç¼ç çæ±åå¯ä»¥ç¨ GBK æ¥è§£ç ï¼å¹¶ä¸ä¸ä¼æä¹±ç ããã
å ¨ç§°æ¯ãä¿¡æ¯äº¤æ¢ç¨æ±åç¼ç å符éãï¼æ¯æå½ç强å¶æ åï¼å®å¯è½æ¯ååèãååèæè ååèç¼ç ï¼å®çç¼ç ä¸ GB2312 ç¼ç å ¼å®¹ï¼è¿ä¸ªè½ç¶æ¯å½å®¶æ åï¼ä½æ¯å®é åºç¨ç³»ç»ä¸ä½¿ç¨ç并ä¸å¹¿æ³ããã
UTF-16 ç»ä¸éç¨ä¸¤ä¸ªåè表示ä¸ä¸ªå符ï¼è½ç¶å¨è¡¨ç¤ºä¸é常ç®åæ¹ä¾¿ï¼ä½æ¯ä¹æå ¶ç¼ºç¹ï¼æå¾å¤§ä¸é¨åå符ç¨ä¸ä¸ªåèå°±å¯ä»¥è¡¨ç¤ºçç°å¨è¦ä¸¤ä¸ªåè表示ï¼åå¨ç©ºé´æ¾å¤§äºä¸åï¼å¨ç°å¨çç½ç»å¸¦å®½è¿é常æéçä»å¤©ï¼è¿æ ·ä¼å¢å¤§ç½ç»ä¼ è¾çæµéï¼èä¸ä¹æ²¡å¿ è¦ãè UTF-8 éç¨äºä¸ç§åé¿ææ¯ï¼æ¯ä¸ªç¼ç åºåæä¸åçåç é¿åº¦ãä¸åç±»åçå符å¯ä»¥æ¯ç± 1~6 个åèç»æã
UTF-8 æ以ä¸ç¼ç è§åï¼
UTF-16 å ·ä½å®ä¹äº Unicode å符å¨è®¡ç®æºä¸ååæ¹æ³ãUTF-16 ç¨ä¸¤ä¸ªåèæ¥è¡¨ç¤º Unicode 转åæ ¼å¼ï¼è¿ä¸ªæ¯å®é¿ç表示æ¹æ³ï¼ä¸è®ºä»ä¹å符é½å¯ä»¥ç¨ä¸¤ä¸ªåè表示ï¼ä¸¤ä¸ªåèæ¯ 16 个 bitï¼æä»¥å« UTF-16ãUTF-16 表示å符é常æ¹ä¾¿ï¼æ¯ä¸¤ä¸ªåè表示ä¸ä¸ªå符ï¼è¿ä¸ªå¨å符串æä½æ¶å°±å¤§å¤§ç®åäºæä½ï¼è¿ä¹æ¯ Java 以 UTF-16 ä½ä¸ºå åçå符åå¨æ ¼å¼çä¸ä¸ªå¾éè¦çåå ã
ISO è¯å¾æ³å建ä¸ä¸ªå ¨æ°çè¶ è¯è¨åå ¸ï¼ä¸çä¸ææçè¯è¨é½å¯ä»¥éè¿è¿æ¬åå ¸æ¥ç¸äºç¿»è¯ãå¯æ³èç¥è¿ä¸ªåå ¸æ¯å¤ä¹çå¤æï¼å ³äº Unicode ç详ç»è§èå¯ä»¥åèç¸åºææ¡£ãUnicode æ¯ Java å XML çåºç¡ï¼ä¸é¢è¯¦ç»ä»ç» Unicode å¨è®¡ç®æºä¸çåå¨å½¢å¼ã
UTF-16
UTF-8
å¦æä¸ä¸ªåèï¼æé«ä½ï¼ç¬¬ 8 ä½ï¼ä¸º 0ï¼è¡¨ç¤ºè¿æ¯ä¸ä¸ª ASCII å符ï¼00 - 7Fï¼ãå¯è§ï¼ææ ASCII ç¼ç å·²ç»æ¯ UTF-8 äºã
å¦æä¸ä¸ªåèï¼ä»¥ 11 å¼å¤´ï¼è¿ç»ç 1 ç个æ°æ示è¿ä¸ªå符çåèæ°ï¼ä¾å¦ï¼110xxxxx 代表å®æ¯ååè UTF-8 å符çé¦åèã
å¦æä¸ä¸ªåèï¼ä»¥ 10 å¼å§ï¼è¡¨ç¤ºå®ä¸æ¯é¦åèï¼éè¦ååæ¥æ¾æè½å¾å°å½åå符çé¦åè
详æ ä¼ éé¨è³ï¼ç½é¡µé¾æ¥