코드 페이지 950
Code page 950언어 | 번체 중국어 |
---|---|
작성자 | 마이크로소프트 |
확장 | 빅5 |
에 기반을 둔 | Big5-ETEN |
Code page 950은 Microsoft Windows에서 중국어 번체용으로 사용되는 코드 페이지입니다.이것은 사실상의 표준 Big5 문자 인코딩을 마이크로소프트가 구현한 것입니다.코드 페이지는 IANA [1]에 등록되어 있지 않기 때문에, 인터넷을 개입시켜 정보를 교환하는 것은 표준이 아닙니다.다만, 통상은 간단하게 「」라고 하는 라벨이 붙어 있습니다.big5
(Microsoft 라이브러리 [2]기능 포함)
용어와 변종
Windows 코드 페이지950과 「공통」(벤더 고유하지 않은) Big5의 큰 차이는, 0xF9의 Big5에 ETEN 확장의 서브셋을 짜넣는 것입니다.D6 ~ 0xF9FE(', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 34개의 상자 그리기 문자 및 블록 요소로 구성됩니다.)다른 일부 ETEN 확장 문자에 의해 사용되는 범위는 최종 사용자 정의([3]프라이빗 사용) 문자로 정의됩니다.
IBM의 CCSID 950, 또한 Big5 변형, 다소 마이크로 소프트의 코드 페이지 950반면 그 리드 바이트 0xF9(지..지와 함께 생략하는 납 바이트 0xA3,[7]0xC6,[3][8]0xC7[9]과 0xC8,[3][10]하기 위해서 약간의 ETEN 확장 통합하는 다르다 싱글 바이트 코드 페이지를 1114년(CCSID 1114년)과 더블 바이트 코드 페이지 947(CCSID서 947)[4][5][6]로 구성되어 있다hich 마이크로 소프트)엄마 포함한다사용자 정의 문자로 [3][11]Private Use Area에 ping합니다.또한 Trail 바이트가 0x81~A0인 2개의 비 ETEN 확장 영역도 포함되어 있습니다.즉, 통상적인 Big5 트레일 바이트 범위 밖이지만 Big5+ 트레일 바이트 범위와 유사합니다.영역 5에는 리드 바이트가 0xF2~F9가 있으며, 영역 9에는 리드 바이트가 0x81~8C로 사용자 [12]정의되어 있습니다.
Microsoft는 2000년에 코드 페이지 950 버전을 업데이트하여 더블바이트 코드 0xA3E1에 유로 기호(€)를 추가했습니다.IBM은 Big-5 배리언트의 유로 부호 업데이트를 CCSID 1370(싱글 바이트(0x80)과 더블 바이트 유로 [13]부호 모두 포함)이라고 부릅니다.싱글 바이트 코드 페이지 1114(CCSID 5210)와 더블 바이트 코드 페이지 947(CCSID 21427)[13][14][15]로 구성됩니다.
IBM DB2의 마이크로소프트 버전과의 더 나은 호환성을 위해 IBM은 또한 이중 바이트 코드 페이지[16] 1372 및 관련 가변 너비 CCSID 1373을 정의합니다. 이 페이지에는 이중 바이트 유로[17] 기호만 포함되며 확장 영역이 [18][19][20][21][22]포함된 마이크로소프트의 동작과 일치합니다.
싱글 바이트 코드
다음은 IBM에 포함된 단일 바이트 그래픽 문자입니다.코드 0x00 ~0x1F 및 0x7F는 컨텍스트에 따라 대신 C0 제어 코드에 사용할 수 있습니다(코드 페이지 437, 코드 페이지 897 비교).상기와 같이, 0x80 의 싱글 바이트의 유로 기호는 IBM CCSID 950 또는 1373 에 포함되어 있지 않습니다.또, Microsoft 에 의해서도 포함되어 있지 않습니다.
코드 페이지 1114[23][24] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | ☺ | ☻ | ♥ | ♦ | ♣ | ♠ | • | ◘ | ○ | ◙ | ♂ | ♀ | ♪ | ♫ | ☼ | |
1배 | ► | ◄ | ↕ | ‼ | § | ▬ | ↨ | ↑ | ↓ | → | ← | ∟ | ↔ | ▲ | ▼ | |
2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | ⌂ | |
8배 | € |
나머지는 이중 바이트 시퀀스의 일부입니다.
개인 용도 영역 사용
Big5 범위 | 유니코드 범위 | 공식[26] |
---|---|---|
81 40~8D FE | U+EEB8–U+F6B0 | 0xeeb8 + (157 * (H-0x81)) + (L<0x80)?(L-0x40):(L-0x62) |
8E 40 – A0 FE | U+E311 – U+EEB7 | 0xe311 + (157 * (H-0x8e)) + (L<0x80)?(L-0x40):(L-0x62) |
C6 A1~C8 FE | U+F6B1–U+F848 | 0xf672 + (157 * (H-0xc6)) + (L<0x80)?(L-0x40):(L-0x62) |
FA 40 – FE FE | U+E000-U+E310 | 0xe000 + (157 * (H-0xfa)) + (L<0x80)?(L-0x40):(L-0x62) |
이 매핑은 지정된 [27]Unicode 리비전에서 특정 글리프가 아직 발견되지 않은 HKSCS에서도 사용됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "Character Sets". IANA — Protocol Registries.
- ^ "Encoding.WindowsCodePage Property - .NET Framework (current version)". MSDN. Microsoft.
- ^ a b c d Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). "Chinese Character Encoding for Internet Messages". Requests for Comments. IETF. doi:10.17487/rfc1922. RFC 1922.
- ^ "CCSID 950 information document". Archived from the original on 2014-12-02.
- ^ "CCSID 1114 information document". Archived from the original on 2016-03-27.
- ^ "CCSID 947 information document". Archived from the original on 2014-12-01.
- ^ "Lead byte A3: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C6: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C7: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C8: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte F9: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "IBM Traditional Chinese Graphic Character Set for IBM BIG-5 Code" (PDF). IBM. 1999. C-H 3-3220-131 1999-04.
- ^ a b "CCSID 1370 information document". Archived from the original on 2016-03-27.
- ^ "CCSID 5210 information document". Archived from the original on 2014-11-29.
- ^ "CCSID 21427 information document". Archived from the original on 2016-03-27.
- ^ "CPGID 01372: MS T-Chinese Big-5 (Special for DB2)". IBM Globalization - Code page identifiers. Archived from the original on 2016-03-17.
- ^ "ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte A3: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C6: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C7: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C8: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte F9: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ Code Page CPGID 01114 (pdf) (PDF), IBM
- ^ Code Page CPGID 01114 (txt), IBM
- ^ "Windows Best Fit Chart: CP950". unicode.org. Retrieved 13 September 2016.
- ^ "Big5". Kanji Database. Retrieved 13 September 2016.
- ^ "Big5-HKSCS:2008". Archived from the original on 2016-09-13.
외부 링크
- Microsoft의 코드 레퍼런스 페이지 950
- 코드 페이지 950에서 Unicode로의 매핑
- ICU(International Components for Unicode) 매핑 파일: windows-950-2000.ucm, ibm-950_P110-199.ucm, ibm-1373_P100-2002.ucm