코드 페이지 950

Code page 950
코드 페이지 950
Code-page-950.svg
Microsoft(위, MS-950 또는 IBM-1373) 및 IBM(아래, IBM-950)에서 구현한 코드 페이지 950 레이아웃.
언어번체 중국어
작성자마이크로소프트
확장빅5
에 기반을 둔Big5-ETEN

Code page 950은 Microsoft Windows에서 중국어 번체용으로 사용되는 코드 페이지입니다.이것은 사실상표준 Big5 문자 인코딩을 마이크로소프트가 구현한 것입니다.코드 페이지는 IANA [1]등록되어 있지 않기 때문에, 인터넷을 개입시켜 정보를 교환하는 것은 표준이 아닙니다.다만, 통상은 간단하게 「」라고 하는 라벨이 붙어 있습니다.big5(Microsoft 라이브러리 [2]기능 포함)

용어와 변종

Windows 코드 페이지950과 「공통」(벤더 고유하지 않은) Big5의 큰 차이는, 0xF9의 Big5에 ETEN 확장의 서브셋을 짜넣는 것입니다.D6 ~ 0xF9FE(', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 34개의 상자 그리기 문자 및 블록 요소구성됩니다.)다른 일부 ETEN 확장 문자에 의해 사용되는 범위는 최종 사용자 정의([3]프라이빗 사용) 문자로 정의됩니다.

IBM의 CCSID 950, 또한 Big5 변형, 다소 마이크로 소프트의 코드 페이지 950반면 그 리드 바이트 0xF9(지..지와 함께 생략하는 납 바이트 0xA3,[7]0xC6,[3][8]0xC7[9]과 0xC8,[3][10]하기 위해서 약간의 ETEN 확장 통합하는 다르다 싱글 바이트 코드 페이지를 1114년(CCSID 1114년)과 더블 바이트 코드 페이지 947(CCSID서 947)[4][5][6]로 구성되어 있다hich 마이크로 소프트)엄마 포함한다사용자 정의 문자로 [3][11]Private Use Area에 ping합니다.또한 Trail 바이트가 0x81~A0인 2개의 비 ETEN 확장 영역도 포함되어 있습니다.즉, 통상적인 Big5 트레일 바이트 범위 밖이지만 Big5+ 트레일 바이트 범위와 유사합니다.영역 5에는 리드 바이트가 0xF2~F9가 있으며, 영역 9에는 리드 바이트가 0x81~8C로 사용자 [12]정의되어 있습니다.

Microsoft는 2000년에 코드 페이지 950 버전을 업데이트하여 더블바이트 코드 0xA3E1에 유로 기호(€)를 추가했습니다.IBM은 Big-5 배리언트의 유로 부호 업데이트를 CCSID 1370(싱글 바이트(0x80)과 더블 바이트 유로 [13]부호 모두 포함)이라고 부릅니다.싱글 바이트 코드 페이지 1114(CCSID 5210)와 더블 바이트 코드 페이지 947(CCSID 21427)[13][14][15]로 구성됩니다.

IBM DB2의 마이크로소프트 버전과의 더 나은 호환성을 위해 IBM은 또한 이중 바이트 코드 페이지[16] 1372 및 관련 가변 너비 CCSID 1373을 정의합니다. 이 페이지에는 이중 바이트 유로[17] 기호만 포함되며 확장 영역이 [18][19][20][21][22]포함된 마이크로소프트의 동작과 일치합니다.

싱글 바이트 코드

다음은 IBM에 포함된 단일 바이트 그래픽 문자입니다.코드 0x00 ~0x1F 및 0x7F는 컨텍스트에 따라 대신 C0 제어 코드에 사용할 수 있습니다(코드 페이지 437, 코드 페이지 897 비교).상기와 같이, 0x80 의 싱글 바이트의 유로 기호는 IBM CCSID 950 또는 1373 에 포함되어 있지 않습니다.또, Microsoft 에 의해서도 포함되어 있지 않습니다.

코드 페이지 1114[23][24]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1배 §
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배

나머지는 이중 바이트 시퀀스의 일부입니다.

개인 용도 영역 사용

Big5에서 코드[25] 포인트로의 매핑
Big5 범위 유니코드 범위 공식[26]
81 40~8D FE U+EEB8–U+F6B0 0xeeb8 + (157 * (H-0x81)) + (L<0x80)?(L-0x40):(L-0x62)
8E 40 – A0 FE U+E311 – U+EEB7 0xe311 + (157 * (H-0x8e)) + (L<0x80)?(L-0x40):(L-0x62)
C6 A1~C8 FE U+F6B1–U+F848 0xf672 + (157 * (H-0xc6)) + (L<0x80)?(L-0x40):(L-0x62)
FA 40 – FE FE U+E000-U+E310 0xe000 + (157 * (H-0xfa)) + (L<0x80)?(L-0x40):(L-0x62)

이 매핑은 지정된 [27]Unicode 리비전에서 특정 글리프가 아직 발견되지 않은 HKSCS에서도 사용됩니다.

「 」를 참조해 주세요.

  • LMBCS-18
  • 코드 페이지 951 - Windows XP에서 cp950을 HKSCS 지원 버전으로 대체하기 위한 Microsoft 해킹

레퍼런스

  1. ^ "Character Sets". IANA — Protocol Registries.
  2. ^ "Encoding.WindowsCodePage Property - .NET Framework (current version)". MSDN. Microsoft.
  3. ^ a b c d Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). "Chinese Character Encoding for Internet Messages". Requests for Comments. IETF. doi:10.17487/rfc1922. RFC 1922.
  4. ^ "CCSID 950 information document". Archived from the original on 2014-12-02.
  5. ^ "CCSID 1114 information document". Archived from the original on 2016-03-27.
  6. ^ "CCSID 947 information document". Archived from the original on 2014-12-01.
  7. ^ "Lead byte A3: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
  8. ^ "Lead byte C6: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
  9. ^ "Lead byte C7: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
  10. ^ "Lead byte C8: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
  11. ^ "Lead byte F9: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
  12. ^ "IBM Traditional Chinese Graphic Character Set for IBM BIG-5 Code" (PDF). IBM. 1999. C-H 3-3220-131 1999-04.
  13. ^ a b "CCSID 1370 information document". Archived from the original on 2016-03-27.
  14. ^ "CCSID 5210 information document". Archived from the original on 2014-11-29.
  15. ^ "CCSID 21427 information document". Archived from the original on 2016-03-27.
  16. ^ "CPGID 01372: MS T-Chinese Big-5 (Special for DB2)". IBM Globalization - Code page identifiers. Archived from the original on 2016-03-17.
  17. ^ "ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
  18. ^ "Lead byte A3: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
  19. ^ "Lead byte C6: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
  20. ^ "Lead byte C7: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
  21. ^ "Lead byte C8: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
  22. ^ "Lead byte F9: ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
  23. ^ Code Page CPGID 01114 (pdf) (PDF), IBM
  24. ^ Code Page CPGID 01114 (txt), IBM
  25. ^ "Windows Best Fit Chart: CP950". unicode.org. Retrieved 13 September 2016.
  26. ^ "Big5". Kanji Database. Retrieved 13 September 2016.
  27. ^ "Big5-HKSCS:2008". Archived from the original on 2016-09-13.

외부 링크