문자 체계와 Unicode 입문
(r12a.github.io)
이 기사는 문자 체계와 유니코드에 대한 입문으로, 특히 CJK(중국어, 일본어) 문자 세트의 복잡성을 다룹니다. 중국어는 간체와 번체 문자의 차이와 용례를 설명하고, 일본어는 한자, 히라가나, 가타카나 세 가지 스크립트의 혼용 방식과 각 스크립트의 특징(탁음, 반탁음, 촉음 등)을 소개합니다. 유니코드가 이러한 다양한 문자들을 어떻게 지원하는지 기본적인 관점에서 제시합니다.
이 글의 핵심 포인트
- 1중국어는 번체(대만, 홍콩, 화교)와 간체(중국 본토, 싱가포르)로 나뉘며, 간체는 글자 모양 단순화 및 사용 문자 세트 축소(일부 번체 문자 2개 이상이 간체 1개로 매핑) 방식으로 간략화되었습니다.
- 2유니코드는 70,000개 이상의 한자(Han characters)를 지원하며, 일반적인 워드 프로세서에는 최소 10,000개의 한자 지원이 필요합니다.
- 3