이곳은 개발을 위한 베타 사이트 입니다.
기여내역은 언제든 초기화될 수 있으며, 예기치 못한 오류가 발생할 수 있습니다.
기여내역은 언제든 초기화될 수 있으며, 예기치 못한 오류가 발생할 수 있습니다.
한자/SIP
덤프버전 :
상위 문서: 한자
SIP는 사실상 한자 전용 평면이다. 평면 이름부터 보조 표의 문자 평면(Supplementary Ideographic Plane)이다.[1] 유니코드의 BMP 영역에는 이미 2만 7천여 자나 되는 한자가 배당되어 있지만, 그것만으로는 부족하기 때문에 한자 전용 평면을 만든 것이다.
SIP의 한자는 현대에는 잘 쓰이지 않는다고 생각하기 쉬우나, 현대에도 잘 쓰이는 것들이 있다. 𠮟[2] , 𠮷, 𥝱[3] , 𩸽 등은 현대 일본어에서 쓰이고, 주기율표/중국어의 𬭊/𨧀, 𬭳/𨭎, 𬭛/𨨏, 𬭶/𨭆, 𫟼, 𬬭, 𫓧, 𫟷 등은 현대 표준중국어에서 쓰이며, 𡃁, 𨋢 등은 현대 광동어에서 쓰인다.
단일 문서로 SIP의 모든 글자를 넣기에는 공간이 너무 부족해서 부득이하게 16개의 유니코드 하위 문서로 대체되었다. SIP는 UTF-8에서는 모두 4바이트 크기다. 만약 이 문서 하나에 65,535자가 모두 들어가버리면 이 문서 하나 용량만 무려 262,140바이트+α 즉 262KB이다.(...)문제는 이걸로도 안 끝난다는 거(…)
1. 개요[편집]
SIP는 사실상 한자 전용 평면이다. 평면 이름부터 보조 표의 문자 평면(Supplementary Ideographic Plane)이다.[1] 유니코드의 BMP 영역에는 이미 2만 7천여 자나 되는 한자가 배당되어 있지만, 그것만으로는 부족하기 때문에 한자 전용 평면을 만든 것이다.
2. 상세[편집]
SIP의 한자는 현대에는 잘 쓰이지 않는다고 생각하기 쉬우나, 현대에도 잘 쓰이는 것들이 있다. 𠮟[2] , 𠮷, 𥝱[3] , 𩸽 등은 현대 일본어에서 쓰이고, 주기율표/중국어의 𬭊/𨧀, 𬭳/𨭎, 𬭛/𨨏, 𬭶/𨭆, 𫟼, 𬬭, 𫓧, 𫟷 등은 현대 표준중국어에서 쓰이며, 𡃁, 𨋢 등은 현대 광동어에서 쓰인다.
단일 문서로 SIP의 모든 글자를 넣기에는 공간이 너무 부족해서 부득이하게 16개의 유니코드 하위 문서로 대체되었다. SIP는 UTF-8에서는 모두 4바이트 크기다. 만약 이 문서 하나에 65,535자가 모두 들어가버리면 이 문서 하나 용량만 무려 262,140바이트+α 즉 262KB이다.(...)
- 유니코드/20000~20FFF
- 유니코드/21000~21FFF
- 유니코드/22000~22FFF
- 유니코드/23000~23FFF
- 유니코드/24000~24FFF
- 유니코드/25000~25FFF
- 유니코드/26000~26FFF
- 유니코드/27000~27FFF
- 유니코드/28000~28FFF
- 유니코드/29000~29FFF
- 유니코드/2A000~2AFFF
- 유니코드/2B000~2BFFF
- 유니코드/2C000~2CFFF
- 유니코드/2D000~2DFFF
- 유니코드/2E000~2EFFF
- 유니코드/2F000~2FFFF
[1] 그런데 한자는 표의 문자보다는 표어 문자로 분류하는 것이 적절하다. 순수히 뜻만 나타내는 글자도 있지만, 음이나 형태소를 나타내는 글자도 있기 때문. 다만 영역 이름과 문자 이름은 한 번 정해지면 절대 못 바꾸므로 이름을 고치기에는 이미 늦었다.[2] 일본의 2010년 개정 상용한자에는 U+53F1 叱(⿰口𠤎)이 아니라 U+20B9F 𠮟(⿰口七)이 들어갔다. 일본의 상용한자 중에서 유일하게 BMP가 아니라 SIP에 있는 한자다. 다만 SIP를 지원하지 않는 환경의 경우 U+53F1 叱도 사용 가능하다.[3] 다만 이 글자는 엄밀히 따지면 오탈자이다.(...)