유령 문자
(♥ 0)
1. 개요[편집]
일본의 컴퓨터 환경에서 입력할 수 있는 한자 중 그 유래나 출처, 상세한 쓰임이 밝혀지지 않은 미상 한자들을 일컫는 단어. 니코니코 대백과에서는 말 그대로 유령을 나타내는 한자라고 서술하고 있다.
2. 역사[편집]
일본의 통상산업성(現 경제산업성)은 일본어 표기에 쓰이는 문자들을 컴퓨터에서 표현하기 위해 1978년에 JIS 기본 한자(JIS X 0208, 당시 JIS C 6226)를 규정하였는데 JIS 규격의 한자 집합을 제정하는 과정에서 출처를 알 수 없는 글자들이 등록되었다. 이는 한자에 대한 지식이 부족한 작업자가 착각했거나 미세한 획을 잘못 입력하는 등 전산화 작업에서의 사소한 오류로 인해 발생했다고 여겨진다.
이 문제가 부상하면서 일본 국립 국어 연구소(国立国語研究所)의 사사하라 히로유키(笹原宏之) 등이 조사를 시작해 이 한자들이 지명으로 사용되거나 자료를 전사하던 중에 발생한 착오라고 여겨진다는 사실을 판명했다. 이 연구 결과는 JIS X 0208:1997의 부록 7에 정리되어 있다.
1997년의 JIS 한자 개정의 일환으로 사사하라 히로유키를 비롯한 연구진이 유령 문자에 대한 조사를 벌였지만 이 시기에는 이미 유니코드에 JIS 한자가 수록되었기 때문에 JIS를 섣불리 개정할 수 없었다.[1] 일본은 2000년에 JIS X 0208을 확장한 일본어 문자 집합인 JIS X 0213을 만들었는데 여기서도 JIS X 0208 부분은 건드리지 않고 그대로 뒀기 때문에 최신 일본어 문자 집합 JIS X 0213에도 유령 한자는 그대로 남아 있다. 사실 아래의 연구 결과를 보면 알 수 있듯 착오로 만들어진 진짜 유령 문자는 총 8자로(穃, 墸, 壥, 妛, 挧, 暃, 袮, 彁) 문자 집합을 함부로 건드릴 정도로 심각하진 않다.
3. 수와 종류[편집]
1997년 당시로서는 이런 글자가 얼마나 되는지 정확히 추산할 수 없었는데 지명·인명용 한자로 국자가 쓰이는 경우는 한국에서도 乭이나 乷 등이 쓰이는 등(예: 이세돌 李世乭, 살미면 乷味面) 한자문화권에서는 일반적인 일이었기 때문에 자전에 나오지 않는다고 무작정 없는 한자라고 단정할 수는 없었기 때문이다.[2][3] 최초로 연구가 시작될 때는 대개 60자에서 100자 정도로 추산되었다.
이후 연구에서 역시 대부분이 연구 결과 폐번치현 이전 혹은 현재도 쓰이는 지명·인명용 한자임이 밝혀졌고 열두 자를 제외하면 대부분 그 출처가 확인되면서 유령 한자가 아님이 드러났다. 이 과정에서 밝혀진 글자들은 다음과 같다.
그러나 조사 후에도 열두 자는 한동안 출처가 밝혀지지 않았는데 이러한 글자들은 강희자전 등 주요 자전에 실려 있지 않는 등 출처를 파악할 수 없었으며 어디에서 쓰이는지조차 알려져 있지 않았고 어떻게 읽어야 하는지도 알 수가 없었다.
墸 壥 妛 彁 挧 暃 椢 槞 蟐 袮 閠 駲
추가 연구를 통해 열두 자 중 한 자를 제외한 열한 자도 어디서 발생한 오자인지 혹은 어디서 쓰이는지 밝혀졌는데 연구 결과는 다음과 같았다.
결국 '최후의 유령한자'라고 불리는 '彁' 한 자만 남게 되었지만 몇십년 후 본 한자가 제목으로 쓰인 곡이 유명해지면서 무엇의 오자인지 밝혀졌다.
유령문자 자원(字源) 풀이
4. 유사한 사례[편집]
전 세계의 문자를 담는 것을 목표로 하는 유니코드에서도 비슷한 사례가 있다. 예를 들어 ⍼(U+237C)이라는 기호는 유니코드에 등재되기 전까지 기록된 용례가 없었으며 왜 유니코드에 추가되었는지조차 불명이다.
이 문서의 내용 중 전체 또는 일부는 2024-06-18 08:41:36에 나무위키 유령 문자 문서에서 가져왔습니다.
[1] 심지어 한국에서도 이미 유령 문자를 한컴 2바이트 코드 시절인 한/글 97 기능강화판부터 입력 가능했다.(대개 변환을 누르면 입력할 수 없고 문자표에서만 쓸 수 있는 문자. 물론 후술하듯이 변환해도 입력할 수 있는 문자도 있다.) 지금도 밑에 있는 유령 한자를 아래아 한글에 복붙하여 신명조와 같은 몇몇 아래아 한글 전용 폰트로 바꾸면 글꼴이 바뀌는 것을 볼 수 있다.[2] 한자는 기본적으로 열린 집합이다. 제작 원리만 알면 누구나 당장 새 한자를 만들 수 있다. 실제로 鿫(⿹气奥, 오가네손 오, ) 등의 새로이 만들어진 한자들이 있다.[3] 역사적으로는 측천문자가 대표적인 사례다.[4] 그러나 해당 지명이 정확히 어디를 가리키는 지는 불명으로 보인다. 한편 미나마타학 연구센터에서는 예로부터 미나마타 제2소학교 일대를 일컫는 지명이라고 소개하고 있으며 읽는 방법도 すねわり(스네와리)로 제시하고 있다.[5] 인천광역시 강화군 하점면(河岾面)의 '점'자가 바로 이것이다.[6] 고개를 뜻하는 '재'는 순우리말인데 한자로 표현하기 위해 이 글자를 사용한 듯하다. 재를 뜻하는 다른 한자로는 고개 치, 고개 령(嶺) 등이 있다.[7] 한국에서도 국자로 취급된다.[8] 서울 낙성대(落星垈) 등의 지명에도 쓰이거니와 한국 부동산등기부에서 토지의 사용 목적을 나타낼 때 사용하는 축약어(지목) 중 주택용지(또는 사무용 건물 필지)를 나타내는 것이 바로 垈(대)이다. 단국대학교 한국한자어사전에 따르면 원래는 代를 집터란 뜻으로 가차하여 사용하였으나, 밑에 土를 덧붙여 의미를 더 확실히 했다고 한다.[9] JIS 한자 코드(JIS漢字コード)는 일본 공업 규격의 한자 등의 문자 코드이다. 쉽게 말해서 옛날에는 삼수변(氵)을 썼는데 현대에 이수변(冫)으로 바뀌어서 쓰이고 있다. 그런데 막상 이수변(冫)과 흙 토(土)로 된 문자(⿰冫土)는 인터넷상의 문자에 없다는 것이다.[10] 바뀐 것에는 컴퓨터로 입력하기 불편하단 이유 외에도 본래 汢 쪽을 사용했고 공신력 있는 사전인 다이칸고린에서도 삼수변이 붙은 한자를 사용했다는 이유도 있었다.[11] 덧붙여 이런 식으로 인명용으로 쓰인 국자는 한국에도 상당히 많은데 각 집안 족보를 들여다보면 제법 찾을 수 있을 정도다. 하지만 후대 연구 등에서 나타날 경우 전공자들의 머리를 쥐어뜯게 만든다.[12] 한국 한자음으로는 어째선지 "석"이 아닌 "정"으로 등록되어 있다. 이체자가 아닌 형성자 원리에 따라 石+貞으로 보아 "정"으로 임의로 붙인 듯하다.[13] 몽구(蒙求)는 중국 당나라 이한(李翰)이 지은 어린이들의 문자 교육을 위한 아동용 교재이고 몽구집주는 사고전서에 수록된 책으로 논어집주와 마찬가지로 후대의 학자가 주석을 달아놓은 책.[14] 竜이 용 룡(龍)의 약자다.[15] 사마귀라는 뜻인데 같은 뜻의 한자로 사마귀 당(螳)이 있다. 이 글자의 오기로 보인다.[16] 示가 변으로 쓰일 때는 가타카나 ネ(네)와 같은 모양(礻)으로 쓰이기도 하는데 衣가 변으로 쓰인 모양(衤)과 비슷해서 착각하기 쉽다. 祢는 '아비 사당 녜/니' 자로 등록되어 있는데 히라가나 ね의 뿌리이기도 하다.[17] 특히 潤(젖을 윤)이 이름자로 들어간 많은 사람들이 氵閠의 형태로 쓴다.[18] zhou로, 우변의 고을 주에서 파생된 것으로 보인다.[19] 유령 문자들 중에서 제일 오랜 기간 동안 그 출처가 밝혀지지 않았던 문자였다. 2011년 아사히 신문 디지털 매거진에서 처음 확인되었는데, 근 10년이라는 기간 동안 이 주장이 묻혔다가 동명의 악곡이 유명해진 다음에야 이 사실이 재발굴되었다.