[제주어] 아래아 변환기 - 온점을 아래아로 - Araea Converter for Jeju language
예제 입력: ㅎ.ㄴ저옵서예, ㅇ..망지다, ㅅ.ㅣㅇ각
출력 결과: ᄒᆞᆫ저옵서예, ᄋᆢ망지다, ᄉᆡᆼ각
태그: 제주어, 제주방언, 제주도 사투리, 아래아 표기법
Because of Standard Korean keyboard do to support to input Arae-a. Jeju people has problem to input Are-a to write owns dialect. Many Jeju people input Arae-a using period(.) instead of Arae-a in Unicode. That's not a standard!
This software convert these type of non-standard text to standard unicode hangul.
# -*- coding: utf-8 -*-
import unicodedata
#첫가끝 호환 명칭 우선순위
chotext=u'''ᄀ ㄱ 기역 3.399
ᄁ ㄲ 쌍기역 3.398
ᄂ ㄴ 니은 3.397
ᄃ ㄷ 디귿 3.396
ᄄ ㄸ 쌍디귿 3.395
ᄅ ㄹ 리을 3.394
ᄆ ㅁ 미음 3.393
ᄇ ㅂ 비읍 3.392
ᄈ ㅃ 쌍비읍 3.391
ᄉ ㅅ 시옷 3.390
ᄊ ㅆ 쌍시옷 3.389
ᄋ ㅇ 이응 3.388
ᄌ ㅈ 지읒 3.387
ᄍ ㅉ 쌍지읒 3.386
ᄎ ㅊ 치읓 3.385
ᄏ ㅋ 키읔 3.384
ᄐ ㅌ 티읕 3.383
ᄑ ㅍ 피읖 3.382
ᄒ ㅎ 히읗 3.381'''
jungtext=u'''ᆢ .. 쌍아래아 2.298
ᆡ .ㅣ 아래아이
ᆞ . 아래아 2.299'''
jongtext=u'''ᆪ ㄱㅅ 기역시옷 3.196
ᆬ ㄴㅈ 니은지읒 3.194
ᆭ ㄴㅎ 니은히읗 3.193
ᆰ ㄹㄱ 리을기역 3.190
ᆱ ㄹㅁ 리을미음 3.189
ᆲ ㄹㅂ 리을비읍 3.188
ᆳ ㄹㅅ 리을시옷 3.187
ᆴ ㄹㅌ 리을티읕 3.186
ᆵ ㄹㅍ 리을피읖 3.185
ᆶ ㄹㅎ 리을히읗 3.184
ᆹ ㅂㅅ 비읍시옷 3.181
ᆫ ㄴ 니은 3.195
ᆮ ㄷ 디귿 3.192
ᆯ ㄹ 리을 3.191
ᆷ ㅁ 미음 3.183
ᆸ ㅂ 비읍 3.182
ᆺ ㅅ 시옷 3.180
ᆻ ㅆ 쌍시옷 3.179
ᆼ ㅇ 이응 3.178
ᆽ ㅈ 지읒 3.177
ᆾ ㅊ 치읓 3.176
ᆿ ㅋ 키읔 3.175
ᇀ ㅌ 티읕 3.174
ᇁ ㅍ 피읖 3.173
ᇂ ㅎ 히읗 3.172
ᆨ ㄱ 기역 3.198
ᆩ ㄲ 쌍기역 3.197
def getlist(text):
result = []
for i in text.split('\n'):
resultline = []
cells = i.split(' ')
return result
#Get list from original text
cho = getlist(chotext)
jung = getlist(jungtext)
jong = getlist(jongtext)
dic = []
for i in cho:
for j in jung:
for k in jong:
def conv(text):
for k,v in dic:
return text
print conv(oritext.decode('utf-8')).encode('utf-8')