척척박사 연구소

척척박사 연구소과학이야기제목별로 보기해설이 있는 과학

해설이 있는 과학

최신 소식 속에 담긴 다양한 과학정보에 대한 해설입니다.

"박휘이따고훼서 곡종헷는대" - 맞춤법 틀려도 해석이 되는 이유

게티이미지뱅크 제공
게티이미지뱅크 제공
 

'한꾹인뜰만알아뽈쑤있게짝썽하께씁니다.' 한 공유숙박업체 사이트에 올라온 사용 후기다. '한국인들만 알아볼 수 있게 작성하겠습니다'로 해석된다. 한국어가 모국어인 사람에게는 큰 어려움 없이 번역된다. 한 포털 사이트의 번역기를 이용해 이 문장을 영어로 바꿔봤다. 'Only a small yard can be used to make it look good' 이라는 문장이 뜬다. 전혀 다른 의미다. 번역기도 피해가는, 일부러 맞춤법을 틀리게 쓴 단어로 이뤄진 문장을 우리는 어떻게 이해할 수 있는 걸까.



이런 후기가 등장한 이유는 단순하다. 사실대로 작성하면 숙박업체 측에서 삭제 요청이 들어올 수 있는 만큼 된소리와 띄어쓰기, 영어를 이용해 일부러 문법적으로는 틀린 문장을 써 삭제 가능성을 피한 것이다.  



이렇게 변형된 문장은 한국어를 모국어로 사용하는 ‘토종’ 한국인만 이해할 수 있는 걸까. 이를 확인하기 위해 7월 9일 전문가와 함께 간단한 언어 인지 실험을 진행했다. 


 



‘토종’ 한국인만 읽어낼까? 직접 실험해보니



최원일 광주과학기술원(GIST) 기초교육학부 교수의 자문을 받아 각각 네 문장으로 이뤄진 두 종류의 구문을 만들었다. 하나는 된소리, 숫자, 영어 등이 섞인 숙박 후기를 그대로 썼다(아래 사진 1). 다른 하나는 음절교환효과를 확인하기 위해 ‘네글자씩’을 ‘네짜글씩’ 등으로 단어의 앞뒤 음절을 바꾸고 된소리를 추가한 문장 4개로 이뤄진 구문을 제시했다(아래 사진 2).  


한국어 경력이 1~17년으로 다양한 외국인 10명에게 제한시간 5분 내에 이들 문장을 해석해 한글로 쓰게 했다. 결과는 자명했다. 외국인 실험참가자들은 한국어 회화 실력이 상당한 수준이었음에도 불구하고 대부분 해석하지 못했다. 제한시간 내에 해석을 마친 사람은 3명에 불과했다. 그마저도 내용을 100% 정확히 맞추지 못했다. 




프랑스에서 온 도메니코 마이오라노 씨는 “한국어를 배운지 6년 정도 돼서 글자를 읽는 데 문제가 없다”면서도 “처음 보니 이게 글자인가 싶었다”고 어려움을 토로했다. 중국 출신인 우훙진 씨도 “‘박휘’가 바퀴벌레를 뜻하는 말일 줄은 상상도 못했다”며 황당해했다. 




반면 대조군으로 설정한 한국인 3명은 평균 2분 이내에 정확한 뜻을 해석해냈다. 처음 해석을 시작할 때에는 다소 머뭇거리기도 했지만, 이내 적응이 된 듯 술술 써내려갔다. 일부 실험자는 쓰다 보니 규칙을 찾았다며 자신감을 내비치기도 했다. 

 


외국인 10명의 언어인지 실험 결과. 한국어를 배운 경력이 1-17년으로 다양한 외국인 10명에게 두 종류의 구문이 인쇄된 시험지를 나눠주고 5분 안에한글로 해석하게 했다. 완벽하게 해석한 사람은 아무도 없었다. 과학동아 제공
외국인 10명의 언어인지 실험 결과. 한국어를 배운 경력이 1-17년으로 다양한 외국인 10명에게 두 종류의 구문이 인쇄된 시험지를 나눠주고 5분 안에한글로 해석하게 했다. 완벽하게 해석한 사람은 아무도 없었다.
과학동아 제공


 



오타 많아도 뜻 이해하는 이유



글을 읽을 때 글자를 하나씩 읽는다고 생각하기 쉽다. 하지만 글을 인식하는 과정은 생각보다 더 복잡하다. 오타가 많아도 이해할 수 있는 이유가 여기에 있다.

 

언어 인지는 세 단계를 거친다. 눈으로 철자를 확인하면 이는 시각 자극이 된다. 이 자극이 신경세포를 거쳐 뇌로 전달되면서 후보 어휘들을 활성화시킨다. 다양한 후보 어휘들은 경쟁을 거치고 가장 활성화된 어휘가 선택된다. 이를 ‘철자기반인식경로’라고 한다.


다양한 후보 어휘 중에서 하나의 어휘가 선택되는 과정은 ‘심성어휘집(mental lexicon)’의 영향을 받는다. 심성어휘집은 어휘 정보를 처리할 때 필요한 정보의 집합이다. 예를 들어 ‘거울’이라는 단어가 있다고 하자. 이 글자를 봤을 때 우리는 거울의 발음, 의미, 거울에 관한 개인적인 에피소드, ‘저울’ ‘거물’ 등의 오타 가능성까지 여러 가지를 무의식적으로 떠올린다. 다양한 정보가 심성어휘집에 병렬적으로 저장돼있는 것이다.


오타를 정상적인 단어로 인식할 수 있는 것도 심성어휘집의 영향이다. 숙박 후기에 등장하는 ‘쑥쏘’는 없는 단어다. 하지만 우리가 ‘쑥쏘’라는 글자를 보면 심성어휘집 속에 있는 ‘숙소’ ‘축소’ ‘국소’ 등 유사한 어휘들이 활성화된다. 여기에 ‘쑥쏘’가 숙박업소 후기에서 나온 단어고, 시옷과 쌍시옷 간에 유사성이 있다는 등의 기타 정보가 합쳐지면 결국 ‘숙소’의 잘못된 표현이라는 사실을 인식한다. 

 

이 과정이 여러 번 반복되면 이후 우리 뇌는 문장을 읽을 때 단어의 정확성을 따지는 역치를 낮춘다. 쉽게 말해 다음부터 읽는 문장은 오타일 가능성을 염두에 두고 읽는다는 뜻이다. 처음에는 오타가 가득한 문장을 더듬더듬 읽다가도, 한 번 적응되면 비교적 수월하게 읽을 수 있는 건 이 때문이다. 실제로 한국인 실험참가자들은 오타가 많은 숙박 후기를 보고 처음에는 머뭇거렸지만 시간이 조금 지나자 수월하게 해석했다.

 

 

네이버 파파고 번역기를 이용해 실험참가자에게 제시한 구문1을 번역하면 원래 뜻과 전혀 다른 문장이 나온다. 파파고 제공
네이버 파파고 번역기를 이용해 실험참가자에게 제시한 구문1을 번역하면 원래 뜻과 전혀 다른 문장이 나온다.
파파고 제공
 

글자의 소리 자체를 인식하는 ‘소리기반인식경로’도 있다. 최 교수는 “기본적으로는 철자 자체를 인식해 심성어휘집에서 선택 과정을 거쳐 인지한다”면서 “이와 동시에 철자를 음성 자체로 받아들여 인지하기도 한다”고 설명했다. ‘박휘벌레’라고 써도 ‘바퀴벌레’라고 해석할 수 있는 것은 이런 소리기반인식경로 덕분이다. 철자 상으로는 ‘박’과 ‘휘’가 합쳐졌지만 한국인이라면 자연스럽게 이것을 [바퀴]라고 읽고 바퀴벌레를 떠올리게 된다.

 

언어 인식에서 철자기반인식경로와 소리기반인식경로를 통틀어 ‘이중 경로 모형(Dual route model)’이라고 부른다. 언어 인식 과정을 설명하는 가장 기본적인 이론이다. 마치 말이 경주하듯이 두 가지 경로가 경쟁적으로 작동하면서 단어를 인식한다고 해서 ‘말 경주 모형’으로도 불린다. 어느 인지경로가 더 우세한지에 대해서는 학자들마다 의견이 다르지만, 두 가지 경로가 존재한다는 점에는 이견이 없다.



‘멀휘카락’보다 ‘머리카락’ 40밀리초 빨리 인식 

 

7월 5일 광주과학기술원 뇌언어인지실험실에서 안구운동측정기를 이용해 기자가 직접 언어 인지 과정을 확인해봤다. 얼굴을 고정한 뒤 모니터에 나오는 문장을 읽으며 OX 문제를 풀었다. 이영애 기자 yhlee@donga.com
7월 5일 광주과학기술원 뇌언어인지실험실에서 안구운동측정기를 이용해 기자가 직접 언어 인지 과정을 확인해봤다. 얼굴을 고정한 뒤 모니터에 나오는 문장을 읽으며 OX 문제를 풀었다.
이영애 기자 yhlee@donga.com

 

 

“같은 문장을 세 번째 읽고 계시네요.”

 


잠시 다른 생각을 하고 있던 실허안구 운동을 곧바로 알아챌 정도로 측정기는 정교했다. 뜨끔한 마음에 더욱 열심히 화면에 뜨는 글을 읽어나갔다. 7월 5일 기자는 GIST 뇌언어인지실험실에서 단어 인지 연구 장치 중 하나인 ‘안구운동측정기’를 직접 체험했다. 


 

안구운동측정기는 안구의 미세한 움직임을 감지해 단어를 인지하는 방법과 속도를 조사하는 장치다. 최 교수는 이 측정기로 사람이 단어를 인지하는 과정에 어떤 요소들이 영향을 미치는지 연구하고 있다.


 

미세한 안구운동을 측정하기 위해 컴퓨터 모니터 앞에 고정된 안구운동측정기에 앉아 얼굴을 단단히 고정했다. 모니터에 떠 있는 까만 점을 눈으로 확인하며 기계 보정을 끝낸 뒤 본격적인 측정에 들어갔다. 모니터에 뜨는 문장을 읽고 조이스틱을 이용해 OX 문제를 풀었다. 이때 다른 컴퓨터에서는 기자의 안구 움직임과 속도가 실시간으로 분석되고 있었다.

 

같은 단어라도 이를 인지하는 속도는 사람마다 다르다. 개인이 가지고 있는 심성어휘집이 모두 다르기 때문이다. 최 교수는 단어를 인지하는 데 영향을 미치는 가장 중요한 요소로 친밀도를 꼽았다. 심성어휘집에서 반복적으로 활성화된 친밀한 어휘일수록 더 빨리 인식된다는 것이다. 


 

실제로 숙박 후기를 읽으며 안구운동을 분석했을 때에도 오타가 없는 ‘많이’ ‘낙후’ 등의 단어에서는 안구운동이 빨랐고, 오타가 있는 ‘멀휘카락’ ‘굴헤요’ 등에서는 시선이 상대적으로 오랫동안 머무는 것으로 확인됐다. 안구운동측정기로 조사하면 일반적으로 맞춤법이 맞는 단어를 볼 때가 오타가 난 단어를 볼 때보다 단어 인식 속도가 40ms(밀리초)가량 빠르다.

 

단어가 문맥상 얼마나 예측 가능한지도 인지 속도에 영향을 미친다. 2005년 마타 쿠타스 미국 샌디에이고 캘리포니아대(UCSD) 인지과학과 교수팀은 실험참가자들에게 동일한 문장을 주고 살펴본 결과, 실험참가자들이 예상하지 못한 단어가 나왔을 때 뇌파가 변한다는 사실을 발견했다.

 

이외에 음절의 길이나 띄어쓰기 여부도 단어를 인지하는 데 영향을 미친다는 연구결과가 있다. 최 교수는 “모든 언어 인식 이론이 한국어에 적용되는 것은 아니다”라며 “한국어는 자음과 모음을 하나의 음절로 만들어 모아쓰기를 하는 특성이 있고, 덕분에 표음문자인 영어에 비해 띄어쓰기의 영향을 많이 받지 않는다”고 설명했다. 



 

사람이 말의 의미를 파악할 때는 철자기반인식경로와 소리기반인식경로, 두 과정이 함께 일어난다. 전자는 철자를 보고 머릿속의 심성어휘집과 비교해  뜻을 파악하는 과정이고, 후자는 철자를 머릿속으로 읽어 소리를 거쳐 의미로 연결하는 과정이다. 사진 이한철/과학동아
사람이 말의 의미를 파악할 때는 철자기반인식경로와 소리기반인식경로, 두 과정이 함께 일어난다. 전자는 철자를 보고 머릿속의 심성어휘집과 비교해 뜻을 파악하는 과정이고, 후자는 철자를 머릿속으로 읽어 소리를 거쳐 의미로 연결하는 과정이다.
사진 이한철/과학동아










관련기사

과학동아 8월호, 박휘이따고훼서 곡종헷는대? 맞춤법 틀린데 해석이 되네?

출처 : 동아사이언스(http://www.dongascience.com)

관련주제가 없습니다.
내과학상자담기  E-MAIL 프린트 카카오스토리 트위터 페이스북 RSS
관련 콘텐츠가 없습니다.

나도 한마디 2개의 댓글이 있습니다.

등록하기

목록


내 당근 보러가기

내 뱃지 보러가기

TOP