거의 10년 전의 일이었다. 필자의 두 번째 대 도전이었던 영어말하기‧쓰기 자동평가 기술개발이 아쉽게도 중단된 적이 있다. 우선 딥러닝과 클라우드 컴퓨팅이 대중화되기 전이었으니 너무 빠른 시작이었다. 두 번째 대 도전에서 더 큰 한방을 이룩해야만 한다는 보상심리도 작용했었다. 영어교육학, 언어심리학, 측정평가학과 같은 언어-교육에 관한 이론 뿐 아니라 연속음성인식, 한국인 발화자에 의해 변이된(즉 콩글리시) 영어발음양상 모델링, 샘플링. 이 모든 기술이 한데 어우러져 문제당 2천개 이상의 시행결과 데이터를 바탕으로 ‘측정 엔진’을 만들어 보겠다는 야심찬 꿈을 접어야 했다.

4년이 지난 지금 딥러닝과 클라우드 컴퓨팅의 시대로 접어들었다. 이번엔 대한민국 최고의 음성인식 전문가 교수님과 앱을 최고로 잘 만들어서 일본에 수출도 많이 하던 똑똑한 SW벤처 대표와 의기투합하여 영어말하기 자동평가 기술개발 과제를 2년짜리로 제안했다. 연구개발 과제는 선정 될 수도 있고 아닐 수도 있다. 다만 ‘평가’라는 점에서 평가가 가지는 한계성-제안 과제가 자동평가 과제이니 더욱이 나한테 닥칠 줄은 전혀 예상하지 못했다. 허를 찔린 것이다.

“음성인식의 첫해 목표가 80%라니 너무 낮은 것 아닙니까?”
“한국인에 의한 영어변이음의 양상은 꽤 복잡해서 과제의 최종목표도 높게 잡기 어렵습니다.”

역시 야심차게 준비했던 ‘융합’ 과제도 탈락했다. 상용음성인식기가 보통 정확률이 90% 이상 돼야 하는데, 이 과제는 그렇지 못하다는 게 첫 번째 지적이었다. 정확률은 정답대비 오답의 비율인데, 콩글리시의 양상은 정답과 오답이 애매한 영역도 많기에 STT(Speech-To-Text)같이 똑 맞아떨어지는 정답이 없는 경우도 있다.

또한 오픈 API로 설계-구현하는 영어말하기 자동평가 API가 구현하는 게 어떤 어려움이 있다. 요즘 많이 거론되는 융합-교육철학부터 머신러닝, 데이터 사이언스 기반의 시험평가까지 도전한다는 쉬운 일이 절대 아니다.

피아노 치는 동네엘 가보면 얼마나 안 틀리고 빨리 잘 치는지, 탈 것을 논하는 동네엘 가면 얼마나 빨리 가고 서는지, 돈 벌 것을 논하는 동네엘 가면 얼마나 빨리 많이 버는 지를 논의한다. 다른 가치, 즉 피아노를 천천히 쳐도 아름답다든지, 차가 싸고 느려도 나름대로의 멋이 있다든지, 돈은 느리게 벌어서 안 쓰는 것이 좋은 덕목이라든지 등의 ‘이질적 가치’에 대해서는 같은 커뮤니티에서는 인정받기 어려운 것 같다. 뭐가 안 되는 패배자의 변명, 여우의 신 포도라 치부당하기 일수다.

교육철학, 어학, 머신러닝, 심리학, 측정학 이라는 서로 매우 이질적인 학문분야가 붙어서 뭘 만들어 내는 일을 ‘융합’이라 한다. 이와 달리 그저 잠깐 필요한 인터페이스를 정의해서 붙었다 떨어졌다를 쉽게 할 수 있는 것을 ‘혼합’이라 한다. 융합은 영어로 fusion이라 하는데, 엄청나게 높은 온도(1억도 이상)로 원자를 잡아 붙이면 원자핵은 술술 풀어져서 전자, 중성입자, 이온이 흘러 다니는 제4의 물질상태인 플라즈마가 된다. 융합과 혼합은 원래 상태로 되돌릴 수 있는 가를 살펴보면 정할 수 있다. 혼합은 여러 방법을 거치면 원래대로의 원소로 돌아갈 수 있는 반면, 융합은 불가능하다. ‘융합’ 학문은 그저 관심 있는 여러 학문을 김밥 말 듯이 잘 말아서 꿀꺽 맛있게 먹는다고 되는 일이 아니라, 다시는 원래대로 되돌아갈 수 없는 비장함이라는 큰 대가를 요구한다.

융합이 4차 산업혁명에서 필요한 이유는 ‘끊임없이 개인의 세계관을 중심으로 새로운 것을 만들어내는 것’이 중요한 시대이기 때문이다. 창조 creation, 구성 construction이 새 시대의 중심 개념인데 남이 만들어 놓은 창조물을 분석하거나 분해하는 일이 갈수록 의미가 없어지고, 좋든 나쁘든 아름답든 추하든 새로운 것을 끊임없이 만들어 내서 자기만의 색깔을 훨씬 더 분명하게 입혀야하는 것이 중요하다고 이전 칼럼에서 언급했었다.

단 하나의 나무젓가락으로 무엇인가를 만들 때도 알아야 할 것이 많다. 칼 잡는 법, 나무 잡는 법, 칼 가는 법, 안전하게 칼 다루는 법, 불로 나뭇가지를 휘는 법, 색칠하기 위한 프라이머 바르는 법, 색칠하는 법, 건조하는 법. 이것을 남에게 알리고 판매해서 수익을 올리려면, 적정재고 계산하기, SNS를 포함한 옴니채널 광고법, 통신판매인허가 취득법, 사업자등록 내는 법, 회계처리 하는 법, 농산물 부가가치세 면제처리법 등등.

작은 것을 만들려 해도 알아야할 것이 많은데, 이 지식과 경험들은 원래부터 서로 관계가 있었던 것이 아니라 ‘내 세계’를 창조하기 위해 내가 임의로 갖다 붙인 것들이다. 만일 나무젓가락이 아니라 이 세상에 존재하지 않는 개념과 철학을 요리한다고 마음먹으면, 위의 융합목록은 훨씬 더 많아질 것이다. 안 해보면 알 수 없고, 남이 내 머릿속 내 세상을 가르쳐 줄 수도, 알려줄 수도, 도와줄 수도 없다. 자기 세계의 창조에 들어맞는 학습방법론이 프로젝트기반학습 등 직접 해보는 경험을 축적하는 것인 이유이다. 사업도 두어 번 망해봐야 잘 치고 나가는 것과 매우 흡사하다.

아쉽게도 애들이 치루는 시험이나, 상급학교를 진학하기 위한 입시나, 정부지원과제를 선정하기 위한 평가나 모두 ‘융합’을 평가하는 일이 근본적으로 불가능하다.

쇼팽의 피아노곡을 얼마나 잘 연주하는지를 평가하는 쇼팽 콩쿠르는 철저히 작곡가 쇼팽이 연주한 곡들로만 연주하고 평가한다. 만일 아무 피아노곡이라도 들고 나와서 연주를 해서, 1-2-3등을 선발하겠다는 콩쿠르가 있다면 평가하기가 매우 어려워질 것이다. 기악곡의 해석을 통한 연주가의 개별적인 미학세계의 창조라는 융합-지식, 프레이징, 예술적 감각성, 호소력, 기술을 평가하기 어렵다 하여 곡을 한정시키고 평가에 입맛이 짝짝 맞는 기계적인 곡들로만 연주하라 하면 어떤 결과가 벌어질 것인가?

어느 순간 창조나 구성이 아닌 수없는 반복과 득점이라는 판에 박힌 피아노 연주가 더 의미 있어질 것이다. 이미 몇몇 미술대학이 의미 없는 반복과 득점이 미술 실기에 끼치는 해악을 걱정하여, 아예 입시에서 없애버린 것은 위의 지적과 같은 의미이다.

융합은 쉽게 평가될 수 없다. 이는 소프트웨어가 점점 더 오픈 소스로 이행하고, 더 많은 수리적 기법이 융합되어 ‘이것이 과연 소프트웨어 코드인가?’를 고민할 정도로 어려워지고 있다. 과거 소프트웨어 패러다임에 물든 과거의 평가는 융합을 방해한다. 더 어려운 것은, 교육 철학자, 심리학자, 언어학자, 머신러닝 학자, 시험평가학 학자라는 전문가들을 그룹으로 모아서 융합과제-영어말하기 자동평가 같은 과제를 평가하도록 시킨다고 이 과제를 제대로 평가 가능하다고 보장할 수 없다.

각각의 학문적 지향점이 너무 다르다. 프로이트 연구자와 시신경연구자가 대화가 잘 통하기 기대하기는 매우 어려울 것이다. 올바르게 평가를 꼭 해야 한다고 믿으면 믿을수록 평가는커녕 서로 치고받고 싸우는 일에 더 몰두할 것이 분명하다.

우리는 여전히 구체제의 계량적 사회에 몸담고 있다. 계량적 평가가 없으면 너무도 불안해서 아무 것도 못할 지경이다. 일명 ‘평가공화국’이라 부를 수 있다. 평가를 위해 공부가 존재하고, 평가를 위해 과목이 존재하고, 평가를 위해 과제가 존재한다. 또한 공정한 평가가 무엇보다 중요한 금과옥조의 가치로 떠받든다.

그런데, 4차 산업혁명의 근본 속성은 모든 것이 옳다! 라는 개개인의 세계를 구성하는 데에 기반을 두기 때문에 ‘평가’는 애당초 불가능하다. 평가의 엄밀함을 강조할수록, 4차 산업혁명에서 살아남기가 점점 더 불가능해진다는 놀라운 모순에 봉착하게 되는 것이다. 이런 저런 상황을 알면서도 우리는 ‘평가’의 시대를 유지하고 있다. 대안이 필요한 시기다.

(*이 칼럼은 Nextdaily의 편집방향과 다를 수 있습니다.)

온라인뉴스팀 (news@nextdaily.co.kr)

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지