작성일 : 20-06-30 10:03
[최운호 서평] 디지털 인문학
 글쓴이 : 아포리아
조회 : 26,191  


도서정보
저자명 Matthew L. Jockers
저서명 Macroanalysis
출판사 U of Illinois
연도(ISBN) 2013(9780252079078)
디지털 인문학: 거인의 어깨 위에 올라앉은 난쟁이 

최운호 (목포대학교 국어국문학과 교수)

1.

[1] 웹 서핑을 하다가 ‘쫌’ 이상한 대학교를 발견했다. 정확히 말하면, 이상한 학과를 발견했다. 네브라스카 대학 영문학과(Dept. of English, Univ. of Nebraska-Lincoln)이다. 이 학과에 있는 Matthew L. Jockers 교수는 자신의 전공분야를 ‘아일랜드와 아일랜드계 미국 문학’, ‘20세기 영국 문학’, ‘미국 서부 지역 문학’이라고 밝히고 있다. 그런데 특이한 것은, 제일 우선으로 꼽는 자신의 전공을 인문학 분야에서는 생소한 ‘디지털 휴머니티, 텍스트 마이닝과 텍스트 분석(Digital Humanities: text mining / text analysis)’이라고 밝히고 있다는 것이다. 이 학과에서는 Jockers 교수를 비롯해서, Amanda Gailey, Kenneth M. Price, Stephen Ramsay, Adrian Wisnicki 등 5명의 교수가 디지털 휴머니티, 디지털 아카이브 전공 분야의 교육과 연구를 하고 있다.

[2] King's College London에는 대학원 과정에 디지털 휴머니티 학과가 개설되어 있다. 디지털 휴머니티라는 교육ㆍ연구 분야가 이 대학에서 시작된 것은 1970년대 초반으로 거슬러 올라간다고 한다. 인문학과 사회과학 분야에서 계산 모델을 적용한 학제 간 연구가 이 학과의 주요 연구 분야라고 한다.

[3] 네델란드의 그로닝엔 대학(University of Groningen)에는 ‘인문학과 계산(humanities computing)’이라는 전공이 있고 John Nerbonne 교수의 지도 아래 뛰어난 연구 능력을 갖춘 박사들이 배출되었다.

[4] 인문학과 계산의 조합을 통해서 연상되는 연구 분야, 또는 해결해야 될 문제는 어떤 것들이 있을지, 전통적인 분과 학문의 틀 안에서는 잘 떠오르지 않는다. 우리나라에서도 ‘통섭’, ‘융합’이라는 용어가 많이 퍼지고 익숙하기는 하지만, ‘통섭’과 ‘융합’을 통해서 어떤 문제를 밝혀내고 어떤 새로운 해석이 우리에게 도움이 되는지 이해하는 것은 쉽지 않은 것 같다. 아마 제가 모르는 여러 연구ㆍ개발 분야에서는 ‘통섭’과 ‘융합’ 연구가 많이 이루어졌을지도 모르겠다. 

학문 사이에 경계가 있었기에 ‘통섭’, ‘융합’이라는 용어가 출현하였을텐데, 원래 학문이라는 것이 분과별로 서로 연구 대상과 방법론의 경계를 짓고 경계를 넘나들지 않도록 약속을 했던 것은 아니었을 것이다. 그저, 궁금하고 풀어보고 싶은 문제가 상정되었을 때 그러한 문제에 대한 답을 찾아나가기 위해서 가능한 방법론을 모두 도입하고 적용해보고 새로운 방법론을 만들어 내는 것이 학문하는 기본 자세라고 조심스럽게 생각해 본다. 그런 의미에서 원래 모든 학문은 ‘통섭’을 하고 ‘융합’을 하였던 것은 아닌가 하는 아주 순진한 생각이 떠오른다.

2.

[1] 솔직히 고백하면, 인문학 분야 종사자이면서 그다지 인문적이지 않은 공부를 하다보니 나는 ‘서평’을 쓸 깜냥이 안 된다. 그렇기에 신간을 매개로 하여 ‘디지털 인문학’이라는 주제에 대해 잠시 소개하는 것으로 서평을 대신해 볼까 한다.

[2] Matthew L. Jockers의 Macroanalysis: Digital Methods & Literary History는 학자에 따라서 호불호가 분명한 주제를 담고 있다. 책의 제목을 우리말로 옮기면, 『거시분석: 디지털 분석 방법론과 문학사』로 할 수 있을 것이다. 이 책이 담고 있는 내용은 책의 제목이 함의하는 바에 비하면 극히 일부에 불과하다. 제목 자체가 너무 거창하다고 할 수 있다. 오히려 앞으로 담고 싶은 내용에 대한 저자의 연구 방향과 욕망을 표출해서 제목을 지은 것 같다. 

이 책의 제목과 내용의 상관관계에서 나타나는 괴리는 비단 이 책만의 문제는 아니다. 디지털 인문학이라는 주제를 통해서 발표되는 연구들은 대부분 대상에 대한 새로운 시각이라기보다는 연구 대상을 분석하는 방법론적 변형을 통해서 이전에는 설명할 수 없었던, 또는 간과하기 쉬웠던 해석을 이끌어내는 경우가 많기 때문이다. 알고리즘적 접근 방식, 그리고 인간의 능력을 압도하는 계산 능력과 저장 능력을 갖춘 컴퓨터를 활용하였기에 ‘새롭지는 않지만 새로운’ 성과를 산출해 내는 것이 가능해졌다.

[3] Jockers 교수는 <스탠포드 대학교 문학실험실(Stanford Literary Lab)>에서 이루어졌던 연구를 바탕으로 이 책의 내용을 채워나가고 있다. 분석 대상과 방법론을 소개하는 5장에서 9장까지의 제목을 보면, Metadata, Style, Nationality,  Theme, Influence이다. 이 책에서 소개하는 방법론과 시각을 통틀어 ‘거시분석(macroanalysis)’이라고 부르고 있는데, 이 내용들을 하나의 용어로 포괄한다면 ‘문학의 사회학’이라고 할 수 있을 것이다. 

[4] Jockers 교수는 도서관 주제분류에서 1750년에서 2000년까지 출간된 아일랜드계 미국 작가의 소설을 추출하여 메타데이터로 활용하여 시계열 분석을 수행하였다. 이 분석을 바탕으로 2000년에 출간된 Charles Fanning 교수의 The Irish Voice in America: 250 Years of Irish-American Fiction에 제시된 분석이 대부분 타당하지만 일부는 그렇지 않다는 것을 증명하였다. 아일랜드계 미국 작가의 작품이 미국에서 출판의 정점을 찍은 것은 20세기 들어서면서였음을 Jockers 교수는 이 책의 5장에서 메타데이터 분석을 통해 제시하였다. 1960년대에서 1970년대에 또한 아일랜드계 미국 작가의 작품이 왕성하게 출판되었다는 Fanning 교수의 주장이 일부는 사실이라는 것을 Jockers 교수는 자료를 통해서 확인할 수 있었다. 그렇지만 메타데이터 분석 결과를 자세히 들여다보며 미국 동부와 서부지역으로 분포를 나눠서 보았을 때 Fanning 교수의 주장은 미국 동부 지역에만 해당된다는 것을 알 수 있다고 저자는 말한다. 

서부 지역에서는 20세기부터 시작된 아일랜드계 미국 소설가 작품의 출판이 1941년에 정점을 찍으며 그 이후에는 하향하고 있다는 부분이 Fanning 교수의 일반론과는 다르다는 것을 자료를 통해서 알 수 있다고 Jockers 교수는 지적하고 있다. 이러한 분석 결과는 문학 사조와 장르 분석에서 기존의 입장과는 다른 해석을 필요로 한다. 즉, ‘출판지역’이라는 요인(factor)을 추가해서 메타데이터를 분석했을 때 직관적 판단에 의한 분석과는 다른 양상을 보인다는 점을 자료 분석을 통해서 확인할 수 있다는 것이다. 이 요인을 추가하여 분석한 결과를 바탕으로 새로운 해석을 할 수 있는 여지가 발생한 것이다.

[5] Jockers 교수는 기존 문학 비평에서 하고 있는 ‘꼼꼼하게 읽기(close reading)’와는 다른 분석 방법이 필요하다는 점을 보여주고 있다. ‘꼼꼼하게 읽기’와 대비되는 ‘읽기’ 양식을 Jockers 교수의 학문적 동료이자 스승이라고 할 수 있는 스탠포드 대학교의 Franco Moretti 교수는 ‘distant reading’이라고 명명하였다. Jockers 교수는 Moretti 교수의 개념을 받아들이되, ‘reading’이라는 용어보다는 ‘analysis’라는 용어가 더 적절한 것으로 보고, ‘distant reading’을 아예 ‘거시분석(macroanalysis)’이라는 용어로 부르기로 하였다. 그리고 다변량 분석, 기계학습, 토픽 모델링, 네트워크 이론 등을 적용한 문학사 연구를 시작하였고, 그 동안의 연구 성과물들을 모아서 한 권의 책으로 엮어냈다.

[6] 이 책의 내용을 하나로 엮어서 설명하기에는 제시된 분석 사례가 너무 다양하다. 다만, 컴퓨터를 활용한 연구가 가능한 시점에 이제는 대용량 텍스트 자료(large-scale text corpus)를 대상으로 특정 주제에 대한 분석적 연구 방법이 가능하며, Jockers 교수는 자신의 관심 분야인 문학사 연구에 최근의 텍스트 마이닝 기법들을 적용한 연구를 시작하였고 그러한 분석이 기존의 연구에서는 간과했던 점들을 찾아낸다는 점에서 그의 연구는 흥미롭다.

4.

[1] Jockers 교수의 문학사 연구 방법론은 참신하다. 그리고 자료에 대한 총체적 접근법을 제시해 주고 있다. 기존의 ‘꼼꼼하게 읽기’로 대표되는 작가 연구, 문학사 연구로는 드러내기 어려운 분석 결과들을 탐색적 자료 분석을 이용하여 시각적으로 잘 제시하고 있다. 다만 한 가지 아쉬운 점은 자신의 연구 방법론과 연구 결과에 부여한 참신성과 과학성에 대한 지나친 자부심이다. Jockers 교수가 이 책의 12쪽과 171쪽에서 사용한 표현을 그대로 옮겨보도록 하겠다(강조를 위해서 일부 문구에 밑줄을 쳤다).

(12쪽) In 2012 we stand upon the shoulders of giants, and the view from the top is breathtaking. The skies were not always this clear.
(171쪽) I began this book with a call to arms,  an argument that what we have today in terms of literary and textual material and computational power represents a moment of revolution in the way we study the literary record.

[2] Jockers 교수가 그의 저서에서 주장하듯이 문학/텍스트 자료의 분석에 컴퓨터 계산 능력을 활용하는 것이 정말 문학사 연구에 ‘혁명적’ 방법이라고 할 수 있을지에 대해서는 의문을 가지게 된다. 그가 이 책을 준비하던 2012년에 그는 분명히 ‘거인의 어깨에 올라앉아 있다’라고 밝히고 있다. 그리고 ‘그 어깨 위에서 바라본 전망’은 놀라울 정도라고 하고 있다. 그가 올라앉은 ‘거인’은 ‘누구/무엇’일까?

[3] 나는 성경을 잘 읽지는 않지만, 특별히 좋아하는, 그리고 기억에 남는 구절이 하나 있다. “(전도서 1:9, 공동번역) 지금 있는 것은 언젠가 있었던 것이요, 지금 생긴 일은 언젠가 있었던 일이라. 하늘 아래 새 것이 있을 리 없다.” 꼼꼼하게 읽고 비평하기에 대비되는 ‘distant reading’, 즉 ‘거시분석(macroanalysis)’은 분명 기존 시각과는 다른 점들을 잘 보여주고 있다. 그렇지만 완전히 새로운 방법론이거나 혁명적 패러다임의 변화일 수는 없다.

5.

[1] 새로운 방법론은 언제나 기존의 연구에 바탕을 두고 있다. 최근 수 년 동안 필자도 컴퓨터의 계산 능력을 활용한 연구를 수행해 본 경험이 있다. Jockers 교수와 비슷한 시기에, 우연히도 비슷한 접근 방법을 사용하고 그 결과도 어떤 면에서는 유사하다고 할 수 있는, 그런 실험이었다.

[2] 몇 년에 걸친 시베리아-동유럽-중국 지역 알타이언어 조사 답사 프로젝트에 참여하면서 새로운 공부를 하게 되었고, 방언 분석을 위한 방법론에 대해 고민하면서 전통적인 언어학의 방법론에 입각해서 조금더 정밀해지는 방법이 무엇이 있는지 선행연구를 찾아보고, 언어학과는 다른 연구 대상을 다루면서 비슷한 목적을 가진 분야는 어떤 분석방법을 사용하는지를 알아보게 되었다. 

유전자를 다루는 생물정보학, 공간지리정보를 다루는 지리학 등에서도 언어자료를 다루어야 하는 나와 비슷한 고민들에 대해서 이미 많은 연구 성과를 내고 있었다. 기본적으로 ‘유사성’과 ‘차이성’에 따른 분류 방법은 어떻게 적용해야 하는가에 대한 문제가 나의 고민이었다. 비슷한 시기에 유네스코 무형문화유산으로 지정되었던 판소리의 유파에 대한 분석을 한국 고전산문과 판소리를 전공하는 선생님과 얘기하다가 나와 동일한 문제 의식을 가지고 있다는 것을 알게 되었다. 

판소리는 전승과 변모를 거쳐서 다양한 계보를 형성해 왔는데, 그 특징에 따라서 전통적으로 ‘동편제-서편제-강산제’로 구별되어 왔으며 같은 ‘-제’ 안에서도 대표적인 창자의 유파에 따라서 여러 ‘-파’로 갈린다. 그런데, 정말 지금까지 알려진 유파가 칼로 무를 자르듯이 정말 엄밀히 구분될 수 있는 것인지가 우리의 고민이었다. 특히 ‘전승’과 ‘변모’를 그 특징으로 하는 판소리가 과연 화석화된 형태로 한 스승에게서 제자로, 한 갈래에서 서로 다른 갈래의 섞임 없이 온전히 그렇게 이상적인 형태로 전승이 되는 것인지가 의문이었다. 영화 ‘서편제’를 보더라도, 대목마다 서로 다른 소리꾼에게 소리를 배우는 장면이 나오기도 한다. 

그래서 현재 전승되는 대표적인 판소리 음반 중 16명 창자들의 음반을 채록하고, 사설, 장단, 조, 리듬패턴, 붙임새 등을 종합적으로 계산할 수 있는 모형을 만들어 분석을 해 보았다. 그리고 자료를 해석해 보았다. 분석 결과로는 ‘전승과 변모’에서 ‘변모’의 특징을 잘 드러나는 한 장의 지도가 생성이 되었다. 무형문화재로서 판소리의 전승을 잘 지켜야 한다는 점을 강조하지만 실제로는 그 안에서도 다양한 변모가 이루어져 왔다는 점을 확인할 수 있었다. 

그렇지만, 앞으로는 어떻게 될 것인가가 새로운 문제로 남는다는 것을 알 수 있었다. 전승에만 치중해서 변모를 허용하지 않는 제도적 장치가 생기지는 않을지가 걱정이다. 또 한가지, 명창 박동진 선생의 경우에는 두 가지 해석이 가능한 결과였다. 그 스스로는, 유성준이라는 명창에게 소리를 배웠다고 하지만, 박동진 선생의 사설은 다른 유성준의 제자들과는 독특한 차이를 보인다는 점이 드러났다. 분석 결과는 여기까지이다. 해석은 어떻게 해야 할까? 박동진 선생은 기존의 전승 관계를 잘 따르지 않은 창자라고 해야 할까? 아니면 자신만의 독특한 소리를 만들어낸, 전통의 변모자라고 해야 할까?

[3] 부리야트 공화국은 러시아 연방에 속한, 바이칼 호수를 끼고 있는 자치공화국이다. 러시아 연방에 속해 있지만, 부리야트 공화국 사람들 중 다수는 몽골족이다. 그리고 많은 부리야트 몽골 사람들은 몽골어의 방언인 부리야트 몽골어를 사용하고 있다. 몽골과 중국에서는 이 부리야트어를 몽골어의 방언 중 하나로 간주하고 있으며, 실제로 부리야트 몽골 사람들과 몽골공화국의 표준어인 할하 몽골어 화자들과는 의사소통에 거의 어려움이 없을 정도로 소통이 가능한 언어이다. 그렇지만, 러시아에서의 상황은 다르다. 러시아에서는 부리야트인과 부리야트어를 몽골과는 별개의 민족, 언어로 분류하는 경향이 있다. 부리야트 몽골인, 부리야트 몽골어라기 보다는 부리야트 사람, 부리야트 언어라고 부른다는 것이다. 이러한 명칭의 분리는 1958년 7월 7일부터라고 알려져 있다. 그리고 그 이유는 온전히 정치적인 이유로부터 시작되었다. 정치적인 이유에서 실행되는 언어/문화/민족 분리 정책을 온당히 받아들이기를 거부하고자 할 때, 객관적 증거를 제시해야 한다. 필자는 중국 지역에서 사용되는 부리야트 방언을 포함한 16개의 몽골계 언어와 방언 수집 자료를 활용해 보기로 하였다. 2,900여 개의 어휘에 대해서 컴퓨터를 활용하여 35만 비교쌍을 생성하고, 시퀀스 비교에 사용하는 알고리즘을 이용하여서 언어의 차이를 계산한 뒤 다변량분석 방법을 적용해 본 결과, 부리야트 몽골어는 별개의 언어라고 부르기에는 표준 몽골어와 너무나 유사하다는 결과가 산출되었다.

[4] ‘거인의 어깨 위에 올라앉은 난쟁이(nanos gigantum humeris insidentes)’의 비유를 올바로 이해해야 지금까지의 연구 성과를 바탕으로 조금더 나은, 새로운 방법론에 입각한 진보를 이룰 수 있을 것이다. Jockers 교수의 연구들은 기존 연구를 바탕으로, 기존 연구에 대한 작은 의심에서 출발하였다. 필자의 연구도 마찬가지이다. 기존 연구에서 드러내지 않는 요소들이 점점 더 정밀한 분석을 통해서 드러나기 시작하는 것이다.

[5] 디지털 인문학이라는 분야에서 수행되는 많은 연구들, 페르세우스 프로젝트의 서양 고전 주석 아카이브, 디지털 정본 편집 시스템, 감정 분석, 전자사전 편찬, 문법 연구, 문체론 연구는 기존의 연구를 바탕으로 하고 있다. 생각해 보라. 고전 이본을 연구하는 학자들은 여러 이본, 때로는 수십 개 이상의 이본을 하나로 펼쳐놓고 비교하고, 꼼꼼히 검색해 보아야 한다. 과거의 학자들이 기억력과 수기로 수집한 메모 카드 등을 활용하였다면 이제는 이러한 연구들이 컴퓨터에 저장된 전자 텍스트를 활용하여서 이루어질 수 있고, 그렇게 되고 있다. ‘거인의 어깨’는 무엇일까? 지금까지 이루어진 선행 연구와 연구자들이 축적한 지식일 것이다. 그리고, 그러한 연구에 활용하여 왔거나 앞으로 활용할 수 있는, 디지털화된 자료일 것이다. 디지털 인문학은 그러한 ‘거인의 어깨’에 올라앉는 ‘난쟁이’이다. 더 높은 목표와 이상을 가지고 있으면, 더 멀리, 더 많은 것을 ‘거인의 어깨’위에서 볼 수도 있을 것이다. 그렇지 않으면 ‘거인의 어깨’에 올라앉는 것이 아니라 ‘주저않을’ 수도 있을 것이다.

6.

[1] 인문학은 ‘인人/문文/’, 즉 ‘사람다움(사람다움의 결)을 새겨주는’ 학문이다. 단지, 연구 방법론이 디지털 시대의 계산 능력을 활용한다고 해서 ‘사람다움’을 이해하고자 하는 본질에서 벗어날 수는 없다. Jockers 교수의 저서는 그런 점에서 방법론적 확장을 통해 인간의 창작 활동과 사회, 문화의 관계를 파악하고자 하는 시야를 넓혀주고 있다. 다만, 컴퓨터공학, 계산통계, 생물정보학 등 다양한 분야와 인문학의 만남이 새로운 패러다임을 여는 ‘혁명적 방법론’ 등의 수사적 문구로 왜곡되는 것은 경계해야 한다.

* 이 글의 저작권은 아포리아에 있음을 밝힙니다. copyrights@aporia.co.kr  ([서평] Aporia Reivew of Books, Vol.1, No.4, 2013년 12월)


 
   
 

BOOK REVIEW
  • 사회과학
  • 인문학
  • 자연과학
  • 논픽션
  • 픽션

월간 베스트 게시물

공지사항
  • 1 아포리아 북리뷰(Aporia Review of Books)
  • 2 궁금하신 사항은 언제든지 문의하여 주시기 바…
이용약관| 개인정보 취급방침| 사이트맵

Copyright (c) 2013 APORIA All rights reserved - www.aporia.co.kr