Home » 학술정보

[학술정보], 번역자 이제원 학우 인터뷰

November.2013 No Comment

Chang, W. (2012). 이제원 역. R graphics cookbook. O'Reilly.

 

안녕하세요. 우선 번역하신 도서 <R Graphics Cookbook>의 출간을 축하 드립니다. 인터뷰에 앞서 간단한 자기소개 부탁 드립니다.
안녕하세요. 석사과정 4학기 차 이제원이라고 합니다. 학부전공으로는 언론정보학과 국문학을 복수전공하였고 현재는 소셜 랩에서 연구를 진행하고 있습니다.

이번에 번역하신 <R Graphics Cookbook> 이전에도 2012년 관련도서 <R Cookbook>을 번역하신 것으로 알고 있는데요, 학부과정으로 인문학을 전공하셨는데 R이라는 프로그램 도서를 번역하게 되신 이력이 독특합니다. 어떠한 계기를 통하여 R이라는 프로그램을 접하고 번역하게 되셨나요?
CT에 합격하고 입학하기 이전, 교수님으로부터 개강 전까지 미리 준비해두면 도움이 되는 공부들에 대해 조언을 얻었습니다. 파이썬과 R이라는 프로그램을 익혀두는 것이 도움이 될 것이라는 조언을 해주셨고, 때마침 친한 개발자 분의 지인이신 출판사 사장님께서 <R Cookbook>이라는 R관련 서적을 출간하고자 하는데, 프로그램을 공부하는 겸 해서 번역해보지 않겠냐는 제안을 받았습니다.
첫 번째 책이었던 <R Cookbook>의 번역 이전에는 R 프로그램을 사용해본 적이 없었으나, 번역하는 과정을 계기로 배우고, 사용하게 되었습니다. 이후 CT 대학원에서 연구활동을 하는 과정에서 조금 더 자세히 공부하고 사용하고 있습니다. 이번에 출간한 두 번째 책 <R Graphics Cookbook>은 R을 사용한 통계 및 분석 이후 데이터 시각화 과정을 다루고 있습니다.

R이라는 프로그램을 모르는 분들을 위해 프로그램에 대해 간단히 소개 부탁 드립니다.
인문학 사회과학 분야에서 통계 및 분석에 주로 사용하고 있는 SPSS나 SAS 같은 통계 패키지 프로그램과 하는 일은 비슷하다고 보시면 됩니다. SPSS, SAS의 경우 미리 만들어진 패키지라서 구현은 잘되어있으나, 사용자가 원하는 대로 수정해서 사용하기에는 어려움이 있지요. 그러나 R의 경우, 기본적으로 ‘언어’ 이므로 같은 통계작업을 하면서도, 데이터 가공이 가능하고, 계산도 가능하며, 그래프를 그리는 것도 가능하고, 세밀하게 그래프를 수정할 수 있습니다.
또한 SPSS, SAS 같은 기업형 프로그램은 돈을 주고 구매해야 하고 회사에서 업데이트하기 전까지는 사용자가 활용할 수 있는 범위가 다소 한정적입니다. 그러나 R은 프로그램 사용 환경이 오픈소스 기반이다 보니 누군가가 제안한 알고리즘을 본인의 데이터에 적용하여 사용이 가능하다는 장점이 있습니다. 실제로 R은 외국의 많은 학자들이 사용하고 있으며, 그들이 새로운 알고리즘을 개발할 경우 구현한 코드를 공유하기도 합니다. 이러한 오픈소스를 사용하게 되면 기존의 통계패키지에서는 쓸 수 없었거나, 새로 코딩을 해야만 사용할 수 있었던 기능들을 바로 다운받아서 적용 및 사용 할 수 있지요.

통계 및 분석 과정에 있어서 파이썬과 R은 각각 어떤 과정에 사용되나요?
우선 파이썬은 보다 광범위한 프로그래밍 언어 입니다. 처음부터 알고리즘을 짜고 싶거나, 프로그램을 만들고 싶을 때 사용하게 되지요. 그에 비해 R은 통계 및 분석, 데이터 시각화에 사용하기 용이한 언어입니다. 자신이 필요한 패키지를 다운받아 사용하기에 용이한 사용환경을 제공하지요.
실제적인 사용 과정을 예로 들자면, 우선 연구를 위하여 수집한 데이터나 로그를 분석하기에 좋은 형태로 가공하는 과정에서는 주로 파이썬을 사용하게 됩니다. 이후 가공한 데이터를 실제로 통계 및 분석하는 과정에서 R을 사용하게 됩니다. 다양한 오픈소스를 검색하고, 자신의 데이터를 분석하는 데에 가장 효과적인 알고리즘을 찾아서 적용시킬 수 있습니다. <R Cookbook>의 경우 이러한 과정에 대하여 다루고 있습니다.

Teetor, P. (2011). 이제원 역. R cookbook. O'Reilly.

위와 같은 통계 및 분석 과정 이후에는 효과적인 결과의 시각화 작업이 필요합니다. 이러한 데이터 시각화 과정에서도 R을 사용하게 됩니다. 역시 이 과정에서도 오픈소스라는 사용환경은 큰 장점으로 작용하겠지요. 이와 같은 시각화, 그래프 그리기 및 수정하는 과정에 대해서는 최근에 출간한 <R Graphics Cookbook>에서 다루고 있습니다.

프로그래밍 언어 관련 비전공자의 입장에서 번역을 하시면서 어려웠던 부분은 없으셨나요?
우선 용어의 사용 문제가 가장 어려웠던 것 같습니다. 기존에 일상적으로 접하고 사용하던 용어가 아니기 때문에 프로그램을 사용해보는 과정이 필요했고, 전문가에게 감수를 받는 과정이 필수적이었습니다. 번역, 감수 과정 이후에도 프로그래밍 리뷰어 들에게 다시금 확인하는 과정을 거쳤습니다.
첫 번째 도서의 경우 번역과정에서 재미있는 에피소드가 있었는데요, 프로그래밍 언어에 있어서 보편적으로 ‘리스트’ 라고 그대로 사용하고 있는 ‘List’ 개념을 ‘목록’ 이라고 그대로 번역해버려서 몇몇 분들을 당황하게 했던 기억이 나네요. (웃음)

<R Cookbook>이전에도 번역 일을 하신 적이 있으신가요? 앞으로 번역이나 출판계획이 있으신지요?
기존에는 아동 청소년 영어 문학 작품을 번역하여 영어학습용 워크북으로 만드는 작업을 했었던 경험이 있었습니다. <R Cookbook>과 <R Graphics Cookbook>의 경우에는 배우고 싶던 분야와 번역할 수 있는 기회가 맞물려서 저에게는 좋은 기회가 되었던 것 같습니다.앞으로도 제가 연구하고 관심 있는 분야나 소재와 관련해서 이러한 번역 기회가 있다면 다시 해볼 생각입니다.

R관련 서적의 번역자로서 당연히 본인의 연구과정에도 R을 사용하고 계실 것 같습니다. 현재 진행중인 연구에 대한 소개와 해당 연구에서 R을 어떻게 사용하고 계신지 궁금합니다.
현재 진행중인 연구에 대해 간단히 소개 드리자면, 온라인 게임(아이온)의 3개월 동안의 아이템 거래 데이터를 분석을 통하여, 게임상의 거래에 있어서 어떤 특징에 의해 판매자와 구매자간의 이득과 손해가 발생하는지를 네트워크적 관점에서 분석하는 연구라고 할 수 있습니다.
실제로 MMORPG 게임 상에서 일어나는 일들은 다른 장르의 게임에 비하여 현실에서 일어나는 일들과 유사한 부분이 많다고 생각합니다.우선 게이머들간의 채팅을 통하여 사회적 소통 활동이 이루어지고 있고, 게임의 미션 수행 역시 공동의 목적을 전제로 집단을 구성하여 수행하게 되며, 이러한 게임 과정에서 필요한 아이템 등을 재화를 사용하여 거래하고 있다는 점에서 현실 속 행위와의 유사점을 찾을 수 있지요.
이러한 게임 속 행위를 소셜 메커니즘을 통해 분석하는 작업을 하고 있습니다. MMORPG 아이온3개월간의 평균가격과 표준가격을 추출하여 판매자와 구매자의 관점에서 각각 이득을 창출해내는 요인들을 살펴보고 있습니다. 우선 가장 쉽게 살펴볼 수 있는 요인으로 친구관계일수록 이득을 덜 추구하게 되는 경향을 관찰 할 수 있고, 서로에게 공평한 거래를 하게 됨을 추측할 수 있었습니다. 반면, 사회적 관계망 속의 거리가 멀거나 낯선 사람일수록 이득을 추구하게 되는 경향을 관찰할 수 있었습니다. 또한, 같은 커뮤니티 내의 속해있는 사람들간의 거래의 경우 그렇지 않은 경우에 비해 이윤을 덜 추구하는 경향을 관찰 할 수 있었습니다. 아무래도 게임상에서 앞으로 계속 봐야 하는 사람들간의 거래이기 때문이겠죠.
실제로 본 연구를 수행하는 데에 있어서 많은 부분 R을 사용하였습니다. 앞서 말씀 드렸다시피, 처음 얻은 로그를 분석에 용이한 형태로 가공하는 과정에서는 파이썬을 사용하였고, 가공한 데이터를 실제로 통계 및 분석하는 과정에서 R을 사용하였으며, 통계 분석의 결과를 효과적으로 시각화 하는 과정에서도 R을 사용하였습니다.

<R Cookbook>, <R Graphics Cookbook>을 번역하는 작업들이 본인의 연구에 많은 도움이 되었을 것 같습니다. 향후 어떤 분야나 주제에 관해 연구를 하시고 싶으신가요?
거시적으로 연구의 분야나 주제는 SNS상의 데이터 분석으로 생각하고 있습니다. 이를 위해 컴퓨터 공학, 사회학 분야의 지속적인 공부가 필요할 것 같습니다. 보다 구체적으로는 SNS상에서의 사람들의 행동분석에 관심이 많은데요, 주로 경제적인 활동의 측면을 중심으로 분석하고 연구하고 싶습니다. 기존의 SNS연구의 경우 메시지 분석, 친구관계 분석 등을 위주로 수행되는 경향이 있는 것 같습니다. 저는 이러한 SNS상의 활동보다는 사용자들이 각각의 이윤을 추구하는 행위나 상품을 구매하는 패턴 등의 경제적 활동을 중심으로 관찰하고 연구하고 싶습니다.

이제원 학우

마지막으로, 인문학을 전공하고 CT에서 공부를 하고 있는 학우들에게 본인의 경험을 바탕으로 하고 싶은 조언이 있으신가요?
코딩에 도전해보시기 바랍니다. 프로그래밍 언어 역시 하나의 언어일 뿐인데 기존에 접하지 않아서 낯설거나 두려운 생각이 들 수 있을 것 같습니다. 익숙하게 적응하는데 거부감이 있을지라도 하나의 언어로서 받아들이면 충분히 가능하다고 생각합니다.
한가지 더 드는 생각으로 기존에 다른 전공을 하신 분들이 본인의 예전 전공분야를 버리려고 하는 경우가 있습니다. 저의 개인적인 생각을 말씀 드리자면, 이전의 전공을 버리려고 하지 말고 현재 관심 있는 분야에 적용하고 통합하고자 하는 시도가 보다 더 유용하다고 생각합니다.저의 경우 이전에 배웠던 국문학 공부들은 머신 러닝, 텍스트 분석과정 등에 굉장히 유용하게 사용할 수 있었습니다. 본인의 전공분야를 오히려 장점으로 만들고, 활용할 수 있는 방법은 얼마든지 있는 것 같습니다.

<R Cookbook>과 <R Graphics Cookbook>

R 프로그램에 대한 추가정보(출처: R cookbook의 저자 서문. Teetor, P. (2011). R cookbook. O’Reilly.)
웹R 프로젝트 사이트 (http://www.r-project.org). 바이너리, 애드온 패키지, 문서, 소스 코드 등
Rseek(http://rseek.org)R만을 다루는 검색 엔진
블로그Tal Galili의 R-bloggers(http://www.r-bloggers.com/)PlanetR(http://planetr.stderr.org/)
R 관련 서적R 프로젝트 사이트의 R 관련 책 목록(http://www.r-project.org/doc/bibs/R-books.html).
Venables, W. N., Smith, D. M., & R Development Core Team. (2002). An introduction to R.CRAN(http://cran.r-project.org/doc/manuals/R-intro.pdf) 에서 무료로 pdf를 다운받을 수도 있지만, 출판된 책을 구입하면 수익이 R 프로젝트에 기부된다.
Adler, J. (2009). R in a Nutshell. O’Reilly Media.
임호경 부편집장 imagine21c@kaist.ac.kr