Home » CT OPINION, 소셜사이언스, 영화

[CT OPINION] 세이버메트릭스

April.2020 No Comment

만약 우표에 관심이 있는 사람들이 우표 수집을 하고, 몸집이 큰 사람들이 스모를 좋아한다면, 통계를 좋아하고 시시콜콜한 정보에 관심 있는 사람들은 야구에 끌릴 것이다.
– 스티븐 제이 굴드

 

가장 좋을 때인 4월, 꽃놀이를 가야할 것만 같은데. 일상을 방해하는 이 코로나 바이러스가 야속하게 느껴진다. 여러 애로사항이 있는 요즘 한국프로야구 또한 개막을 연기해 야구 팬들을 울리고 있다. 본 기자도 최근 가슴이 답답하여 그 이유를 생각해봤는데 아무래도 야구 개막이 미뤄진 탓인 것 같다. 이런 아픔을 달래기 위해 첫 기사는 야구에 대한 것으로 준비했다.
야구를 이해하는 방법론에는 여러 가지가 있다. 이 중 통계적 분석을 활용하는 것을 흔히 세이버메트릭스라고 부른다. 세이버메트리션은 기존의 클래식 스탯이 가진 한계를 인지하고, 선수의 가치를 보다 정확히 평가하기 위해 다양한 경기 기록들을 조합한다. 이는 대중문화에 기술이 적용된 실례라고 할 수 있다. 본 기사에서는 세이버메트릭스의 시작과 성공 사례, 부정적 시각과 최근 현황까지 짚어보기로 한다.

1

 그림 1. 세이버메트릭스의 창시자 빌 제임스

세이버메트릭스?
세이버메트릭스(Sabermetrics)는 SABR(The Society for American Baseball Research. 미국야구연구회)와 metrics의 합성어이다. 그 이름에서도 알 수 있듯, 세이버메트릭스는 야구계 내부가 아니라 아마추어 야구 애호가들로부터 시작됐다. SABR의 설립자이자 세이버메트릭스의 창시자라고 할 수 있는 빌 제임스(Bill James)는 통조림 공장의 야간 경비원이었다. 야구를 기록하는 것을 즐겼던 그는 자신이 모은 데이터를 가지고 새로운 통계수치를 개발했고, 그 연구결과를 ‘Baseball Abstract’라는 팜플렛으로 만들어 판매했다. 이것이 세이버메트릭스의 시작이다.
빌 제임스는 세이버메트릭스가 단순히 통계적 방법론을 가리키는 것은 아니라고 말했다. 그 본질은 통계학의 활용 여부가 아니라 “야구에 대한 객관적인 지식의 추구”라는 것이다. 간단한 예를 들면 다음과 같다. 흔히 타자의 성적을 논할 때 가장 먼저 언급되는 기록이 바로 타율이다. 타율은 안타 수를 전체 타수로 나눈 것으로, 직관적이고 이해하기 쉬워 많이 쓰인다. 하지만 타율에는 커다란 맹점이 있는데 바로 모든 안타의 가치가 똑같이 취급된다는 것이다. 단타와 홈런의 가치에는 확연한 차이가 있음이 자명하기에 타율은 타자의 실력을 제대로 반영하지 못한다고 할 수 있다. 그래서 타율보다 출루율과 장타율의 합인 OPS가 좀 더 나은 스탯으로 여겨진다. 이렇듯 세이버메트릭스는 기존의 통념에 얽매이지 않고 객관적으로 야구를 보기 위한 시도이다.

1

 그림 2. 오클랜드와 빌리 빈의 성공 스토리를 담은 영화 ‘머니볼’

성공 사례
세이버메트릭스를 활용한 성공 사례로는 오클랜드 애슬레틱스를 들 수 있다. 빌리 빈(Billy Beane)이 단장으로 부임한 1998년, 오클랜드 애슬레틱스의 페이롤은 넉넉하지 못했다. 많은 돈을 쓰지 못하니 자연스럽게 저비용 고효율 선수를 찾게 되었고, 선수 탐색의 수단으로 빌리 빈 단장이 선택한 것이 세이버메트릭스였다. 단장은 세이버메트릭스 지표를 활용하여 고전적인 스카우트 방식을 통해선 주목 받지 못했지만 고유한 가치를 가진 선수들을 골라냈다. 타율이 높지 않고 파워, 주력도 월등하지 않지만 출루율과 장타율이 적절한 균형을 이루는 일명 ‘OPS형 타자’가 대표적이다.
그 결과, 오클랜드는 1999년부터 2006년까지 승률 0.537 이상을 기록하며 5번의 플레이오프 진출을 이뤄냈다. 몇 배의 페이롤을 사용한 부자 구단들만큼 좋은 성적을 기록한 것이다. 이러한 오클랜드의 성공은 다른 메이저리그 팀들이 세이버메트릭스에 관심을 갖게 하는 계기가 되었고, 빌리 빈의 스토리는 ‘머니볼’이라는 제목의 책으로 발간되어 경영학 분야 베스트셀러 대접을 받았다. 이 책은 브래드 피트가 주연을 맡은 동명의 영화로 각색되기도 했다.

부정적 시각
물론 세이버메트릭스에 대한 부정적인 시각도 존재한다. 현장에서 직접 뛰는 선수와 코치들은 야구를 제대로 경험해보지 않은 아마추어들이 숫자를 가지고 자신들을 평가하는 것에 대해 반감을 표하는 경우가 있다. 야구란 결국 사람이 하는 것이고, 선수의 과거 기록 외에도 그 날의 컨디션, 팀 분위기 같이 고려해야 할 사항이 많은데 세이버메트릭스는 이들을 다루지 않는다는 것이다.

1

위 공식은 RC(Run Created)라는, 득점 창출 능력에 대한 세이버메트릭스 지표다. 식에 포함된 0.26, 0.52와 같은 상수는 데이터를 이용한 회귀 분석의 결과이다. 분명 위 공식은 과거 경기 기록에 대해 유효한 설명을 제공하겠지만, 실상 야구의 본질에 대해서는 어떤 것도 이야기해주지 않는다. 한마디로, 세이버메트릭스는 어떤 진리가 아니다. 야구를 좀 더 잘 이해하기 위한 하나의 도구일 뿐이다.

1

그림 3. 스탯캐스트 데이터를 기반으로 만든 영상의 한 장면

스탯캐스트
메이저리그는 2015년부터 스탯캐스트(Statcast)를 도입했다. 스탯캐스트는 군사용 레이더에서 쓰이던 추적 기술을 야구에 적용해 투구를 트래킹하는 시스템이다. 투구의 구속, 회전수, 궤적 뿐만 아니라 타구 정보, 수비수의 위치 등 야구 경기의 모든 것을 기록한다고 할 수 있다. 기존 세이버메트릭스에는 수비를 정량화하기 힘들다는 약점이 있었지만, 스탯캐스트의 도입 이후 수비수의 플레이를 온전히 평가하려는 시도가 이루어지고 있다. 더 나아가 스탯캐스트 데이터를 활용한 딥러닝 연구는 선수의 세세한 행동 패턴을 파악하는 것으로 세이버메트릭스를 더 높은 차원으로 끌어올리려 한다.

세이버메트릭스는 아마추어리즘에서 출발해 그 가치를 인정받고는 프로 스포츠의 영역에 한 자리를 차지했다. 필드와 일정 거리를 둔 채 과학적 방법론을 통해 야구를 탐구하는 모습은 CT의 몇몇 연구와도 닮아 있다는 생각이 든다. 과연 앞으로의 세이버메트릭스가 불확실을 확실로 바꿔 나갈 수 있을지 궁금해진다.

박동주 (pdj333@kaist.ac.kr)