Premium > 베스트
가짜 상관관계를 경계하라
2016-05-16 | 한인재 에디터

안녕하십니까? ‘상관관계가 인과관계를 의미하지 않는다’는 진리는 누구나 잘 알고 있습니다. 그런데 Spurious Correlations>의 저자인 타일러 비겐은 통계자료나 그래프, 차트를 조작하는 꼼수에 속아 넘어가는 일이 얼마나 쉽게 일어날 수 있는지 꼬집고 있습니다. 가장 빈번하게 쓰이는 조작 방법은 변화 추세가 비슷한 데이터 세트 두 가지를 하나의 도표에 그래프로 그리는 방법입니다. 먼저 X축은 동일하지만 왼쪽과 오른쪽에 서로 다른 두 개의 Y축을 지닌 도표에 두 세트의 데이터를 동시에 그래프로 표시합니다. 그리고 각 Y축의 범위를 조정해 두 그래프가 하나로 수렴되도록 다듬습니다. 거짓 상관관계가 쉽게 만들어집니다. 이런 방법으로 만들어진 말도 안 되는 상관관계의 예를 들어 보겠습니다. 먼저 일인당 액상과당 소비량을 왼쪽 Y축을 기준으로 그래프로 그립니다. 그리고 오른쪽 Y축을 기준으로는 스포츠 경기 관람에 소비한 금액을 그래프로 나타냅니다. 자 이제 “스포츠팀을 응원하면 살을 뺄 수 있다”는 황당 무계한 인과관계가 만들어졌습니다. 정말 얼토당토않은 상관관계라면 비교적 쉽게 알아채고 반박할 수 있습니다. 그러나 조작했더라도 겉보기에 그럴싸한 통계자료라면 얘기가 달라집니다. 다음 세 가지 유형은 특히 경계할 필요가 있습니다. 첫째, ‘의미 없는 비교’입니다. 본래 비교 자체가 불가능한 변인들을 억지로 연결시켜 한 쌍의 그래프로 그려도 곡선의 형태가 유사하게 나타날 수 있습니다. 이럴 때는 표를 따로 그리는 방법이 최선입니다. 둘째, ‘단위 왜곡’입니다. 두 Y축이 같은 범주의 데이터를 나타낼 때도 단위를 조정하면 마치 상관관계가 있는 것처럼 보이도록 만들 수 있습니다. 리테일코라는 회사의 월별 매출을 나타낸 다음 도표에서는 두 Y축의 범위와 비율을 서로 다르게 표시해 봤습니다. 그랬더니 40세 미만 고객의 월별 매출과 40세 이상 고객의 월별 매출이 매우 유사한 패턴을 보이는 것으로 나타났습니다. 하지만, 두번째 Y축을 없애고 하나의 Y축에 두 데이터를 표시해봤더니 전혀 다른 그림이 나왔습니다. 처음 도표가 얼마나 왜곡됐는지 알 수 있습니다. 셋째, ‘IF-THEN관계’입니다. 서로 관계없는 데이터 세트를 엮어 한 변인의 변화가 다른 변인의 변화를 유도한 것처럼 보이게 할 수 있습니다. 앞서 보여드린 ‘스포츠팀을 응원하면 살을 뺄 수 있다’ 사례가 이에 해당한다고 볼 수 있습니다. 우연한 현상에서 그럴듯한 이야기를 꾸며내는 눈속임 방법입니다. 엄청난 양의 데이터와 다양한 분석 도구가 쏟아져 나오는 요즘 같은 시대에는 이처럼 꼼수를 부리기도, 그 속임수에 넘어가기도 더 쉬워졌습니다. 눈속임과 진실을 구분해 내는 감식안이야말로 경영자에게 꼭 필요한 핵심 역량이라 할 수 있습니다. 감사합니다

내용 모두 펼치기
HBR Premium은 유료 서비스입니다.
10인의 디렉터가 쉽게 설명해주는 HBR Premium!
HBR Premium을 구독하고 디지털 서비스까지 이용하세요!
프리미엄신청
한인재 미래전략연구소 팀장
관련 아티클