전체

"대선 여론조사와 빅데이터, 상관관계 높다"

[레이더P] 이슬비 씨 석사 논문…"지지율 측정 방식에 변화 필요"

  • 김정범 기자
  • 입력 : 2018-03-23 13:46:37   수정 : 2018-04-02 18:06:31
  • 페이스북
  • 트위터
  • 카카오스토리
  • 이메일
  • 공유
  • 프린트
온라인 검색 순위와 노출 빈도 등 빅데이터를 분석한 결과와 기존 여론조사 결과 간에 상관관계가 높다는 내용의 논문이 나와 관심이다.

숙명여대 미디어학과 대학원의 이슬비 씨는 '대선 후보자에 대한 유권자들의 화제성 지표 활용 가능성에 대한 연구'란 제목의 논문에서 19대인 지난해 대선 기간 중 실시된 각종 여론조사와 빅데이터 지수를 비교·분석했다.

19대 대선 기간(2017년 2월 1일~5월 7일) 문재인·안철수·홍준표·심상정·유승민 후보자가 포함된 여론조사와 빅데이터 분석 결과의 주별 평균치를 분석해 상관관계를 살펴봤다. 사용한 자료는 빅데이터 전문업체 굿데이터코퍼레이션이 대선 당시 발표한 '2017 대선 화제성 지수'였다. 레이더P는 대선 당시 굿데이터코퍼레이션과 함께 대선 후보자들을 대상으로 온라인 내에서 각 후보자가 얼마나 주목을 끌고 있는지를 분석해 화제성 지수를 추출했다. 포털 뉴스, 온라인 게시판, 페이스북, 트위터, 동영상 포털 등을 종합해 수치화했다.

프리미엄 첨부 이미지이미지 확대
분석 결과 전체 14주 기간에 첫째주와 넷째주를 제외하고는 여론조사와 빅데이터 지수 간 상관관계가 높은 것으로 나타났다. 첫째주 조사에서는 여론조사와 온라인 화제성 상관관계(상관관계 계수 0.723, 유의확률 값 0.167)가 크지 않았다. 상관관계 계수가 높을수록, 유의확률 값이 낮을수록 높은 상관관계가 있다.

하지만 둘째주 조사에서는 여론조사와 빅데이터 지수 간 유의미한 상관관계(상관관계 계수 0.997, 유의확률 값 0.000)를 나타냈다. 전체 기간 여론조사와 온라인 화제성 간 상관관계는 0.882였다.

이씨는 "여론조사와 온라인 화제성 지수(빅데이터) 간에 통계적으로 유의미한 상관관계가 있음을 확인했다"면서 "온라인 화제성 지표가 여론조사를 보완할 수 있는 지표로 기능할 수 있는 가능성을 제시했다"고 설명했다.

특히 포털 게시판이 여론조사와 상관관계가 가장 높았던 것으로 나타났다. 포털게시판 화제성 지수와 여론조사 간 상관관계는 0.895로 가장 높았고 이어 트위터(0.879), 뉴스 댓글(0.780), 동영상(0.475), 페이스북(0.413) 순이었다.

특히 빅데이터 분석은 지난 19대 대선 당일(5월 9일) 공개가 가능해 막판 판세를 가늠할 수 있는 유일한 지표였다. 공직선거법에 따르면 19대 대선은 엿새 전인 5월 3일부터 여론조사 결과 공표가 금지됐다. 반면 선거관리위원회의 유권해석에 따라 빅데이터 조사는 예외 적용을 받아 대선 흐름을 엿볼 수 있었다.

이씨는 "급변하는 미디어 환경 속에서 유권자들의 지지율을 측정하는 방식에 변화가 필요하다"면서 "여론조사 단일 도구만으로는 변화하는 미디어 환경 속에서 정확한 여론을 측정하고 포괄하기에 어려움이 있다"고 설명했다.

해당 논문에 인용된 여론조사는 중앙선거여론조사심의위원회에 등록된 여론조사 업체 중 연구 시기에 조사 결과를 공개한 34개 업체 141개 여론조사를 분석 대상으로 했다.

[김정범 기자]

기사의 저작권은 '레이더P'에 있습니다.
지면 혹은 방송을 통한 인용 보도시 출처를 밝혀주시기 바랍니다.

정치실록

정치실록 2018년 7월 16일 Play Audio

전체 기사 더보기