[빅데이터 분석] 조국 관련, 진보·보수 모두 '여론조사 조작'을 의심했다

  • 기자명 비플라이소프트 미디어 빅데이터 연구소
  • 기사승인 2019.10.02 09:51
이 기사를 공유합니다

조국 법무부 장관과 관련된 언론보도에 있어서 여전히 논쟁이 이뤄지고 있다. 총 보도량이 과도하다는 정량적 관점의 비판뿐만 아니라, 내용이 악의적이라는 정성적 관점에 이르기까지 언론을 비판하는 글이 소셜미디어를 중심으로 매우 확산되고 있다. 그런 와중에 관련 조국 장관 관련 뉴스가 100만 건 이상 나타났다 사라졌다는 잘못된 정보도 인터넷 여론을 크게 달궜다. (이와 관련해서는 네이버의 오류 내용이 공지되었고, 뉴스톱의 <'조국 기사 100만건' 네이버 검색 오류인가, 조작인가>의 보도에서 팩트체크를 한 바가 있다.) 이에 보다 객관적인 정보를 탐색하기 위해 실제로 조국 장관과 관련된 보도들이 언론사별로 어떠한 특징을 가지고 있는지 살펴보았다.

우선 데이터를 수집하기 위해 오프라인과 온라인 뉴스를 B2B로 제공하는 비플라이소프트의 '아이서퍼'라는 프로그램을 이용하였다. 현재 이 플랫폼에서 수집하고 있는 매체는 조석간 신문, 잡지 등의 인쇄 지면, 온라인 뉴스 등 1,395개에 달한다. 분석을 위해 문재인 대통령이 조국 법무부장관을 지명한 8월 9일부터 9월 9일까지 온라인으로 발행된 뉴스 중에서 '조국' and '후보'로 검색을 해 보았다. 그 결과 총 개수는 78,153건이었다. 다만 '후보'를 붙이지 않은 기사가 있음을 감안해 '조국'이라는 키워드로 검색하고, 그중에서 광복절 즈음에 북한의 주장을 전달한 '조국평화통일위원회' 관련 기사를 빼기 위해 '조국평화'를 배제어로 처리하였다. 그 결과는 92,625건 이었다. 두 결과 모두 100만 건이라는 소문과는 매우 큰 차이를 보인다.

8월9일부터 9월 25일까지 11개 일간지 기사 전수조사

본격적으로 우리 언론이 조국 법무부 장관과 관련된 보도를 어떻게 다뤘는지를 살펴보기 위해서, 주요 중앙일간지의 보도 내용을 분석하였다. 구체적 분석 대상 언론은 조선일보, 중앙일보, 동아일보, 한국일보, 한겨레, 경향신문, 서울신문, 국민일보, 세계일보와 석간인 문화일보, 내일신문 11개 중앙일간지로 한정하였는데, 실질적으로 여전히 한국사회의 주요 정치적 의제설정은 이른바 중앙일간지라고 불리는 메이저 신문들로부터 이뤄지기 때문이다. 특히 본 글에서는 이른바 보수신문으로 인식되고 있는 조선, 중앙, 동아와 중도나 진보쪽으로 인식되고 있는 한국, 한겨레, 경향을 중심으로 살펴보았다. 다만 조국 법무부장관 취임 이후에 언론의 보도태도가 바뀔 수도 있다고 보았기 때문에, 분석 기간을 둘로 나누어서 시행하였다. 편의상 1국면과 2국면으로 나누었는데, 1국면은 법무부 장관 후보로 지명한 8월 9일부터 실제 임명이 된 9월 9일까지이고, 2국면은 법무부장관 임기를 시작한 9월 10일부터 9월 25일까지이다.

 

1차적으로는 언론보도에 있어서 가장 빈번하게 등장한 어휘들을 살펴보았다. 이를 위해서 단순히 중요한 어휘의 빈도만 살펴보는 TF(Term Frequency)값이 아니라, 잘 등장하지 않아서 오히려 더 가치 있게 보는 수치로써 역문서 빈도, 즉 IDF(Inverse Document Frequency) 값을 더불어 봄으로써 의외의 어휘에 가중치를 두어 분석하였다. 예를 들어서 칭찬 일색인 글들이 99개가 있고 반대의 글이 1개가 있다면, 반대의 글에 담겨 있는 ‘갑질’, ‘폭력’ 같은 어휘에 가중치가 높게 부여되는 셈이다. 이를 통해서 소수의 견해이지만 의외이며 의미 있는 내용들을 찾아낼 수 있다.

 

아래 그림은 주요 일간지의 1국면 TF-IDF값을 워드클라우드로 시각화 한 것이다. 여기서는 1국면에서 반복적으로 등장하는 ‘조국’, ‘법무부’, ‘장관’, ‘후보자’, ‘청문회’, ‘검찰’ 등의 어휘는 제거하였다. 그 결과를 살펴보면, 1국면에 있어서 대부분의 언론이 ‘장학금’부터 ‘펀드’, ‘논문’에 이르기까지 다양한 분야의 ‘의혹’에 대해서 전반적으로 다루고 있음을 알 수 있다.

 

[그림1] 조선일보 1국면 TF-IDF 워드클라우드
[그림2] 중앙일보 1국면 TF-IDF 워드클라우드
[그림3] 동아일보 1국면 TF-IDF 워드클라우드
[그림4] 한국일보 1국면 TF-IDF 워드클라우드
[그림5] 한겨레신문 1국면 TF-IDF 워드클라우드
[그림6] 경향신문 1국면 TF-IDF 워드클라우드

 

2국면의 경우 1국면과 달리 ‘조국’, ‘법무부’, ‘장관’, ‘검찰’의 어휘를 제거하고 살펴보았다. 2국면의 경우 1국면과 달리 ‘의혹’보다 ‘수사’ 상황에 좀더 초점을 맞춘 보도들이 이어지고 있다고 볼 수 있다. 즉 검찰의 수사 내용에 대한 보도들이 주를 이루고 있다고 볼 수 있다.

[그림 7] 조선일보 2국면 TF-IDF 워드클라우드
[그림 8] 중앙일보 2국면 TF-IDF 워드클라우드
[그림 9] 동아일보 2국면 TF-IDF 워드클라우드
[그림 10] 한국일보 2국면 TF-IDF 워드클라우드
[그림 11] 한겨레신문 2국면 TF-IDF 워드클라우드
[그림 12] 경향신문 2국면 TF-IDF 워드클라우드

 

얼핏 어휘를 중심으로 살펴보면, 국면별 차이나 언론사별 차이가 크게 두드러져 보이지는 않는다. 그러나 현재 언론보도의 핵심적인 비판 지점인 ‘의혹’에 대한 보도 측면에서 보면, 국면별 언론사별 유의미한 차이가 보인다. 이와 관련해 두 국면을 아우르는 ‘의혹’이라는 키워드로 어떻게 연관어가 이어지는지를 살펴보았다.

 

[그림 13] 조선일보 1국면의 ‘의혹’ 관련 의미네트워크
[그림 14] 중앙일보 1국면의 ‘의혹’ 관련 의미네트워크
[그림 15] 동아일보 1국면의 ‘의혹’ 관련 의미네트워크
[그림 16] 한국일보 1국면의 ‘의혹’ 관련 의미네트워크
[그림 17] 한겨레신문 1국면의 ‘의혹’ 관련 의미네트워크
[그림 18] 경향신문 1국면의 ‘의혹’ 관련 의미네트워크

1국면에선 언론사별 차이 거의 없어

1국면의 경우 앞선 워드클라우드에서 확인한 것처럼 ‘의혹’이라는 어휘를 기준으로 다양한 네트워크가 형성되고 있으며, 언론사별로 큰 차이를 보이지 않고 있다. 조국 후보자 ‘자신’과 ‘가족’의 의혹들이 ‘논란’이 되고 ‘수사’로 이어지는 내용들이 주로 보도되었다고 할 수 있다.

전반적으로 볼 때, 1국면의 경우 조국 장관이 지명되고 임명되기까지 대부분의 언론이 의혹에 대해서 큰 차이 없이 논란이 되는 내용들을 다루고 있다고 볼 수 있다. 물론 해당 이슈에 대한 논조의 차이는 확인할 수는 없지만, 적어도 아이템의 선정에 있어서는 유사한 양상을 보였다.

2국면에선 보수언론이 주로 '검찰관계자' 인용

그러나 2국면, 즉 조국 법무부장관 임명 이후부터 언론의 보도 태도는 매체별로 차이가 있다. 우선 조선, 중앙, 동아의 경우, 여전히 의혹과 관련된 어휘들이 다양하고, 비중 있게 상호 연관되어 나타난다. 특히 ‘검찰 관계자’ 정보원을 통한 의혹 제기의 비중이 높고, ‘청와대’와 ‘대통령’을 연관 짓기도 한다.

2국면의 한국, 한겨레, 경향은 우선적으로 ‘의혹’을 핵심 어휘로 크게 다루지 않는데, 이는 1국면에 비해 큰 변화라고 할 수 있다. 의혹에 대해서 ‘검찰 조사’가 이뤄지고 있음을 객관적으로 서술하는 형태라고 볼 수 있다. 또한 보수신문과는 달리 대체로 익명인 ‘검찰 관계자’를 정보원으로 하는 내용이 크게 눈에 띄지 않는다. 즉 조국 장관이 임명된 이후에 중도적이거나 진보적인 성향의 신문들은 검찰의 수사를 다루되, 의혹을 직접적으로 거론하는 경향성은 줄어들었다고 볼 수 있다.

[그림 19] 조선일보 2국면의 ‘의혹’ 관련 의미네트워크
[그림 20] 중앙일보 2국면의 ‘의혹’ 관련 의미네트워크
[그림 21] 동아일보 2국면의 ‘의혹’ 관련 의미네트워크
[그림 22] 한국일보 2국면의 ‘의혹’ 관련 의미네트워크
[그림 23] 한겨레신문 2국면의 ‘의혹’ 관련 의미네트워크
[그림 24] 경향신문 2국면의 ‘의혹’ 관련 의미네트워크

네티즌, '검찰개혁'과 '여론조사 조작' 댓글로 강조

한편 인터넷 여론을 살펴보기 위해 관련 기사중 가장 댓글이 많은 유형의 기사를 선정하여 댓글에서 어떤 의미가 형성되었는지를 살펴보았다. 조선일보의 <'조국 사태'에 40대는 돌아섰는데 30대는 왜 文대통령 지지 고수할까>, 머니투데이의 <조국 검찰개혁 "긍정적" 52%… "조국 잘할 것" 45%>, KBS의 <[일요진단 라이브] 조국 검찰개혁 추진, 긍정적 52% vs 부정적 35%>, 조선일보의 <文지지율, 30대·호남 빼곤 다 돌아섰다>의 네이버 뉴스 댓글을 수집하였는데, 9월 25일을 기준으로 각각 1만260개, 2907개, 2832개, 5531개로 총 2만353개로 나타났다. 댓글을 통해서 나타난 TF-IDF 상위 50개의 값은 다음과 같다.

 

순위

키워드

TF-IDF

순위

키워드

TF-IDF

1

지지

809.8619

26

대가리

178.9092

2

조국

653.0043

27

민주당

177.1499

3

개혁

554.4961

28

여자

166.9551

4

검찰

480.3726

29

문제

163.7135

5

사람

457.4256

30

선동

158.187

6

조사

427.9378

31

장관

152.4647

7

조작

410.2186

32

쓰레기

147.1307

8

전라도

388.1401

33

대한민국

145.7147

9

여론

354.6538

34

소리

143.4679

10

문재인

348.8812

35

가짜_뉴스

139.9354

11

나라

338.2739

36

자한당

136.2518

12

조선일보

324.7063

37

개돼지

134.2826

13

호남

316.5933

38

카페

124.555

14

기사

314.5192

39

달창

123.7287

15

국민

314.1742

40

정부

120.6958

16

세대

275.7572

41

반대

120.1317

17

조선

231.255

42

좌파

118.8508

18

정신

226.1899

43

정치

118.354

19

대통령

225.2767

44

이상

117.3771

20

생각

220.4465

45

주위

117.2379

21

언론

212.2305

46

응원

115.487

22

지지율

198.207

47

북한

106.2061

23

정권

187.9718

48

문재인

106.0062

24

주변

184.0862

49

빨갱이

98.56124

25

재앙

182.7336

50

전교조

97.09121

 

‘조국’ ‘지지’와 ‘검찰’ ‘개혁’의 키워드가 매우 비중있게 나타났고, ‘여론’ ‘조사’ ‘조작’의 어휘도 높은 비중으로 나타났다. 해당 내용을 워드클라우드로 시각화하면 다음과 같다.

 

조국 관련 기사에 대한 댓글 워드클라우드 시각화.
조국 관련 기사에 대한 댓글 의미네트워크

한편 이를 기준으로 어휘들 간의 근접중심성을 계산하여 의미 네트워크를 구성한 결과 다음과 같이 나타났다. 가장 핵심적으로는 조국 장관의 검찰 개혁 역할에 대한 담론이 나타났는데, 이는 기사 자체의 제목 특성을 반영한 것으로 찬성과 반대가 뚜렷하게 구분되었다. 전반적으로지지 의견이 조선일보의 여론조사를 비판하는 가운데 우위를 보이고 있다. 해당 여론조사가 조작이라는 의견들도 비중 있게 제시되었는데, 정파적 특성에 상관없이 골고루 나타났다. 이는 댓글을 수집한 뉴스가 상반되는 내용을 담고 있기 때문인데, <文지지율, 30대·호남 빼곤 다 돌아섰다>의 보도에 대해서는 여당 지지성향 네티즌들이 조선일보를 비판하며 조작 문제제기를 하였고, <[일요진단 라이브] 조국 검찰개혁 추진, 긍정적 52% vs 부정적 35%>의 보도에 대해서는 문대통령과 조국 장관을 반대하는 네티즌들의 조작 문제제기가 있었다. 특히 호남의 여론조사 결과를 두고는 지역감정에 입각한 인신공격성 댓글들의 빈도가 높게 나타났다.

*이경락 팩트체커는 미디어빅데이터 회사인 비플라이소프트에서 빅데이터 분석팀장으로 재직중이며, 서울여대 언론영상학부 겸임교수를 맡고 있다.

이 기사를 공유합니다
오늘의 이슈
모바일버전