코로나 확산과 겹치는 비례정당 출범 전후 시기 게시글 824만여건 다뤄

코로나 확산과 겹치는 비례정당 출범 전후 시기 게시글 824만여건 다뤄

박재홍 기자
박재홍 기자
입력 2020-04-01 01:00
수정 2020-04-01 01:57
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0

서울신문·글로벌빅데이터 작업 어떻게

서울신문이 글로벌빅데이터연구소와 실시한 제21대 총선 빅데이터 연구는 코로나19 확산과 제1야당의 당명 변경, 여야의 비례위성정당 출범 등 주요 변수가 부각된 시점을 전후한 온라인 게시글 전체 824만여건을 대상으로 했다.

빅데이터 분석은 1월 20일~3월 23일 트위터·인스타그램·유튜브·페이스북·뉴스·커뮤니티·블로그·카페·카카오스토리·네이버 지식인·기업/단체·정부/공공 등 12개 온라인 채널에 게시된 콘텐츠 가운데 총선이나 코로나 등 특정 키워드가 포함된 글들을 분석 대상으로 삼았다. 다만 댓글은 대상에서 제외했다.

두 개의 키워드가 동시에 들어간 콘텐츠의 경우 단어만 포함되고, 내용이 다른 글들을 제외하기 위해 지정된 키워드 외에 15개 이상의 단어가 포함된 글만 정보로 인정했다. 긍정률과 부정률은 인공지능(AI) 시스템을 통해 각 게시글의 개별 단어를 분석, 긍정·부정적 의미의 단어 개수를 분석해 긍정률, 부정률, 중립률로 분류했다. 예를 들어 게시글에 ‘예쁘다’ ‘좋다’ ‘최고’ ‘잘한다’ 등의 단어는 긍정글로, ‘나쁘다’ ‘화난다’ ‘짜증’ ‘못한다’ 등은 부정글로 봤다.

각 정당 호감도 분석은 미래통합당 출범 다음날인 2월 17일을 기준으로 잡았다. 지역구별 후보자 키워드 분석은 2월 17일부터 한 달인 3월 18일까지로, 비교 기간은 그 전 한 달로 했다. 코로나19의 총선 연관성 확인을 위한 분석 기간은 첫 확진자가 발생한 1월 20일부터 3월 18일로, 비교 기간은 2019년 11월 22일부터 2020년 1월 19일로 삼았다.

박재홍 기자 maeno@seoul.co.kr

2020-04-01 8면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
이번 '카카오톡 업데이트' 여러분은 만족한가요?
15년 만에 단행된 카카오톡 대규모 개편 이후 사용자들의 불만이 폭증하고 있다. 애플리케이션을 내려받을 수 있는 구글 플레이스토어와 애플 앱스토어에는 “역대 최악의 업데이트”라는 혹평과 함께 별점 1점 리뷰가 줄줄이 올라왔고, 일부 이용자들은 업데이트를 강제로 되돌려야 한다며 항의하기도 했다. 여론이 악화되자 카카오는 개선안 카드를 꺼냈다. 이번 개편에 대한 여러분의 생각은?
1. 개편 전 버전이 더 낫다.
2. 개편된 버전이 좋다.
3. 적응되면 괜찮을 것 같다.
광고삭제
광고삭제
위로