검증되지 않은 정보의 홍수 속에서 거짓 정보 여부를 판단하고, 각종 자료 및 주장을 현명하게 취사선택해 소비하는 것이 어느 때보다 중요한 시대이다. 가짜뉴스가 현대인들에게 미치는 영향은 매우 심각하다. 특히 감염병 관련 허위정보 및 공중보건 관련 가짜뉴스의 경제적, 사회·문화적, 법적, 정치적 영향력은 매우 크다. 무엇보다 신종 코로나바이러스와 같은 감염병에 대한 정보가 부족한 상황에서, 미디어를 통한 가짜뉴스의 영향력을 파악하는 것은 무엇보다 주목할 만한 연구 주제라고 할 수 있다. 보건복지분야에서 가짜뉴스 탐지의 중요성이 부각되는 만큼, 기계학습을 통해 수립된 모델의 정책적 활용도, 즉 규제나 정책 수립과 관련된 의사결정을 뒷받침하는 객관적, 정량적 근거로서의 활용 가능성을 높이기 위해서는 기계학습을 통한 가짜뉴스 탐지에 수반되는 몇 가지 이슈와 쟁점을 논의하여야 한다. 본 연구에서는 실제 데이터 분석과 기계학습 적용 시 고려해야 할 관련 이슈들을 짚어보고 그 활용방안을 논의해보고자 한다.
목차
Abstract 1 요 약 3
제1장 서론 15 제1절 연구의 배경 및 목적 17 제2절 연구의 내용 및 방법 21
제2장 가짜뉴스(fake news) 개념 정의 및 국내외 사례 23 제1절 가짜뉴스 개념 정의 25 제2절 가짜뉴스 관련 국내·외 사례 검토 30 제3절 가짜뉴스 대응 사례 41
제3장 기계학습 기반 가짜뉴스 탐지 기법 연구 59 제1절 가짜뉴스 탐지 관련 기계학습 기법 61 제2절 최신 워드 임베딩 방법 75 제3절 메타정보를 활용한 가짜뉴스 탐지 방법 82 제4절 Multi-modal 방법 97 제5절 소결 105
제4장 코로나19 관련 가짜뉴스 탐지 데이터 분석 107 제1절 뉴스 자료 단어에 대한 탐색적 분석 109 제2절 시간에 따른 단어의 분포 변화 119 제3절 주요 단어의 분포 변화 131 제4절 설명 가능한 AI를 위한 분석 135 제5절 BERT 모형 적용 155 제6절 소결 164
제5장 기계학습 기법을 통한 가짜뉴스 판별의 이슈와 성능 고도화 방안 167 제1절 기계학습 기법을 통한 가짜뉴스 판별의 이슈 169 제2절 기계학습 기반 가짜뉴스 판별 성능 고도화 방안 184