패널 데이터 품질 개선을 위한 항목무응답 대체 방법

제목
패널 데이터 품질 개선을 위한 항목무응답 대체 방법
Imputation of Item Nonreponse for Quality Improvement in Panel Data
저자

이혜정

발행연도
2020-08-01
발행기관
한국보건사회연구원
Series
보건복지포럼 2020년 8월 통권 제286호, pp.43-60
Journal Title
보건복지포럼
초록
수집한 패널 데이터의 사후적인 품질 관리 방법으로는 데이터 정제를 통한 정합성 관리, 패널이탈에 대한 지속적인 검토를 통한 표본 대표성 확보, 가중치 작성, 항목무응답에 대한 처리 등이 있다. 이 글에서는 한국 복지패널조사 및 한국의료패널조사에서의 항목무응답 대체 방법을 소개하고 최신 통계 방법인 기계학습 통계기법을 기반으로 한 항목무응답 대체 방법의 효과를 파악하여 적절한 대체 방법을 제안하고자 한다.
이에 대한 종합적인 결과와 활용 방안은 세 가지로 요약할 수 있다. 첫째, 패널 자료에서의 항목무응답 대체 시 기계학습 통계기법을 적용할 수 있는 가능성을 확인하였다. 특히 랜덤 포레스트 대체 방법은 편향뿐만 아니라 다른 평가지표도 우수한 결과를 보여 실무에서 활용해 볼 수 있다고 생각한다. 둘째, 대체군 활용 여부에 따라 대체 효과가 확연히 달라지는 결과를 통해 무응답 대체 시 대체군 활용의 중요성을 다시 한번 확인하였다. 셋째, 보조변수로 활용하는 설명변수 개수 증가에 따른 대체 효과를 확인하였다. 복잡하고 포괄적인 모형보다는 무응답 대체 대상 변수와 연관성이 큰 설명변수를 탐색하고 선정하는 것이 무응답 대체 효과 향상에 효과적이라고 생각한다. 바람직한 대체 방법은 통계적 추론에서 발생할 수 있는 무응답 편의가 감소하고 모집단 분포로부터 표본 분포가 왜곡되지 않고 비슷하게 유지될 수 있어야 한다. 이 점을 인지한다면더욱 정확하고 신뢰성 있는 무응답 대체 자료를 제공할 수 있을 것이다.
ISSN
1226-3648
Files in This Item:

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

License License

Browse