Publications

패널 데이터 품질 개선을 위한 항목무응답 대체 방법 = Imputation of Item Nonreponse for Quality Improvement in Panel Data

제목
패널 데이터 품질 개선을 위한 항목무응답 대체 방법 = Imputation of Item Nonreponse for Quality Improvement in Panel Data
저자

이혜정

발행연도
2020-08-01
발행기관
한국보건사회연구원
인용정보
보건복지포럼 2020년 8월 통권 제286호, pp.43-60
초록
수집한 패널 데이터의 사후적인 품질 관리 방법으로는 데이터 정제를 통한 정합성 관리, 패널이탈에 대한 지속적인 검토를 통한 표본 대표성 확보, 가중치 작성, 항목무응답에 대한 처리 등이 있다. 이 글에서는 한국 복지패널조사 및 한국의료패널조사에서의 항목무응답 대체 방법을 소개하고 최신 통계 방법인 기계학습 통계기법을 기반으로 한 항목무응답 대체 방법의 효과를 파악하여 적절한 대체 방법을 제안하고자 한다.
이에 대한 종합적인 결과와 활용 방안은 세 가지로 요약할 수 있다. 첫째, 패널 자료에서의 항목무응답 대체 시 기계학습 통계기법을 적용할 수 있는 가능성을 확인하였다. 특히 랜덤 포레스트 대체 방법은 편향뿐만 아니라 다른 평가지표도 우수한 결과를 보여 실무에서 활용해 볼 수 있다고 생각한다. 둘째, 대체군 활용 여부에 따라 대체 효과가 확연히 달라지는 결과를 통해 무응답 대체 시 대체군 활용의 중요성을 다시 한번 확인하였다. 셋째, 보조변수로 활용하는 설명변수 개수 증가에 따른 대체 효과를 확인하였다. 복잡하고 포괄적인 모형보다는 무응답 대체 대상 변수와 연관성이 큰 설명변수를 탐색하고 선정하는 것이 무응답 대체 효과 향상에 효과적이라고 생각한다. 바람직한 대체 방법은 통계적 추론에서 발생할 수 있는 무응답 편의가 감소하고 모집단 분포로부터 표본 분포가 왜곡되지 않고 비슷하게 유지될 수 있어야 한다. 이 점을 인지한다면더욱 정확하고 신뢰성 있는 무응답 대체 자료를 제공할 수 있을 것이다.
URI
http://dx.doi.org/10.23062/2020.08.5
ISSN
1226-3648
DOI
10.23062/2020.08.5
메타데이터 전체 보기

다운로드 파일

링크

공유

qrcode
공유하기
Cited 0 time in

아이템 조회 수, 다운로드 수

Loading...

라이선스

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.