Publications

보건복지 분야 데이터 경제 활성화를 위한 다출처 데이터 연계, 통합, 활용 방안 연구 = A Study on How to Link, Integrate, Utilize Multi-Source Data to Vitalize the Data Economy in the Health and Welfare

Full metadata record

DC Field Value
dc.contributor.author이혜정
dc.contributor.author이기호
dc.contributor.author안수인
dc.contributor.author임종호
dc.contributor.author이상혁
dc.contributor.author조용찬
dc.coverage.temporal2022-01-01 - 2022-12-31
dc.date.accessioned2023-03-13T06:26:10Z
dc.date.available2023-03-13T06:26:10Z
dc.date.issued2022
dc.identifier.isbn9788968278778
dc.identifier.urihttps://repository.kihasa.re.kr/handle/201002/42202
dc.description.abstract데이터 개방 추세에 따라 데이터가 다량으로 개방되고 있지만 개별적으로 분산된 채 제공되고 있어, 여러 개의 데이터를 서로 연계하고 통합한 데이터로 활용하는 것은 저조하다는 평가가 이어지고 있다. 그래서 이 연구의 목적은 곳곳에 분산된 데이터의 활용 가치를 높이기 위해서 다출처 데이터를 연계·통합하는 시도를 해 보고, 이에 따른 어려움을 해결하여 활성화될 수 있도록 하는 방안도 마련하고자 한다. 이 연구는 3년 중기 과제로, 올해 첫 번째 연구이다. 2022년 연구에서는 데이터 연계·통합의 개념과 데이터 통합 방법론에 대해 정리하였고, 데이터 통합과 관련한 국내외의 다양한 사례를 소개하였다. 또한, 활용 가능한 데이터 현황 파악을 위해, 우리 연구원에서 제공 중인 조사데이터와 국내 개방된 데이터 포털 및 플랫폼을 중심으로 살펴보았다. 마지막으로는 실제 데이터를 활용하여 모의실험과 데이터 통합 및 분석을 실시하였다. 모의실험은 한국의료패널조사 데이터를 사용하였다. 매칭 방법은 다양한 거리 함수를 사용하여 최근접 이웃 핫덱과 랜덤 핫덱 방법을 비교하였다. 다음으로 실제 데이터 통합을 위해 기준데이터는 한국의료패널조사로, 제공데이터는 생활시간조사로 선정하여 통계적 매칭 방법을 이용하여 데이터를 통합하였고, 그 결과물인 통합데이터에 대한 품질을 평가하였다. 한편, 통계적 매칭 방법을 활용하여 조사데이터와 조사데이터를 통합할 때 고려해야 할 사항도 제시하였다.
dc.description.abstractIn line with the data open trend, a large amount of data is being opened. However, they are individually distributed and provided so that use of the multiple data is not well linked and integrated among themselves. The purpose of this study is to examine the linkage and integration of multi-source data dispersed in various places in order to increase the utilization value, and to prepare a plan to solve the difficulties and to activate them. Main results of this study are as follows: Data integration and analysis were conducted by using real data. The Korea Health Panel Survey data and Life Time Use Survey data were integrated by using the nearest neighborhood hot deck method based on the exact distance function. The purpose of integrating the two data was to identify the possibility of creating integrated data on multi-source surveys, and to analyze the relationship between health behavior and life time use. Results of the integrated data analysis revealed a statistically significant difference in behavior of life time usage(essential time, duty time, free time, exercise time) by gender and age group. According to subjective health status, there were statistically significant differences in life time use: men and women in their 60s and older for essential time, duty time, free time, men in their 40s and 50s for duty time, free time and exercise time, and women in their 40s and 50s for duty time. The middle-aged usually have health problems such as onset of chronic diseases. This was appeared due to decreased time on work, housework, and other activities for treatment of diseases, or due to restricted activities caused by diseases. Such a group was perceiving to have poor subjective health status due to health problems. On the other hand, it was found that the group with poor subjective health status spent more exercise time for health care. As such, the results were similar to the previous studies on the relationship between subjective health status and life time use. Accordingly, data integration based on statistical matching methods can be regarded as having high data utilization. If more diverse data can be integrated in the future, various information could be used that was insufficient to be considered in the health field, so that various factors can be identified for countermeasures for the people’s health.
dc.description.tableOfContentsAbstract 1 요 약 3 제1장 서 론 11 제1절 연구의 배경 및 목적 13 제2절 연구의 내용 및 방법 18 제2장 데이터 연계·통합 개념 및 통계적 방법론 23 제1절 데이터 연계·통합 개념 25 제2절 자료연계 방법론 30 제3절 통계적 매칭 방법론 47 제3장 국내외 데이터 통합 사례 연구 65 제1절 국내외 데이터 통합 현황 67 제2절 국내외 통합데이터 활용 사례 77 제3절 소결 86 제4장 활용 가능한 데이터 현황 89 제1절 우리 연구원에서 제공 중인 조사데이터 91 제2절 국내 데이터 포털 및 플랫폼 현황 131 제3절 소결 141 제5장 데이터 통합 실증 분석 143 제1절 통계적 매칭 방법에 대한 데이터 통합 모의실험 145 제2절 통계적 매칭을 활용한 데이터 통합 157 제3절 소결 191 제6장 결론 199 제1절 연구 결과 요약 및 함의 201 제2절 향후 연구 방향 209 참고문헌 213 부 록 229 부록 1. 블록화 229 부록 2. 우리 연구원 및 보건복지부 국가승인통계 현황 231 부록 3. 조사데이터별 주요 조사 내용 236 부록 4. 민간데이터 기초분석 247 부록 5. 전문가 대상 통합데이터를 활용한 연구 주제 관련 설문조사 결과 258
dc.formattext/plain
dc.formattext/html; charset=utf-8
dc.formatapplication/rdf+xml; charset=utf-8
dc.format.extent282
dc.languagekor
dc.publisher한국보건사회연구원
dc.publisherKorea Institute for Health and Social Affairs
dc.rightsKOGL BY-NC-ND
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/2.0/kr/
dc.rights.urihttps://www.kogl.or.kr/info/licenseType4.do
dc.title보건복지 분야 데이터 경제 활성화를 위한 다출처 데이터 연계, 통합, 활용 방안 연구
dc.title.alternativeA Study on How to Link, Integrate, Utilize Multi-Source Data to Vitalize the Data Economy in the Health and Welfare
dc.typeBook
dc.type.localReport
dc.subject.keyword데이터 통합
dc.subject.keyword통합데이터
dc.subject.keyword자료연계
dc.subject.keyword통계적 매칭
dc.subject.keyworddata integration
dc.subject.keywordintegrated dataset
dc.subject.keywordrecord linkage
dc.subject.keywordstatistical matching
dc.contributor.alternativeNameLee, Hyejung
dc.contributor.alternativeNameLee, Ki-ho
dc.contributor.alternativeNameAn, Suin
dc.contributor.alternativeNameIm, Jongho
dc.contributor.alternativeNameLee, Sanghyeok
dc.contributor.alternativeNameCho, Yongchan
dc.type.other연구보고서
dc.identifier.doi10.23060/kihasa.a.2022.13
dc.identifier.localId연구보고서 2022-13
dc.identifier.localIdResearch Monographs 2022-13
dc.citation.date2022
dc.date.dateaccepted2023-03-13T06:26:10Z
dc.date.datesubmitted2023-03-13T06:26:10Z
dc.type.research정책연구
dc.type.nkis일반연구보고서
dc.subject.nkisMainJ
dc.subject.nkisMiddleJ1
dc.description.sponsorshipAwardNumberP202200067_1_1
dc.type.project일반사업
dc.description.sponsorshipAwardTitle[일반22-013-00]보건복지 분야 데이터 경제 활성화를 위한 다출처 데이터 연계, 통합, 활용 방안 연구
dc.subject.kihasa복지국가
KIHASA 주제 분류
사회보장 일반 > 복지국가
메타데이터 간략히 보기

다운로드 파일

링크

공유

qrcode
공유하기
Cited 0 time in

아이템 조회 수, 다운로드 수

Loading...

라이선스

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.