e청소년_데이터분석
Tableau를 활용하여 분석을 진행한다. Tableau에 데이터를 연결하고 기초통계량을 확인한다.
1. 프로그램 수 분석
먼저 필드별 기초 통계량을 파악하고 분석한다.
가. 프로그램 갯수
수집한 데이터의 프로그램코드로 갯수를 파악한 결과 2993개 프로그램이다.
나. 지역: 17개
지리적 위치를 파악하기 위해 Addr(주소) 필드를 도와 시로 구분하고 계층구조를 만든다.
1) Addr(도) 필드 생성 필드생성
SPLIT([Addr], " ", 1)
2) 지리명 변경
Tableau 에서 강원특별자치도는 강원도로 인식한다. 따라서 지리명을 강원도로 변경한다.
나. Addr(시) 필드 생성
1) 필드생성
SPLIT([Addr], " ", 2)
수집한 데이터가 속한 도는 17개 지역이며 지역별 프로그램 분포 현황은 다음과 같다. 프로그램 수는 경기도, 서울특별시, 충남, 강원도 순으로 나타났다.
다. 연령대: 초, 중, 고, 대학, 전체, 일반
프로그램 진행을 위해 모집하는 연령대는 초등학생, 중학생, 고등학생, 대학생, 전체, 일반으로 나뉜다. 분석을 진행하기 위해 python을 통해 더미변수로 변환한 것을 피벗하여 하나의 컬럼으로 변환했다. 전체 프로그램을 연령대별로 모집 수를 산출하면 다음과 같다. 초등학생을 위한 프로그램이 가장 많고, 중학생, 고등학생 순으로 모집하는 프로그램이 많은것을 알 수 있다. 초, 중, 고 프로그램이 96%를 차지하는 것을 확인할 수 있다.
라. 활동방법 및 활동영역
활동방법과 활동영역별로 프로그램 갯수를 알아본 결과는 다음과 같다.
1) 활동방법
활동방법에는 대면, 비대면, 혼합이 있다. 96%이상이 대면활동으로 편성되어 있다.
2) 활동영역
활동영역에는 자기개발, 모험개척, 진로탐구, 문화예술, 건강/스포츠 등이 있다. 자기개발영역이 전체 프로그램의 30%정도를 차지하고 있고, 모험개척, 진로탐구, 문화예술 영역이 약 30% 나머지가 30%정도를 차지하는 것을 확인할 수 있다.
3) 활동방법 & 활동영역
활동방법과 활동영역을 혼합하여 살펴본 결과는 다음과 같다. 거의 대부분의 활동영역은 대면활동으로 개설된다.
바. 숙박여부
숙박 여부는 당일형, 1박2일, 2박3일로 이루어진 프로그램이 가장 많았다. 그중 당일형이 약 60%로 전체 프로그램의 2/3가량을 차지했다. 특이한 사항은 박 10일 프로그램의 경우 빈도가 2로 나타났다.
라. 기간별 프로그램 갯수 변화추이
2016년 11월 부터 2023년7월 까지 인증월을 기준으로 프로그램 등록갯수의 변화 추이를 확인하였다. 2016년 11월부터 2022년 5월 까지는 인증프로그램 수가 평균(37개) 이하로 나타나는 경우가 대부분 이었다. 반면 2022년 6월부터는 인증프로그램의 수가 계속 급격하게 증가하는 추이를 보인다.
2. 참가비 분석
지역, 활동영역, 인증기간을 기준으로 참가비의 전반적인 현황을 파악한다.
가. 지역별 평균 참가비 분석
지역별 평균 참가비를 분석하였다. 충청북도의 평균 참가비가 72,300원으로 가장 높고, 강원도가 64,000원, 충청남도가 53,000원으로 높게 나타났다.
나. 활동영역별 평균 참가비
활동영역별 참가비는 모험개척이 79,000원으로 가장 높은 참가비를 보였다. 이후 자기개발 56,000원 과학정보 55,000원 순으로 나타났다.
다. 인증기간별 평균 참가비 변화 추이
기간별 평균 참가비를 살펴보면 2021년 3월까지는 참가비가 평균 42,000원을 넘는 것을 확인할 수 있다. 반면 2021년 4월 부터 2023년 2월 까지는 평균 참가비보다 낮은 활동들이 었음을 알 수 있다. 또한 추이를 보면 2018년부터 2022년 7월까지는 점점 참가비가 떨어지다가 23년을 기점으로 다시 참가비가 올라가고 있음을 확인할 수 있다.
더 자세한 분석 사항은 대시보드를 제작하여 분석하였다.
청소년수련활동인증제현황 (1)
청소년수련활동인증제현황 (1)
public.tableau.com