본문 바로가기

Data Analysis39

공공데이터 api 활용 데이터 수집 전국의 청소년수련활동 인증제를 분석하기 위해 데이터를 수집하였다. 데이터는 공공데이터 포털에서 제공하는 api를 활용하여 수집하였다. 여성가족부_청소년활동 인증프로그램 정보 서비스 청소년 활동 인증프로그램 정보 서비스 정보를 제공합니다. 청소년 활동 관련 인증 프로그램 정보 현황을 조회할 수 있습니다. www.data.go.kr 공공데이터 포털에서는 여성가족부에서 제공하는 인증프로그램 정보 서비스가 있다. 상세 기능은 청소년활동 인증프로그램 목록, 인증프로그램 상세정보, 인증프로그램 활동일자별 데이터가 있었다. 파일은 xml파일로 제공되며 인증키를 받아 진행했다. 데이터별 필드는 다음과 같이 구성되어 있었고 데이터 베이스에 저장하였다. 1. 인증프로그램 목록(2972개) - 인증번호, 기관명, 프로그램명.. 2023. 8. 1.
청소년수련활동인증제란 1. 청소년수련활동인증제란? 청소년수련활동인증제는 청소년이 안전하고 유익한 청소년활동에 참여할 수 있도록 국가에서 일정기준에 따라 심사하여 프로그램을 인증하는 것을 의미한다. 2. 청소년수련활동인증제의 목적 가. 국가가 청소년수련활동의 공공성과 신뢰성을 인증하여 청소년활동 정책의 실효성 제고 나. 양질의 청소년활동 정책과 참여 기회 제공 다. 청소년활동 정보 제공 및 청소년 활동 참여 활성화 라. 자기 계발 및 진로 모색 등 활용 가능한 활동 기록 관리 3. 청소년수련활동인증제의 특징 가. 맞춤형 참여: 청소년의 눈높이에 맞는 다양하고 재미있는 인증수련활동에 참여 가능 나. 안전과 전문성: 안전한 활동환경을 갖추고 전문성을 지닌 지도자와 함께 함 다. 체게적 관리: 인증신청, 수시점검, 사후관리 등 인증.. 2023. 8. 1.
fcmm댓글분석2 명사만 추출한 결과를 워드클라우드로 나타냈다. word_dict = Counter(words_list) tags = word_dict.most_common() print(dict(tags)) wc = WordCloud(font_path='C:/Windows/Fonts/HMFMMUEX.TTC', background_color='white', width=800, height=600) cloud = wc.generate_from_frequencies(dict(tags)) plt.figure(figsize=(10, 8)) plt.axis('off') plt.imshow(cloud) plt.show() 트리맵으로 나타내면 다음과 같은 모양이다. 다른 정제 없이 추출한 명사를 기반으로 단어 빈도분석을 진행했다. 사.. 2023. 7. 27.
fcmm 댓글 분석 1. 전처리 댓글분석을 통해 왜 특정 분류들이 구매 건수가 높은지 알아보고자 한다. MySQL을 통해서 간단하게 리뷰가 어떻게 구조화 되어어 있는지 살펴보았다. 댓글 작성자는 fcmm과 일반 작성자 두분류료 나뉘었다. fcmm에서 작성한 댓글에는 꼭 들어가 있는 단어가 '서포터즈'와 '포토후기' 였다. 일반 작성자는 그냥 자주 보는 댓글이었다. 현재 내가 수집한 review데이터는 아래와 같은 구조를 띄고 있다. content컬럼에는 일단 댓글을 다 넣어논 것이고, writer_option 컬럼에는 키, 몸무게, 구매 사이즈 등의 정보가 담겨있다. 그런데, content컬럼에 writer_option에 들어가야할 내용들도 포함되어있는 것들이 있다. 그게 바로 writer가 fcmm인 댓글들이었다. 이를 .. 2023. 7. 20.