Data Analysis/FCMM9 fcmm댓글분석2 명사만 추출한 결과를 워드클라우드로 나타냈다. word_dict = Counter(words_list) tags = word_dict.most_common() print(dict(tags)) wc = WordCloud(font_path='C:/Windows/Fonts/HMFMMUEX.TTC', background_color='white', width=800, height=600) cloud = wc.generate_from_frequencies(dict(tags)) plt.figure(figsize=(10, 8)) plt.axis('off') plt.imshow(cloud) plt.show() 트리맵으로 나타내면 다음과 같은 모양이다. 다른 정제 없이 추출한 명사를 기반으로 단어 빈도분석을 진행했다. 사.. 2023. 7. 27. fcmm 댓글 분석 1. 전처리 댓글분석을 통해 왜 특정 분류들이 구매 건수가 높은지 알아보고자 한다. MySQL을 통해서 간단하게 리뷰가 어떻게 구조화 되어어 있는지 살펴보았다. 댓글 작성자는 fcmm과 일반 작성자 두분류료 나뉘었다. fcmm에서 작성한 댓글에는 꼭 들어가 있는 단어가 '서포터즈'와 '포토후기' 였다. 일반 작성자는 그냥 자주 보는 댓글이었다. 현재 내가 수집한 review데이터는 아래와 같은 구조를 띄고 있다. content컬럼에는 일단 댓글을 다 넣어논 것이고, writer_option 컬럼에는 키, 몸무게, 구매 사이즈 등의 정보가 담겨있다. 그런데, content컬럼에 writer_option에 들어가야할 내용들도 포함되어있는 것들이 있다. 그게 바로 writer가 fcmm인 댓글들이었다. 이를 .. 2023. 7. 20. fcmm 데이터시각화2 1. 상관관계 구매건수와 제품평점, 가격, 할인가격, 할인율간의 상관관계를 확인한다. 열선반과 행선반에 상관관계를 확인할 변수들을 올려놓고 제품코드를 세부수준으로 두고 시각화 하였다. 상관관계를 살펴본 결과 구매건수와 다른 지표들간에 상관관계가 도드라지게 나타나지 않는다. 본 분석을 통해 알게된점 거의 모든 제품이 5점의 평점을 가지고 있다. 구매건수와 다른 지표들간에 상관관계가 도드라지게 나타나지 않았다. 다른 지표들간에도 그렇다할 상관관계는 나타나지 않는다. 2. 플리스, 롱팬츠, 숏팬츠, 숏슬리브, 풋볼상의, 풋볼하의가 왜 구매율이 높을까? 다른제품들과 어떤 차이가 있을까?(댓글분석) fcmm 댓글 분석 hiphan-mansoorrr.tistory.com 2023. 7. 20. fcmm 데이터 분석(중분류 NULL은 왜?) 분석을 진행하면서 찾아봐야하는 점이 있었고, 이는 sql로 빠르게 찾아볼 수 있었다. 1. 중분류 null은 왜 생겼을까? 태블로 분석시 중분류에 속하는 null은 총 252개가 있었다. 중분류가 null인 경우는 대분류가 신상품, 베스트, 프로모션인 경우이다. SELECT A.CATEGORY, COUNT(A.CATEGORY) FROM CATEGORY_UNIQUE A INNER JOIN PRODUCT2 B ON A.CATEGORY_CODE = B.CATEGORY_CODE WHERE SEGMENT = '' GROUP BY A.CATEGORY; CATEGORY COUNT(CATEGORY) 베스트 46 신상품 198 프로모션 8 그래서 중분류가 null인 제품들을 추렸다. SELECT PRODUCT_CODE .. 2023. 7. 19. 이전 1 2 3 다음