본문 바로가기
Certification/ADP필기

3과목 - 데이터 분석 기획

by mansoorrr 2023. 9. 25.

1. 분석 주제 유형

분석대상(What) 분석주제유형
Known Un-Known
Optimization(최적화) Insight(통찰) Known 분석방법(How)
Solution(솔루션) Discovery(발견) Un-Known

2. 분석시 고려할 요소

  • 가용 데이터에 대한 고려
  • 데이터 확보
  • 적절한 활용방안과 유즈케이스
  • 장애요소들에 대한 사전계획 수립

3. 분석과제 발굴을 위한 접근 방법

가. 상향식 접근법

  • 비지도 학습방법에 의해 수행된다
  • 인과관계로부터 상관관계 분석으로의 이동이라는 변화를 만들었다
  • 사물을 있는 그대로 인식하는 What의 관점에서 접근
  • 데이터먼저 보고 문제정의
  • 데이터를 활용하여 인사이트를 도출하는 것으로 유용성이 점차 증가되고 있음

나. 하향식 접근법

  • 기업의 내/외부 환경을 포괄하는 비지니스 모델과 외부 사례를 기반으로 문제 탐색
  • 식별된 비지니스 문제를 데이터의 문제로 변환하여 정의
  • 도출된 문제나 가설에 대한 대안을 과제화 하기 위해 타당성 평가
  • 분석적으로 사물을 인식하려는 Why관점에서 접근
  • 분석해야할 대상이 명확할때 사용
  • 순서
    • 문제탐색: 비지니스 모델 기반 문제탐색, 외부사례 기반 문제탐색, 분석 유즈케이스
      • 비지니스 모델 캔버스 9개 요소
        • 비용, 가치제안, 수익, 핵심자원, 고객관계, 채널, 고객세그먼트, 핵심활동, 핵심파트너십
      • 분석과제 발굴영역
        • 규제와 감사, 업무, 제품, 고객, 지원인프라 
    • 문제정의: 비지니스 문제를 데이터 문제로 변환
    • 해결방안 탐색: 수행 옵션 도출
    • 타당성 검토: 타당성평가, 과제선정

다. 디자인 사고(Design Thinking)

4. 분석과제 발굴 범위

  • 시장 니즈관점에서 고객 니즈의 변화는 고객, 채널, 영향자들에 의해 진행

5. STEEP

  • 사회영역(Social): 전체 시장을 대상으로 사회적, 문화적, 구조적 트랜드 변화에 기반한 분석 기회 도출
  • 기술영역(Technological): 최신 기술 등장 및 변화에 따른 분석기회 도출
  • 경제영역(Economic): 산업과 금융 전반의 변동에 따른 시장의 흐름 파악하여 분석 기회 도출
  • 환경영역(Environment): 환경과 관련된 규제 동향 파악하여 분석 기회 도출
  • 정치영역(Political):  주요 정책 방향, 정세, 지정학적 동향 등의 거시적인 흐름을 토대로 분석 기회 도출

6. 분석 프로젝트 영역별 주요 관리 항목

  • 범위
  • 시간
  • 원가
  • 품질
  • 통합
  • 조달
  • 자원
  • 리스트
  • 의사소통
  • 이해관계자

7. 분석과제 관리 프로세스

  • 과제 발굴 단계: 분석아이디어 발굴, 분석과제 후보 제안, 분석과제 확정 프로세스
  • 분석과제 중에 발생된 시사점과 분석결과물을 pool로 관리하고 공유
  • 확정된 분석과제는 pool로 관리하지 않음
  • 과제 수행 단계: 팀 구성, 분석과제 식별, 분석과제 진행 관리, 결과 공유 프로세스

8. 데이터 분석 조직의 유형

  • 기능구조: 별도 분석조직 없고 해당 업무 부서에서 분석 수행. 핵심분석 어렵고 과거 실적에 국한된 분석만 가능
  • 집중구조: 별도 분석조직을 둠
  • 분산구조: 별도 분석조직의 인력을 해당 업무부서로 파견

10. 분석과제 우선순위 평가기준

가. IT프로젝트의 과제 우선순위 평가 기준

  • 전략적 중요도, 비지니스 성과, ROI, 실행 용이성
  • 적용범위/방식 고려요소
    • 업무 내재화 적용 수준
    • 분석 데이터 적용 수준
    • 기술 적용수준

나. 데이터 분석 프로젝트의 과제 우선순위 평가 기준

  • 빅데이터의 특징을 고려한 ROI요소
    • 투자비용요소(3v): volume(데이터크기), variety(데이터형태), velocity(데이터속도)
    • 비지니스효과(4v): 투자비용요소 + value(가치)

다. 분석 ROI요소를 고려한 과제 우선순위 평가 기준

여려움
|
|
|
|
|
|
난이도
|
|
|
|
|
쉬움
1 2
3 4
  현재 <-------- 시급성 ----------> 미래
  • 시급성(비지니스효과)
    • 전략적 중요도
    • 목표가치(KPI)
    • 시급성을 기준으로 적용우선 순위를 정하면 3 > 4 > 2 > 1
  • 난이도(투자비용요소)
    • 데이터 획득 비용
    • 데이터 가공 비용
    • 데이터 저장 비용
    • 분석적용 비용
    • 분석 수준
    • 난이도를 기준으로 적용 우선수위를 정하면 3 > 1 > 2 > 4

 

11. KDD 분석절차

  • 데이터셋(selection)
  • 데이터 전처리: 분성용 데이터 셋을 편성
  • 데이터 변환: 데이터 마이닝이 효율적으로 적용될 수 있도록 하는 과정(변수선택, 데이터 차원 축소 등)
  • 데이터 마이닝

12. CRISP-DM

  • 유럽연합의 ESPRIT에서 있었던 프로젝트에서 시작
  • SPSS, NCR, Daimler Chrysler등이 참여
  • 모델링 과정에서 데이터셋이 추가로 필요한 경우 데이터 준비 단계를 반복적으로 수행
  • 계층적 프로세스 모델로 4레벨로 구성되어 있음
  • 폭포수 모델처럼 단방향으로 구성되어 있지 않고, 단계간 피드백을 통해 단계별 완성도를 높임

13. 비지니스 모델 캔버스

  • 채널
    • 고객에게 가치를 전달하기 위해 커뮤니케이션을 하고 상품이나 서비스를 전달하는 방법
    • 고객에세 밸류 프로포지션 전달
    • 고객에게 접근하는 유통 채널 공급
    • 기업이 제공하는 상품이나 서비스에 대한 고객의 이해 높여줌
  • 과제 발굴 영역
    • 업무: 제품 및 서비스를 생산하기 위해서 운영하는 내부프로세스 및 주요 자원 관련 도출
    • 제품: 생산 및 제공하는 제품, 서비스를 개선하기 위한 주제 도출
    • 고객: 제품이나 서비스를 제공받는 고객과, 이를 제공하는 채널의 관점에서 관련 주제 도출
    • 규제와 감사: 제품 생산 및 전달과정 프로세스 중에서 발생하는 규제 및 보안의 관점에서 주제 도출

14. 분석과제 주요 관리 영역

  • Datasize
  • Data Complexity
  • Speed
  • Analytic & Complexity,
  • Accuracy & Precision

15. 마스터 플랜

  • 수립시점
    • 분석 우선 순위 결정 관점
      • 전략적 중요도
      • 비지니스 성과 및 ROI
        • 시급성: 전략적중요도가 핵심
        • 난이도: 현시점에서 과제를 추진하는 것이 비용과 범위 측면을 고려했을 때 바로 적용하기 쉬운 것인지 어려운 것인지를 판단하는 것(분석준비도와 성숙도 진단 결과에 따라 결정됨)
        • 분석과제의 적용 우선순위를 시급성에 둔다면 3 -> 4 -> 2 -> 1
        • 분석과제의 적용 우선순위를 난이도에 둔다면 3 -> 1 -> 2 -> 4
(높음)
난이도
(낮음)
1
시급 높고 난이도 높음
경영진 또는 실무 담당자의 의사결정에 따라 적용 우선순위 조정
2
시급낮고 난이도 어려움
3
시급높고 난이도 낮음
우선적으로 적용 필요
4
시급낮고 난이도 낮음
중장기적 관점에서 추진 바람직
  (현재:높음)----시급성----(미래: 낮음)

    • 실행용이성
    • 거버넌스 체계 구성요소
      • Prcess(과제기획/운영프로세스)
      • System(시스템/프로그램)
      • Organization(분석기획/관리 및 추진조직)
      • Data(데이터 거버넌스)
      • HumanResource(분석관련 교육/ 마인드 육성체계)

16. 포트폴리오 사분면

  • 확산형 기업: 기업에 필요한 6가지 분석 구성요소를 갖추고, 분석이 현재 부분적으로 도입되어 지속적인 확산이 필요한 기업
  • 준비형 기업
  • 도입형 기업
  • 정착형 기업: 분석이 확산되어 정착된 기업

17. 분석 프로젝트 관리

  • 분석 프로젝트 관리는 프로젝트 관리 지침 KSA ISO 21500:2013을 가이드로 활용 가능
  • 데이터 분석 모델의 품질을 평가하기 위해 SPICE를 활용
  • 분석 프로젝트의 최종 결과물이 분석 보고서 형태인지 시스템 인지에 따라 관리에 차이 있음
  • 일정 계획 수립 시 철저한 통제보다 분석범위가 빈번하게 변경 되므로 시간이 소요될 수 있다. 따라서 Time Boxing 기법과 같은 방법으로 일정 관리를 하는 것이 필요

18. 의사 결정을 방해하는 요소들

  • 프레이밍 효과
  • 고정관념
  • 편향된 생각

19. 빅데이터 분석 방법론

  • 3계층으로 구성된 계층적 프로세스 모델
  • 각 단계는 여러개의 태스크로 구성
  • 분석 단계에서 데이터 준비와 데이터 분석단계 간에는 피드백에 반복적으로 많이 발생
  • 단계
    • 분석기획
    • 데이터준비 
    • 데이터분석
      • 분석용 데이터 준비
      • 텍스트분석
      • 탐색적 분석
        • 데이터의 기초 통계량(평균, 표준편차, 최대값, 최소값) 등 산출
      • 모델링
        • 비정형 데이터 분석 결과를 통합적으로 활용하여 프로젝트 목적에 맞는 모델링 수행
        • 데이터셋을 학습, 테스트데이터로 분할
        • 훈련용 데이터를 활용하여 분류, 예측, 군집 등 모델을 만들고 이를 평가 및 검증
        • 모델 적용 및 운영방안 작성
    • 시스템구현
    • 평가 및 전개
    • Step: 입력자료, 처리 및 도구, 출력자로 구성된 단위 프로세스

20. 빅데이터 분석환경

  • 프로토타이핑
    • 문제에 대한 인식수준
    • 필요 데이터 존재 여부의 불확실성
    • 데이터 사용 목적의 가변성에 따라 존재

21. 분석프로젝트의 특성

  • 분석가
    • 데이터 영역: 데이터 원천
    • 비지니스 영역: 결과를 활용
    • 데이터 영역과 비지니스 영역의 중간에서 분석 모델을 통한 조율을 수행하는 조정자
    • 해당 프로젝트의 관리까지 겸임하게 되는 경우가 대부분

22. 분석 조직을 갖추기 위해 필요한 인력

  • 필수
    • 비지니스 인력
    • IT기술 인력
    • 분석 전문 인력
  • 선택
    • 변화관리 인력(겸직가능)
    • 교육담당 인력(겸직가능)

23. 분석과제 수행방식

  • 단일 분석과제냐 지속적인 분석을 내재화 시킬것이냐에 따라 접근방식과 시점별 구분이 필요
  • 조직 내 분석 문화를 내재화 시키기 위해 전사적이고 중장기적인 관점에서 과제를 도출해야 함
  • 과제중심적 접근 방식
    • Speed & Test
    • Quick & Win
      • 문제에 대한 명확한 해결을 위해 해당 방식 사용하여 분석 진행
    • Problem Solving

24. 분석기회 발굴을 위한 범위 확장

  • 경쟁사 확대 관점
    • 대체재 영역: 우리걸 대체할 수 있는게 뭐가 있나
    • 경쟁자 영역: 경쟁자는 누가있나
    • 신규진입자 영역: 이 시장에 신규로 들어온애가 누가 있나

25. 빅데이터 특징 (V)

  • 3v
    • Volume: 데이터의 양
    • Variety: 데이터의 다양성
    • Velocity: 데이터의 입출력 속도  
  • 5v
    • Value: 비지니스나 연구에서의 가치(분석 ROI에서의 비지니스 효과)
    • Veracity: 데이터의 진실성(분석할만한 가치가 있느냐)
  • 7v
    • Volatility: 데이터의 휘발성(얼마나 오래 저장될 수 있냐)
    • Validity: 데이터의 정확성(노이즈 등)

 

 

'Certification > ADP필기' 카테고리의 다른 글

4과목 - 데이터분석  (0) 2023.09.26
5과목 - 데이터 시각화  (0) 2023.09.26
2과목 - 데이터 처리 기술의 이해  (0) 2023.09.25
1과목- 데이터 이해  (0) 2023.09.25