1. 분석 주제 유형
분석대상(What) | 분석주제유형 | ||
Known | Un-Known | ||
Optimization(최적화) | Insight(통찰) | Known | 분석방법(How) |
Solution(솔루션) | Discovery(발견) | Un-Known |
2. 분석시 고려할 요소
- 가용 데이터에 대한 고려
- 데이터 확보
- 적절한 활용방안과 유즈케이스
- 장애요소들에 대한 사전계획 수립
3. 분석과제 발굴을 위한 접근 방법
가. 상향식 접근법
- 비지도 학습방법에 의해 수행된다
- 인과관계로부터 상관관계 분석으로의 이동이라는 변화를 만들었다
- 사물을 있는 그대로 인식하는 What의 관점에서 접근
- 데이터먼저 보고 문제정의
- 데이터를 활용하여 인사이트를 도출하는 것으로 유용성이 점차 증가되고 있음
나. 하향식 접근법
- 기업의 내/외부 환경을 포괄하는 비지니스 모델과 외부 사례를 기반으로 문제 탐색
- 식별된 비지니스 문제를 데이터의 문제로 변환하여 정의
- 도출된 문제나 가설에 대한 대안을 과제화 하기 위해 타당성 평가
- 분석적으로 사물을 인식하려는 Why관점에서 접근
- 분석해야할 대상이 명확할때 사용
- 순서
- 문제탐색: 비지니스 모델 기반 문제탐색, 외부사례 기반 문제탐색, 분석 유즈케이스
- 비지니스 모델 캔버스 9개 요소
- 비용, 가치제안, 수익, 핵심자원, 고객관계, 채널, 고객세그먼트, 핵심활동, 핵심파트너십
- 분석과제 발굴영역
- 규제와 감사, 업무, 제품, 고객, 지원인프라
- 비지니스 모델 캔버스 9개 요소
- 문제정의: 비지니스 문제를 데이터 문제로 변환
- 해결방안 탐색: 수행 옵션 도출
- 타당성 검토: 타당성평가, 과제선정
- 문제탐색: 비지니스 모델 기반 문제탐색, 외부사례 기반 문제탐색, 분석 유즈케이스
다. 디자인 사고(Design Thinking)
4. 분석과제 발굴 범위
- 시장 니즈관점에서 고객 니즈의 변화는 고객, 채널, 영향자들에 의해 진행
5. STEEP
- 사회영역(Social): 전체 시장을 대상으로 사회적, 문화적, 구조적 트랜드 변화에 기반한 분석 기회 도출
- 기술영역(Technological): 최신 기술 등장 및 변화에 따른 분석기회 도출
- 경제영역(Economic): 산업과 금융 전반의 변동에 따른 시장의 흐름 파악하여 분석 기회 도출
- 환경영역(Environment): 환경과 관련된 규제 동향 파악하여 분석 기회 도출
- 정치영역(Political): 주요 정책 방향, 정세, 지정학적 동향 등의 거시적인 흐름을 토대로 분석 기회 도출
6. 분석 프로젝트 영역별 주요 관리 항목
- 범위
- 시간
- 원가
- 품질
- 통합
- 조달
- 자원
- 리스트
- 의사소통
- 이해관계자
7. 분석과제 관리 프로세스
- 과제 발굴 단계: 분석아이디어 발굴, 분석과제 후보 제안, 분석과제 확정 프로세스
- 분석과제 중에 발생된 시사점과 분석결과물을 pool로 관리하고 공유
- 확정된 분석과제는 pool로 관리하지 않음
- 과제 수행 단계: 팀 구성, 분석과제 식별, 분석과제 진행 관리, 결과 공유 프로세스
8. 데이터 분석 조직의 유형
- 기능구조: 별도 분석조직 없고 해당 업무 부서에서 분석 수행. 핵심분석 어렵고 과거 실적에 국한된 분석만 가능
- 집중구조: 별도 분석조직을 둠
- 분산구조: 별도 분석조직의 인력을 해당 업무부서로 파견
10. 분석과제 우선순위 평가기준
가. IT프로젝트의 과제 우선순위 평가 기준
- 전략적 중요도, 비지니스 성과, ROI, 실행 용이성
- 적용범위/방식 고려요소
- 업무 내재화 적용 수준
- 분석 데이터 적용 수준
- 기술 적용수준
나. 데이터 분석 프로젝트의 과제 우선순위 평가 기준
- 빅데이터의 특징을 고려한 ROI요소
- 투자비용요소(3v): volume(데이터크기), variety(데이터형태), velocity(데이터속도)
- 비지니스효과(4v): 투자비용요소 + value(가치)
다. 분석 ROI요소를 고려한 과제 우선순위 평가 기준
여려움 | | | | | | 난이도 | | | | | 쉬움 |
1 | 2 |
3 | 4 | |
현재 <-------- 시급성 ----------> 미래 |
- 시급성(비지니스효과)
- 전략적 중요도
- 목표가치(KPI)
- 시급성을 기준으로 적용우선 순위를 정하면 3 > 4 > 2 > 1
- 난이도(투자비용요소)
- 데이터 획득 비용
- 데이터 가공 비용
- 데이터 저장 비용
- 분석적용 비용
- 분석 수준
- 난이도를 기준으로 적용 우선수위를 정하면 3 > 1 > 2 > 4
11. KDD 분석절차
- 데이터셋(selection)
- 데이터 전처리: 분성용 데이터 셋을 편성
- 데이터 변환: 데이터 마이닝이 효율적으로 적용될 수 있도록 하는 과정(변수선택, 데이터 차원 축소 등)
- 데이터 마이닝
12. CRISP-DM
- 유럽연합의 ESPRIT에서 있었던 프로젝트에서 시작
- SPSS, NCR, Daimler Chrysler등이 참여
- 모델링 과정에서 데이터셋이 추가로 필요한 경우 데이터 준비 단계를 반복적으로 수행
- 계층적 프로세스 모델로 4레벨로 구성되어 있음
- 폭포수 모델처럼 단방향으로 구성되어 있지 않고, 단계간 피드백을 통해 단계별 완성도를 높임
13. 비지니스 모델 캔버스
- 채널
- 고객에게 가치를 전달하기 위해 커뮤니케이션을 하고 상품이나 서비스를 전달하는 방법
- 고객에세 밸류 프로포지션 전달
- 고객에게 접근하는 유통 채널 공급
- 기업이 제공하는 상품이나 서비스에 대한 고객의 이해 높여줌
- 과제 발굴 영역
- 업무: 제품 및 서비스를 생산하기 위해서 운영하는 내부프로세스 및 주요 자원 관련 도출
- 제품: 생산 및 제공하는 제품, 서비스를 개선하기 위한 주제 도출
- 고객: 제품이나 서비스를 제공받는 고객과, 이를 제공하는 채널의 관점에서 관련 주제 도출
- 규제와 감사: 제품 생산 및 전달과정 프로세스 중에서 발생하는 규제 및 보안의 관점에서 주제 도출
14. 분석과제 주요 관리 영역
- Datasize
- Data Complexity
- Speed
- Analytic & Complexity,
- Accuracy & Precision
15. 마스터 플랜
- 수립시점
- 분석 우선 순위 결정 관점
- 전략적 중요도
- 비지니스 성과 및 ROI
- 시급성: 전략적중요도가 핵심
- 난이도: 현시점에서 과제를 추진하는 것이 비용과 범위 측면을 고려했을 때 바로 적용하기 쉬운 것인지 어려운 것인지를 판단하는 것(분석준비도와 성숙도 진단 결과에 따라 결정됨)
- 분석과제의 적용 우선순위를 시급성에 둔다면 3 -> 4 -> 2 -> 1
- 분석과제의 적용 우선순위를 난이도에 둔다면 3 -> 1 -> 2 -> 4
- 분석 우선 순위 결정 관점
(높음) 난이도 (낮음) |
1 시급 높고 난이도 높음 경영진 또는 실무 담당자의 의사결정에 따라 적용 우선순위 조정 |
2 시급낮고 난이도 어려움 |
||
3 시급높고 난이도 낮음 우선적으로 적용 필요 |
4 시급낮고 난이도 낮음 중장기적 관점에서 추진 바람직 |
|||
(현재:높음)----시급성----(미래: 낮음) |
- 실행용이성
-
- 거버넌스 체계 구성요소
- Prcess(과제기획/운영프로세스)
- System(시스템/프로그램)
- Organization(분석기획/관리 및 추진조직)
- Data(데이터 거버넌스)
- HumanResource(분석관련 교육/ 마인드 육성체계)
- 거버넌스 체계 구성요소
16. 포트폴리오 사분면
- 확산형 기업: 기업에 필요한 6가지 분석 구성요소를 갖추고, 분석이 현재 부분적으로 도입되어 지속적인 확산이 필요한 기업
- 준비형 기업
- 도입형 기업
- 정착형 기업: 분석이 확산되어 정착된 기업
17. 분석 프로젝트 관리
- 분석 프로젝트 관리는 프로젝트 관리 지침 KSA ISO 21500:2013을 가이드로 활용 가능
- 데이터 분석 모델의 품질을 평가하기 위해 SPICE를 활용
- 분석 프로젝트의 최종 결과물이 분석 보고서 형태인지 시스템 인지에 따라 관리에 차이 있음
- 일정 계획 수립 시 철저한 통제보다 분석범위가 빈번하게 변경 되므로 시간이 소요될 수 있다. 따라서 Time Boxing 기법과 같은 방법으로 일정 관리를 하는 것이 필요
18. 의사 결정을 방해하는 요소들
- 프레이밍 효과
- 고정관념
- 편향된 생각
19. 빅데이터 분석 방법론
- 3계층으로 구성된 계층적 프로세스 모델
- 각 단계는 여러개의 태스크로 구성
- 분석 단계에서 데이터 준비와 데이터 분석단계 간에는 피드백에 반복적으로 많이 발생
- 단계
- 분석기획
- 데이터준비
- 데이터분석
- 분석용 데이터 준비
- 텍스트분석
- 탐색적 분석
- 데이터의 기초 통계량(평균, 표준편차, 최대값, 최소값) 등 산출
- 모델링
- 비정형 데이터 분석 결과를 통합적으로 활용하여 프로젝트 목적에 맞는 모델링 수행
- 데이터셋을 학습, 테스트데이터로 분할
- 훈련용 데이터를 활용하여 분류, 예측, 군집 등 모델을 만들고 이를 평가 및 검증
- 모델 적용 및 운영방안 작성
- 시스템구현
- 평가 및 전개
- Step: 입력자료, 처리 및 도구, 출력자로 구성된 단위 프로세스
20. 빅데이터 분석환경
- 프로토타이핑
- 문제에 대한 인식수준
- 필요 데이터 존재 여부의 불확실성
- 데이터 사용 목적의 가변성에 따라 존재
21. 분석프로젝트의 특성
- 분석가
- 데이터 영역: 데이터 원천
- 비지니스 영역: 결과를 활용
- 데이터 영역과 비지니스 영역의 중간에서 분석 모델을 통한 조율을 수행하는 조정자
- 해당 프로젝트의 관리까지 겸임하게 되는 경우가 대부분
22. 분석 조직을 갖추기 위해 필요한 인력
- 필수
- 비지니스 인력
- IT기술 인력
- 분석 전문 인력
- 선택
- 변화관리 인력(겸직가능)
- 교육담당 인력(겸직가능)
23. 분석과제 수행방식
- 단일 분석과제냐 지속적인 분석을 내재화 시킬것이냐에 따라 접근방식과 시점별 구분이 필요
- 조직 내 분석 문화를 내재화 시키기 위해 전사적이고 중장기적인 관점에서 과제를 도출해야 함
- 과제중심적 접근 방식
- Speed & Test
- Quick & Win
- 문제에 대한 명확한 해결을 위해 해당 방식 사용하여 분석 진행
- Problem Solving
24. 분석기회 발굴을 위한 범위 확장
- 경쟁사 확대 관점
- 대체재 영역: 우리걸 대체할 수 있는게 뭐가 있나
- 경쟁자 영역: 경쟁자는 누가있나
- 신규진입자 영역: 이 시장에 신규로 들어온애가 누가 있나
25. 빅데이터 특징 (V)
- 3v
- Volume: 데이터의 양
- Variety: 데이터의 다양성
- Velocity: 데이터의 입출력 속도
- 5v
- Value: 비지니스나 연구에서의 가치(분석 ROI에서의 비지니스 효과)
- Veracity: 데이터의 진실성(분석할만한 가치가 있느냐)
- 7v
- Volatility: 데이터의 휘발성(얼마나 오래 저장될 수 있냐)
- Validity: 데이터의 정확성(노이즈 등)
'Certification > ADP필기' 카테고리의 다른 글
4과목 - 데이터분석 (0) | 2023.09.26 |
---|---|
5과목 - 데이터 시각화 (0) | 2023.09.26 |
2과목 - 데이터 처리 기술의 이해 (0) | 2023.09.25 |
1과목- 데이터 이해 (0) | 2023.09.25 |