1. 데이터 분석 기획의 이해
- 분석 기획 방향성 도출
> 분석기획
- 분석을 수행할 과제를 정의하고 결과를 도출할 수 있도록 관리할 수 있는 방안을 사전에 계획
> 데이터 사이언스의 역량
[1] 수학/통계학적 지식 및 정보기술 ( IT, 해킹, 통신 기술 등)
[2] 해당 비즈니스에 대한 이해와 전문성
[3] 역량과 시각
> 분석 대상과 방법
- 분석 대상 ( What ) / 분석 방법 ( How) 에 따라 4가지로 나뉨
![](https://blog.kakaocdn.net/dn/LdRvz/btsGeb1NcLV/LUwVRvKHmF0fhw7kujcpoK/img.png)
> 분석 기획 방안
- 과제 중심적 접근 : 목표 시점별로 당면한 과제를 빠르게 해결
- 장기적 마스터 플랜 : 지속적인 분석으로 원인 해결
![](https://blog.kakaocdn.net/dn/mOZ2d/btsGhmm6xOd/ECqpUqQ7O9ZVDnofMy3xZ1/img.png)
> 분석 기획 시 고려사항
(1) 가용 데이터 : 분석의 기본이 되는 데이터 확보 및 파악
(2) 적절한 유즈케이스 탐색 : 기존에 잘 구현되어있는 유사 분석 시나리오 및 솔루선 최대 활용
(3) 장애요소에 대한 사전계획 수립 : 조직의 역량으로 내재화
> 의사결정을 방해하는 요소
- 고정 관념, 편향된 생각
- 프레이밍 효과 : 동일 상황임에도 개인의 판단, 결정이 달라지는 것
- 분석 방법론
> 분석 방법론의 구성요소
- 절차, 방법, 도구와 기법, 템플릿과 산출물
> 분석 방법론 모델
(1) 폭포수 모델 : 단계를 순차적으로 진행 / 이전 단계 완료 후 다음 단계 진행
(2) 나선형 모델 : 여러 개발과정을 거쳐 점진적으로 완성, 위험요소 제거에 초점
(3) 프로토타입 모델 : 일부분 ( 프로토타입 )을 우선 개발 후 개선
(4) 애자일 : 일정한 주기를 가지고 프로토타입을 끊임없이 수정하며 고객의 Needs 반영
> KDD 분석 방법론
데이터 선택 > 전처리 > 변환 > 마이닝 > 결과 평과
1) 전처리 : 이상치, 잡음, 결측지 식별 및 데이터 가공
2) 변환 : 변수 선택, 차원 축소, 데이터 분리 ( 학습용 / 검증용 )
> Crisp-DM 분석 방법론
업무 이해 > 데이터 이해 > 데이터 준비 > 모델링 > 평가 > 전개
1) 모델링 단계에서 모델평가 / 평가 단계에서 모델 "적용성" 평가
2) 평가 > 전개 단계에서 위대한 실패 발생 가능
> 빅데이터 분석 방법론
![](https://blog.kakaocdn.net/dn/bivTw9/btsGfyn9St6/mVHBBosf9VzsehmahGrKzK/img.png)
1) 분석 기획
- 비즈니스 범위 설정 : SOW ( Statement of Works) - 구조화된 프로젝트 정의서
- 위험 계획 수립 ( 회피, 전이, 완화, 수용 ) - 회전완수
2) 데이터 분석
- 추가적인 데이터 확보 필요 시 , 데이터 준비 단계로 다시 진행
3) 데이터 분석 - 모델링
- 가설 설정을 통해 통계 모델이나 기계학습을 이용한 분류, 예측 등의 모델을 만드는 과정
- 의사 코드 : 일반적인 언어로 프로그래밍 언어의 알고리즘을 유사한 형식으로 써 놓은 것
- 분석 과제 발굴
> 디자인 사고 ( Design Thinking )
- 사용자의 공감으로 시작하여 아이디어 발산/수렴 과정을 통한 피드백으로 발전하는 과정
공감하기 > 문제정의 > 아이디어 도출 > 프로토타입 > 테스트
> 하향식 접근 방법
- 문제가 주어지고 해답을 찾기 위해 진행
문제 탐색 > 문제 정의 > 해결방안 > 타탕성 검토
(1) 문제 탐색
1) 빠짐없이 문제를 도출하고 식별하며 해결 보다는 가치에 초점
2) 기존 시스템 개선하여 사용이 가능하면 개선하여 활용
3) 비즈니스 모델 캔버스 단순화 측면 : 업무, 제품, 고객, 규제와 감사, 지원 인프라
지원 인프라 업무 중에 고객이 제품을 규제와 감사했다.
4) 관점
- 거시적 관점 : STEEP ( 사회, 기술, 경제, 환경, 정치 )
- 경쟁자 확대 관점 : 대체자, 경쟁자, 신규 진입자
- 시장의 니즈 탐색 관점 : 고객, 채널, 영향자
5) 분석 유즈 케이스
- 발굴한 분석 기회들을 구체적 과제로 만들기 전 상세한 설명과 효과를 명시
(2) 타당성 검토
- 경제적 타당성 : 비용대비 편익 분석관점 접근
- 데이터 타당성 : 데이터 존재여부, 분석역량 필요
- 기술적 타당성 : 역량 확보 방안 사전에 수림
> 상향식 접근 방법
- 문제 정의 자체가 여려울 때, 사물의 그대로를 인식하는 What 관점
- 주로 비지도 학습
> 지도학습, 비지도 학습
(1) 지도 학습
- 정답이 있는 데이터를 학습
- 분류, 회귀분석, 분류 의사결정트리, KNN
(2) 비지도 학습
- 정답이 없는 데이터를 학습
- 군집분석, 연관분석, PCA
- 분석 프로젝트 관리 방안
> 분석 과제에서 고려해야할 5가지 요소
- 데이터 크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도/정밀도
* 정확도와 정밀도는 Trade-Off 관계
> 프로젝트 관리 지식 체계 10가지 영역
- 통합, 범위, 시간(일정), 원가(비용), 품질, 인적자원, 의사소통, 리스크(위험), 조달, 이해관계자
2. 분석 마스터 플랜
- 마스터 플랜 수립
> 우선순위 선정
(1) 전략적 중요도 : 전략적 필요성, 시급성
(2) 실행 용이성 : 투자 용이성, 기술 용이성
> ISP
- 중장기 마스터 플랜을 수립하는 절차
> ROI 관점
(1) 시급성 관점 : 비즈니스 효과 ( Return ) - Value
(2) 난이도 관점 : 투자비용 요소 ( Investment ) = Volume, Variety, Velocity ( 3V )
![](https://blog.kakaocdn.net/dn/bhBuaP/btsGdQjotvh/BZZYZzXyxHuAK6If9WH0ZK/img.png)
- 시급성 중요 시 : 3 > 4 > 2
- 난이도 중요 시 : 3 > 1 > 2
3과 2는 앞/뒤로 고정하고 가운데만 변경
- 분석 거버넌스 체계 수립
> 분석 거버넌스 체계 구성요소
- 조직, 프로세스, 시스템, 데이터, 분석관려 교육 및 마인드 육성체계
> 데이터 분석 수준 진단
(1) 분석 준비도
1) 분석업무 파악 : 사실 분석, 예측, 시뮬레이션, 최적화, 분석 업무 정기적 개선
2) 분석 인력 및 조직 : 분석전문과, 관리자, 조직, 경영진 이해
3) 분석기법 : 적합한 기법 사용, 분석기법 라이브러리/평거/개선
4) 분석데이터 : 데이터 관리, 외부데이터 활용, 기분데이터 관리 ( MDM )
5) 분석문화 : 의사결정, 회의에서 활용, 공유 및 협업 문화
6) IT 인프라 : 운영 시스템 통합, 환경
(2) 분석 성숙도
* CMMI 모델 기반 ( 1~ 5단계 )
비즈니스 / 조직, 역량 / IT 부문 관점으로 구분
1) 도입 : 환경, 시스템 구축
2) 활용 : 업무에 적용
3) 확산 : 전사 차원 관리, 공유
4) 최적화 : 혁신, 성과향상에 기여
> 데이터 분석 성숙도 모델
![](https://blog.kakaocdn.net/dn/qECa9/btsGePKzux7/uKEEuf69Z63aYVnI96xlN0/img.png)
1) 준비형 : 낮은 준비도, 낮은 성숙도
- 인력, 조직, 분석업무, 분석기법 등이 적용되지 않아 사전 준비가 필요
2) 정착형 : 낮은 준비도, 높은 성숙도
- 인력, 조직, 분석업무, 분석기법 등을 기업 내부에서 제한적으로 사용
3) 도입형 : 높은 준비도, 낮은 성숙도
- 인력, 조직, 분석업무, 분석기법 등의 준비도는 높으나, 분석업무 및 기법 부족
4) 확산형 : 높은 준비도, 높은 성숙도
- 6가지 분석 구성요소가 모두 구비되어 있고, 지속적 확산이 필요
*4사분면 부터 시계방향으로 도준정확
> 분석 지원 인프라 방안 수립
- 확장성을 고려한 플랫폼 구조 적용 ( 중앙집중적 관리 )
> 데이터 거버넌스 체계 수립
(1) 데이터 거버넌스
1) 전사 차원에서 데이터에 대한 표준화된 관리 체계 수립
2) 구성요소 : 원칙, 조직, 프로세스
3) 중요 관리대상 : 마스터 데이터, 메타데이터, 데이터 사전 등
- 마스터 데이터 : 데이터 처리에 기준이 되는 데이터
- 메타 데이터 : 다른 데이터를 설명해주는 데이터
- 데이터 사전 : DB에 저장된 정보를 요약
4) 빅데이터 거버넌스와의 차이점
- 빅데이터 거버넌스 :
데티어 거버넌스 + 데이터 최적화, 정보보호, 데이터 생명주기, 데이터 카테고리 별 관리자
(2) 데이터 거버넌스 체계
1) 데이터 표준화 : 메타데이터 구축, 사전 구축
2) 데이터 관리 체계 : 효율성
3) 데이터 저장소 관리 : 저장소 구성
4) 표준화 활동 : 모니터링
> 조직 및 인력방안 수립 ( DSCoE : 분석조직 )
- 집중 구조 : 독립적인 전담 조직 구성
- 기능 구조 : 해당 부서에서 직접 분석
- 분산 구조 : 분석 조직 인력을 현업 부서에 배치
조직 및 인력방안 : 집기분
'ADsP' 카테고리의 다른 글
[ADsP] 요약노트 1 과목 - 데이터 이해 (0) | 2024.04.01 |
---|