데이터마이닝(Data Mining)
I. 의사결정에 유용한 정보추출, 데이터마이닝의 개요
가. 데이터마이닝(Data Mining)의 정의
- 대용량의 데이터에 담긴 패턴, 연관성을 탐색하고 모형화하여 의미 있는 정보로 변환하여 기업의 의사결정에 적용하는 과정
나. 데이터마이닝의 목적
구분 |
내용 |
예측 |
- 예측적 모델링 (Predictive Modeling) |
설명 |
- 탐색적 모델링 (Descriptive Modeling) |
다. 데이터 마이닝(Data Mining)의 등장배경
관점 |
내용 |
기술적 요인 |
- 정보인프라 구축으로 인한 방대한 데이터 - 데이터 베이스를 통한 새로운 지식 창출 가능 - 기계학습기법의 급속한 발전 |
기업적 환경 요인 |
- 경쟁력 있는 정보 분석 환경 출현 - - 데이터 베이스 Marketing의 지속적인 대두 |
라. 데이터 마이닝(Data Mining)의 특징
- 정보의 Activity와 Rule을 추론하여 경영의 경쟁력강화를 위한 목표 예상을 가능하게 함
- 지식집약적(Knowledge Intensive) : 응용분야 지식, DB/DW지식, 데이터 마이닝 기법에 대한 지식
- 귀납적 결과에 초점
- 3I 모델링 프로세스
프로세스 |
프로세스 명칭 |
Iterative |
반복적 데이터 모형 |
Interactive |
상호대화적인 데이터 모형 |
Incremental |
점진적으로 증가하는 데이터 모형 |
II. 데이터마이닝 적용기술
가. 데이터마이닝 적용기술
작업유형 |
설명 |
사용기법 |
연관성 탐사 |
-데이터간 종속관계를 찾아내는 작업 |
-동시발생 |
연속성규칙 |
-연관규칙에 시계열 정보가 포함된 형태 예)냉장고를 구입한 고객은 1달내 오븐구입 70% |
-동시발생 |
분류규칙 |
-분류모델을 토대로 새로운 결과값 예측 |
-판별분석 -시계열분석 -신경망분석 |
데이터 군집화 (Clustering) |
-레코드를 유사한 특성을 가진 소 그룹으로 분할 예)타 기법의 선행으로 사용 |
-K-Means Clustering |
특성화 |
-일반적인 특성을 분석 -요약 과정을 통한 특성 규칙 발견 |
|
의사결정나무 (Decision Tree) |
과거 수집된 레코드를 분석하여 이들 사이에 존재하는 패턴 즉, 분류별 특성을 속성의 조합으로 나타내는 나무형태의 분류 모형(분류 규칙, Classification) 예) 우수 고객 분류 모형 |
|
'정보관리기술사 > 소프트웨어공학' 카테고리의 다른 글
WBS(Work Breakdown Structure) (0) | 2014.02.26 |
---|---|
SWOT(Strength, Weakness, Opportunity, Threat) (0) | 2014.02.19 |
SDLC(Software Development Life Cycle) (0) | 2014.02.13 |
요구공학(Requirement Engineering) (0) | 2014.02.12 |
SCRUM (0) | 2014.02.10 |