본문 바로가기

정보관리기술사/소프트웨어공학

데이터마이닝(Data Mining)

반응형

데이터마이닝(Data Mining)

I. 의사결정에 유용한 정보추출, 데이터마이닝의 개요

. 데이터마이닝(Data Mining)의 정의

- 대용량의 데이터에 담긴 패턴, 연관성을 탐색하고 모형화하여 의미 있는 정보로 변환하여 기업의 의사결정에 적용하는 과정

. 데이터마이닝의 목적

구분

내용

예측

- 예측적 모델링 (Predictive Modeling)
-
새로운 CASE에 대한 값을 예측

설명

- 탐색적 모델링 (Descriptive Modeling)
-
사용자의 이해를 목적으로 표현, 설명

 

 

 

다. 데이터 마이닝(Data Mining)의 등장배경

관점

내용

기술적 요인

- 정보인프라 구축으로 인한 방대한 데이터

- 데이터 베이스를 통한 새로운 지식 창출 가능

- 기계학습기법의 급속한 발전

기업적

환경 요인

- 경쟁력 있는 정보 분석 환경 출현

- - 데이터 베이스 Marketing의 지속적인 대두

 

라. 데이터 마이닝(Data Mining)의 특징

- 정보의 Activity와 Rule을 추론하여 경영의 경쟁력강화를 위한 목표 예상을 가능하게 함

- 지식집약적(Knowledge Intensive) : 응용분야 지식, DB/DW지식, 데이터 마이닝 기법에 대한 지식

- 귀납적 결과에 초점

- 3I 모델링 프로세스

프로세스

프로세스 명칭

Iterative

반복적 데이터 모형

Interactive

상호대화적인 데이터 모형

Incremental

점진적으로 증가하는 데이터 모형

II. 데이터마이닝 적용기술

가. 데이터마이닝 적용기술

작업유형

설명

사용기법

연관성 탐사
(Association)

-데이터간 종속관계를 찾아내는 작업
)넥타이구매고객은, 셔츠도 구입

-동시발생
메트릭스

연속성규칙
(Sequence)

-연관규칙에 시계열 정보가 포함된 형태

)냉장고를 구입한 고객은 1달내 오븐구입 70%

-동시발생
메트릭스

분류규칙
(Classification)

-분류모델을 토대로 새로운 결과값 예측
)신용”불량고객”은 25~30대 남자

-판별분석

-시계열분석

-신경망분석

데이터 군집화

(Clustering)

-레코드를 유사한 특성을 가진 소 그룹으로 분할

)타 기법의 선행으로 사용

-K-Means Clustering

특성화

-일반적인 특성을 분석

-요약 과정을 통한 특성 규칙 발견

의사결정나무

(Decision Tree)

과거 수집된 레코드를 분석하여 이들 사이에 존재하는 패턴 즉, 분류별 특성을 속성의 조합으로 나타내는 나무형태의 분류 모형(분류 규칙, Classification)

) 우수 고객 분류 모형

반응형