본문 바로가기

정보관리기술사/IT경영전략

OLAP(Online Analytical Processing)

반응형

I. 대용량 데이터 분석을 위한 OLAP의 개요

가. OLAP(Online Analytical Processing)의 정의

 - 데이터 웨어하우스나 데이터 마트와 같은 대규모 데이터에 대해 최종사용자가 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용할 수 있는 실시간 분석처리

. OLAP의 특징

특징

주요 개념

다차원성

사용자들이 실제적인 차원에서 정보를 분석

(Multidimensional View of Data)

직접 접근

최종사용자들이 전산부서와 같은 정보 매개자를 거치지 않고 자신이 원하는 정보에 직접 접근

대화식 분석

시스템과 상호작용을 통해 정보를 분석하고 원하는 정보를 얻을 때까지 계속해서 분석을 수행함(Drilling)

의사결정용

기업의 전략적방향설정 및 의사결정에 활용

 

 

 

 

 

 

 

 

 

나. OLAP의 기능

 

다차원 데이터 분석

다양한 데이터에의 접근

-다차원으로 구성된 데이터를 분석

 (기간/제품/매장의 연계분석)

-다양한 계산/통계, Pivot table, 3차원 큐브 등의 기능 필요

-트랜젝션 상세데이터+DW요약데이터 관련 Drill down and up

-신속한 질의와 응답

-대규모 DB 지원

 

II.OLAP 개념도

 

 

III. OLAP의 유형 및 비교

가. OLAP유형

 

유형

구분

내용

ROLAP

정의

Relational Online Analytical Processing

- 최종 사용자의 분석 및 질의 요구를 SQL문으로 변환하여 데이터 웨어하우스에 전달

- 데이터웨어 하우스로부터의 처리 결과를 가공하여 최종 사용자에게 전달

- 사용자의 처리 요구에 대한 변환 및 스케쥴링, 처리 결과에 대한 가공, Tuning, Caching 등의 기능 담당

- 별도로 데이터를 저장하거나 관리하지 않음

- - 관계형 데이터베이스와 SQL과 같은 관계형 질의어를 사용하여 다차원 데이터를 저장하고 분석하는 형태임.

-전형적 3 Tier 구조

구성도

장점

- 대용량으로서 전사적으로 구축하는데 적합하며 확장성이 뛰어남.

- 요약정보가 추출된 원시데이터를 검색해 볼 수 있음

단점

-정규화를 통해 저장되어 응답시간이 느림(Star Schema)

-기존의 SQL 사용한계(다차원데이터분석의 충분한 기능 없음)

대표제품

인포믹스의 메타큐브, 인포메이션 어드벤티지의 디시전 쉬이트, 마이크로스트래티지의 DSS에이전트 등

MOLAP

 

정의

Multidimensional Online Analytical Processing

- 다차원 데이터베이스에 대하여 직접 색인된 OLAP

- 가능한 모든 조합의 데이터가 반영되어 이미 다차원 배열에 저장되어 있는 데이터를 처리하며, 셀 내의 각 데이터를 직접 액세스 가능

- 데이터 웨어하우스와는 별도로 다차원 데이터베이스(Multidimensional DataBase, MDB)를 구축

- 일반적으로, 특정 업무 영역 단위의 요약 데이터를 저장하는 데이터 마트 (Data Mart)로 운영

- 다차원 데이터베이스는 주기적으로 데이터 웨어하우스에서 관련 데이터들을 가져와서 새로 생성

- 최종 사용자로부터의 분석 및 질의 요구는 모두 MOLAP 서버에서 처리

- 다차원데이터를 저장하기 위한 특수한 구조의 다차원DB사용

- Transaction DB에서 추출된 데이터를 데이터셀에 보관하고, 속도 개선을 위해 주기억장치의 큐브캐쉬(Cube Cache)속에 데이터큐브를 보관함

구성도

장점

- 데이터를 배열 구조에 저장하므로 ROLAP 대비 사용이 쉽고, 검색속도가 빠름, 중소형 DW에 적합

단점

-차원을 미리 정의 내리고, 데이터큐브를 먼저 생성 후 데이터를 적재

대표제품

하이페리언 솔루션의 에스베이스, 오라클의 익스프레스, 파일롯 소프트웨어의 디시젼 서포트 등

DOLAP

정의

- Desktop OLAP

- 서버 개념없이 직접 데이터 웨어하우스와 연결되어 최종 사용자의 분석 및 질의 요구 처리

-DW추출 후 사용자의 PC에 저장하는 형태

-다차원데이터의 저장 및 프로세싱이 모두 Client에서 발생

구성도

장점

-싸고 빠르다

-설치와 관리가 용이하다

단점

-대용량의 데이터를 처리하는데 한계

-데이터 정합성을 유지하기 힘들다

대표제품

코그노스의 파워플레이, 브리오테크놀러지의 브리오쿼리 등

HOLAP

 

- Hybrid OLAP

- ROLAP MOLAP을 결합한 형태

-DB저장은 관계형데이터베이스, 다차원프로세싱은 MOLAP사용

구성도

장점

- ROLAP의 대용량데이터 저장능력, 다차원 프로세싱은 MOLAP의 정밀한 분석이 가능

단점

- 정밀하지만 구현이 어렵다

대표제품

오라클 익스프레스, 마이크로소프트 SQL 서버 OLAP

WEB OLAP

정의

- 사용자가 웹을 통해 OLAP사용

- OLAP 데이터는 Broadcasting

- C/S OLAP에 비하여 가격이 저렴

- 인터페이스 방식 및 보안문제 해결이 중요함.

 

나.ROLAPMOLAP의 비교

구분

ROLAP

MOLAP

개념

관계DB상에 모든 데이터를 저장하고 스타스키마와 같은 비정규화된 형태의 OLAP

다차원데이터베이스에 데이터를 저장하고 신속한 응답을 위해 특수한 형태로 데이터 구조 사용

저장

관계형DB

다차원DB

요약데이터

상세 및 요약데이터

다양한 요약데이터를 최적화된 MMDBS에 유지

크기

대용량의 데이터볼륨

적정 크기의 데이터 볼륨

엑세스

DW전체 데이터 엑세스

요약데이터는 MMDB접근

상세데이터는 DW엑세스

Data fetch

DW로부터 데이터를 패치하기 위해 복잡한 SQL사용

MOLAP엔진에 의해 미리 생성된 데이터 큐브 생성

다차원모델링

Snow flake, Star Schema 등 다차원모델링 필요

다차원DB에 다차원연산엔진을 결합한 형태로 모델링필요없음

장점

보편화된 환경과 다양한 도구 존재

빠른엑서스,많은 차원에 관계 없이 쉽게 분석가능

폭넓은 Drill-down, Slice and disc기능 보유

단점

복잡한 분석 기능의 제약

낮은 수준의 Drill-through 는 쉽지만 Drill-Access는 쉽지않음

복잡한 계산을 위한 많은 양의 기능 라이브러리

 

IV. OLAP도입 시 고려사항 및 향후 발전전망

가. OLAP 도입 시 고려사항

구분

고려사항

최종사용자편의성

비전문적인 사용자가 손쉽게 Data warehouse, Data Mining의 데이터에 접근하여 원하는 데이터를 조회할 수 있어야 함

업무모델링

다차원 업무모델의 설계가 가능해야 함

현업 요구사항에 맞는 유연한 모델 구축 지원

고급 분석 능력

고급사용자를 위하여 통계, 회계, 예측 기능 등의 지원

Web 지원

Internet 연계, Web을 통한 보고서출력, 데이터분석기능

보안성

다양한 수준의 보안기능

호환성

Client OS, Server OS, DBMS

다양한 형태 정보 표현

다양한 그래픽 멀티미디어 지원

Exception 기능 지원

. OLAP의 향후 발전 전망

구분

고려사항

기술적인 측면

 

- 기존의 OLAP Tool들이 웹 환경으로 이전되어 활성화 될 것으로 예상

- 플랫폼에 독립적인 OLAP Tool의 개발이 필요

- OLAP 제품들이 공유할 수 있는 논리적 다차원 모델의 표준이 필요하며, ERP의 데이터 DW 또는 특정 DB와 연계하여 다차원적으로 분석 능력 필요

- EC의 확산에 따라 Web 상에서 기능하는 Web OLAP등장

비즈니스적 측면

 

- 적용된 Logic에 대한 개선이 필요하며, 웹 환경에 적합한 제품의 상용화가 필요

- OLAP의 검증형 접근법과 Data Mining의 발견형 접근법을 통합하여 사용자 의사 결정을 지원

사용자측면

- 사용자의 전문적 지식이 요구되는 단점을 보완하기 위한 해결책 필요

 

 

 

반응형