본문 바로가기
  • soobinhand의 기술 블로그
Computer Science/데이터베이스

[데이터베이스] Data Analytics with SQL

by soobinhand 2021. 10. 29.
728x90

Data analytics

  • 예측을 위한 패턴, 상관관계 또는 모델을 추론하기 위한 데이터 처리를 의미합니다.
  • 보통 회사에서 의사 결정을 할 때 사용하고, 현재 아주 중요한 작업으로 인식되고 있습니다.
  • Data Warehouse 에 여러 데이터 소스들을 모으고 OLAP을 사용하여 분석을 합니다.

데이터 웨어하우스 (Data Warehouse)

  • 효율적인 의사결정을 위해 다양한 데이터베이스들을 수집한 후, 하나의 통일된 형식으로 저장한 데이터베이스들입니다.
  • 단순한 데이터 저장고가 아니라, 관계형 데이터베이스를 근간으로 많은 데이터를 다차원 분석하여 의사결정에 도움을 주는 시스템입니다.
  • 각각의 DBMS에서 축적한 데이터들을 한곳에 모아서 분석할 때 DW를 사용합니다.
  • 보통 과거의 데이터는 축적하지 않는데 이 DW는 과거 데이터부터 현재 데이터까지 축적되어 있습니다.
  • DW는 크게 Fact table (Large) 과 Dimension table (Small) 로 나눠집니다. Dimension table은 PK를 꼭 하나씩 가지고 있으며, Fact table은 Dimension하고 FK관계를 형성합니다. 또한 Fact table이 Dimension table에서 가져온 PK들은 모두 합하여 Fact table의 PK가 됩니다. Fact table에서 FK가 아닌 속성들은 measure attribute라고 합니다.
  • 보통 Fact 와 Dimension은 star schema 라고 불리웁니다.

OLAP (OnLine Analytical Processing)

  • 의사결정 지원 시스템 가운데 대표적인 예로, 사용자가 동일한 데이터를 여러 기준을 이용하는 다양한 방식으로 바라보면서 다차원 데이터 분석을 할 수 있도록 도와줍니다.

 

728x90

댓글