728x90
Data analytics
- 예측을 위한 패턴, 상관관계 또는 모델을 추론하기 위한 데이터 처리를 의미합니다.
- 보통 회사에서 의사 결정을 할 때 사용하고, 현재 아주 중요한 작업으로 인식되고 있습니다.
- Data Warehouse 에 여러 데이터 소스들을 모으고 OLAP을 사용하여 분석을 합니다.
데이터 웨어하우스 (Data Warehouse)
- 효율적인 의사결정을 위해 다양한 데이터베이스들을 수집한 후, 하나의 통일된 형식으로 저장한 데이터베이스들입니다.
- 단순한 데이터 저장고가 아니라, 관계형 데이터베이스를 근간으로 많은 데이터를 다차원 분석하여 의사결정에 도움을 주는 시스템입니다.
- 각각의 DBMS에서 축적한 데이터들을 한곳에 모아서 분석할 때 DW를 사용합니다.
- 보통 과거의 데이터는 축적하지 않는데 이 DW는 과거 데이터부터 현재 데이터까지 축적되어 있습니다.
- DW는 크게 Fact table (Large) 과 Dimension table (Small) 로 나눠집니다. Dimension table은 PK를 꼭 하나씩 가지고 있으며, Fact table은 Dimension하고 FK관계를 형성합니다. 또한 Fact table이 Dimension table에서 가져온 PK들은 모두 합하여 Fact table의 PK가 됩니다. Fact table에서 FK가 아닌 속성들은 measure attribute라고 합니다.
- 보통 Fact 와 Dimension은 star schema 라고 불리웁니다.
OLAP (OnLine Analytical Processing)
- 의사결정 지원 시스템 가운데 대표적인 예로, 사용자가 동일한 데이터를 여러 기준을 이용하는 다양한 방식으로 바라보면서 다차원 데이터 분석을 할 수 있도록 도와줍니다.
728x90
'Computer Science > 데이터베이스' 카테고리의 다른 글
[데이터베이스] 트랜잭션, Transaction (0) | 2022.01.27 |
---|---|
[데이터베이스] Key (0) | 2021.10.29 |
[데이터베이스] 관계형 데이터베이스 (0) | 2021.10.28 |
[데이터베이스] Database? (0) | 2021.10.16 |
댓글