여러가지 DBMS들
- Redis
- IMDB로써 기능하며, 영속성이 필요없고 주로 웹 소켓과 연계하여 실시간으로 데이터를 푸시하는 케이스가 있다.
- ELK Stack
- Elastic Search + Logstash + Kibana: 분산검색엔진. 복잡한 검색, 데이터 분석, 로그 및 집계에 사용
- Elastic Search: 데이터 프로세싱
- Logstash: 데이터 저장
- Kibana: 데이터 시각화
- 자매품으로 Grafana도 있음.
- Cassandra
- 데이터베이스 분산저장 & 쿼리에 강한 기술
분산을 왜하나요?
저장해야 할 데이터가 정말 많은 경우 사용. 많은 유저가 하나의 DB에 쿼리를 보냈을 때 DB가 부담을 느끼기 때문도 있음.
- MariaDB
- MySQL의 유료화에 대항한 포크
- BigQuery
- 구글에서 만든 머신러닝 전용 데이터 웨어하우스
데이터 웨어하우스는 뭔가요?
데이터 분석을 위한 도구로, 트랜잭션의 속도가 중요한 DBMS보다 데이터 분석속도가 우선한다.
1. 주제 중심: 데이터베이스가 애플리케이션 중심인 반면, 데이터 웨어하우스는 특정 주제 (예: 고객, 제품, 판매 등)에 대한 데이터를 중심으로 구성됩니다.
2. 시간 기반: 과거 데이터를 포함하여 시간 경과에 따른 데이터 변화를 분석하는데 유용합니다.
3. 통합: 다양한 데이터 소스 (예: 거래 시스템, 마케팅 시스템 등)의 데이터를 하나의 시스템에 통합하여 분석합니다.
4. 불변성: 데이터 웨어하우스에 저장된 데이터는 변경되지 않기 때문에 과거 데이터를 기반으로 정확한 분석이 가능합니다.
5. 분석 최적화: 데이터 웨어하우스는 데이터 분석을 위해 최적화되어 있으며, 다양한 분석 도구를 사용하여 데이터를 탐색하고 분석할 수 있습니다.
Tip#
이런게 있구나 하고 넘어가기 전에 <DBMS 이름> Architecture
라고 검색해본 뒤에 간단히 확인해보는 것으로도 대략적인 기술의 구성을 알 수 있다.