데이터를 저장하는 것만으로는 부족합니다. 정말 중요한 건 어떻게 빠르게 처리하느냐입니다. ADP 자격증의 ‘데이터 처리 기술의 이해’ 과목에서는 이와 관련된 핵심 개념인 분산 컴퓨팅 기술을 다룹니다. 이번 글에서는 분산 컴퓨팅의 개념부터 MapReduce, Spark, Flink, 병렬 쿼리 시스템과 Impala까지 완벽하게 정리합니다. 1. 분산 컴퓨팅이란?분산 컴퓨팅(Distributed Computing)은 하나의 데이터를 여러 노드(서버)에 나누어 동시에 처리하는 기술입니다.📌 목적: 고속 연산, 확장성, 장애 대응📌 구성Master Node: 작업 분배/스케줄링Worker Node: 실제 연산 수행저장소: HDFS, S3 등 분산 스토리지[Client] → [Master] → [Worker1..