현대 사회의 데이터는 더 이상 정형 데이터에만 머무르지 않습니다. 텍스트, 이미지, 영상, 음성, 로그와 같은 비정형 데이터는 전체 데이터의 80% 이상을 차지하며, 이는 단순 저장이 아닌 고성능 수집 및 처리 기술, 분산 환경, 실시간 대응력을 요구합니다. 본 절에서는 비정형 데이터의 정의, 저장 방식, 로그 및 대용량 수집 시스템, 하둡 기반 분산 병렬 처리, 그리고 SQL on Hadoop까지 빅데이터 처리의 핵심 개념과 기술을 포괄적으로 학습합니다. 1. 비정형 데이터의 정의 구분 설명 예시 정형 데이터행/열 구조의 고정 스키마엑셀, RDB반정형 데이터구조는 있으나 고정 스키마는 없음JSON, XML비정형 데이터구조 없이 자유로운 형태텍스트, 이미지, 영상, 음성, 로그 2. 비정형 데이터 저..