
[빅데이터 시스템 구축] Hadoop, Hadoop Ecosystem
·
AI & 빅데이터
Hadoop an open source software platform for distributed storage and distributed processing of very large data sets on computer clusters built from commodity hardware. 빅데이터에 대한 분산 처리, 분산 저장소에 대한 오픈 소스 소프트웨어 플랫폼. Hadoop 자체 시스템으로는 HDFS, YARN, MapReduce 3가지가 있다. HDFS (Hadoop Distributed File System) 대용량 데이터들을 분산된 서버에 저장하고, 저장된 데이터를 빠르게 처리할 수 있게 하는 파일 시스템. YARN 컴퓨팅 클러스터의 리소스를 관리하는 시스템. 여러 작업들을 하나의 리소..