MapReduce
웹 개발/Study 2021. 2. 3. 14:19맵리듀스(MapReduce)란?
: 대용량 데이터를 처리를 위한 분산 프로그래밍 모델
- 구글에서 2004년 발표한 소프트웨어 프레임워크
- 타고난 병행성(병렬 처리 지원)을 내포
- 누구든지 임의로 활용할 수 있는 충분한 서버를 이용하여 대규모 데이터 분석 가능
- 흩어져 있는 데이터를 수직화하여, 그 데이터를 각각의 종류 별로 모으고(èMap),
Filtering과 Sorting을 거쳐 데이터를 뽑아내는(èReduce)
하는 분산처리 기술과 관련 프레임워크를 의미
맵리듀스는 맵(Map) 단계와 리듀스(Reduce) 단계로 처리 과정을 나누어 작업
각 단계는 입력과 출력으로써 키-값 쌍을 가지고 있고, 그 타입은 프로그래머가 선택합니다. 또한, 맵과 리듀스 함수도 프로그래머가 직접 작성하게 됩니다
Map은 흩어져 잇는 데이터를 Key, Value의 형태로 연관성 있는 데이터 분류로 묶는 작업
Reduce는 Map화한 작업 중 중복 데이터를 제거하고 원하는 데이터를 추출하는 작업
l MapReduce Logical Data Flow
맵(map)은 흩어져 있는 데이터를 관련 있는 데이터끼리 묶는 작업을 통해서 임시 데이터 집합으로 변형되며, 리듀스(Reduce)는 맵 작업에서 생성된 임시 데이터 집합에서 중복 데이터를 제거하고 원하는 데이터를 추출하는 작업을 진행합니다.
출처: https://over153cm.tistory.com/entry/맵리듀스MapReduce란-1 [빅데이터는 넘커]
'웹 개발 > Study' 카테고리의 다른 글
자바 스크립트에서의 OOP (0) | 2021.02.26 |
---|---|
명령형(imperative ), 선언형(declarative), 절차형, 객체 지향형(OOP), 함수형 프로그래밍 (0) | 2021.02.03 |
Closure 과 Currying (0) | 2021.02.03 |
block, inline-block, inline (0) | 2021.01.21 |
class 와 id의 차이점 (0) | 2021.01.21 |