1.ํ๋ก์์ฝ์์คํ ํ๋ก์ HDFS์ ๋ถ์ฐ ๋ฐ์ดํฐ ์ ์ฅ๊ณผ ๋น ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉ์์ธ MapReduce๋ฐฉ์์ผ๋ก ์ด๋ฃจ์ด์ ธ ์๋ค. ํ๋ก์ ์ข ๋ ํธํ๊ณ , ๋จ์ ์ ๋ณด์ํ๊ธฐ ์ํด ์ฌ๋ฌ ์๋ธ ํ๋ก์ ํธ๋ค์ด ์งํ๋์ด ์๋ค. โ ๊ทธ ์๋ธ ํ๋ก์ ํธ์ ๋ชจ์์ ํ๋ก ์์ฝ ์์คํ ์ด๋ผ๊ณ ํ๋ค. 2.๋งต๋ฆฌ๋์ค(MadpReduce) ํ๋ก์ ๊ณ์ฐ์ ๋ด๋นํ๋ค. ์ ๋ ฌ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ฐ์ฒ๋ฆฌ - Map ํ๊ณ ์ด๋ฅผ ๋ค์ ํฉ์น๋ - Reduce ๊ณผ์ ์ ์ํํ๋ค. Map & Reduce ๊ตฌ์ฑ ์ด 2๊ฐ Map, Reduce์ phase๋ก ๊ตฌ์ฑ๋์ด ์๋ค. Map๊ณผ Reduce์ฌ์ด์๋ shuffle๊ณผ Sort๋ผ๋ ์คํ ์ด์ง๊ฐ ์กด์ฌํ๋ค. ๊ฐ Map Task๋ ์ ์ฒด ๋ฐ์ดํฐ ์ธํธ์ ๋ํ ๋ณ๊ฐ์ ๋ถ๋ถ ์์ ์ ์ํํ๊ฒ ๋๋๋ฐ, ๊ธฐ๋ณธ์ ์ผ๋ก ํ๋์ HDFS Block์ ๋์์ผ..