데이터 사이즈도 어느정도 커야할까? 레코드가 몇 억개, 몇 십억개 정도도 부족할까?


하둡 연습용 책 들은 보통 HDD가 100기가바이트 정도 되는 머신을 3대 정도 마련했다고 가정해서 예제들을 보여주던데, 그럼 그 정도면 될까? (그럼 몇 억개, 몇 십억개도 훨씬 뛰어넘겠군...)

+ Recent posts