] [Hive]하이브 입문
본문 바로가기

카테고리 없음

[Hive]하이브 입문

카카오 머신러닝, 데이터 분석가 모집 공고를 살펴보았다. 

우대사항에 Hadoop M/R, Hive Spark 등 빅데이터 플랫폼 사용 경험자 가 있어서

뭔지 궁금해서 관련 도서를 빌렸다. 

 

시립대학교 도서관에서 하이브 완벽 가이드(Programming Hive) - 한빛미디어 를 빌려 그 책 내용을 바탕으로 공부한 것을 정리하고자 한다. 

 

분산 파일 시스템과 맵리듀스가 계산 중심의 작업에 유용한 방법이다. 

 

하이브는 익숙한 SQL로 맵리듀스를 사용할 수 있는 빠르면서 간단한 방법을 제공한다. 

하이브는 데이터양에 상관없이 공개 기술을 사용하여 데이터 웨어하우스를 구축하는 최고의 방법이다. 

하이브는 SQL로 하둡을 쓸 수 있게 한다.