책소개

NoSQL 데이터베이스 관리를 위한 하둡과 HBase 클러스터 설치에서 고급 튜닝까지!

HBase는 빅데이터 관리와 분석을 위해 개발된 클러스터 기반의 NoSQL 데이터베이스다. 『HBase 클러스터 구축과 관리』는 HBase 클러스터의 설치와 관리 방법에서부터 고급 튜닝 기법 등의 HBase 클러스터를 운영하기 위한 전반적인 내용을 다룬다. 나아가 클러스터 운영에 매우 중요한 보안 이슈와 최적의 HBase 클러스터 운영을 위한 고급 튜닝 기법도 설명한다. 하둡과 맵리듀스에 대한 기본적인 이해를 필요로 한다.

출판사 서평

HBase는 빅데이터 관리와 분석을 위해 개발된 클러스터 기반의 NoSQL 데이터베이스다. 이 책은 HBase 클러스터의 설치와 관리 방법에서 시작해 고급 튜닝 기법까지, HBase 클러스터를 운영하기 위한 전반적인 내용을 다룬다. HBase 클러스터에 필요한 하둡(Hadoop) 클러스터 및 주키퍼(ZooKeeper) 등의 설치 방법도 소개하며 이를 기반으로 HBase를 설치하는 방법을 쉽게 설명한다. 또한, HBase 클러스터의 데이터 백업 및 복구, 모니터링과 같은 관리 방법을 다루며 클러스터 운영에 매우 중요한 보안 이슈도 다룬다. 그리고 최적의 HBase 클러스터를 운영하기 위한 저자의 노하우가 담긴 고급 튜닝 기법도 전수해준다. 『HBase 클러스터 구축과 관리』를 통해 빅데이터 시대의 데이터베이스 관리에 필수적인 저자의 오랜 실전 경험과 노하우를 전수받을 수 있을 것이다.

HBase는 오픈소스 분산 빅데이터 저장소로 상용 머신으로 구성된 클러스터에서 수백만 개의 컬럼(column)을 가진 수십억 개의 로우(row)를 처리할 수 있다. 실시간으로 대량의 데이터를 저장하고 액세스할 방법을 찾고 있다면 HBase가 최고의 선택이 될 것이다.『HBase 클러스터 구축과 관리』는 실제적이며 쉬운 단계별 예제를 통해 HBase를 쉽게 관리하도록 도와준다. 하둡(Hadoop)과 HBase의 관계를 이해하는 것이 HBase를 사용하는 데에 매우 중요하다. 이 책은 하둡 클러스터를 설치하고 하둡과 HBase가 같이 동작하게 설정하는 방법과 클러스터의 성능을 튜닝하는 방법을 소개한다.

이 책에서 다루는 내용
■ 고가용성을 지닌 분산 HBase 클러스터를 설치하고 클라이언트 API나 맵리듀스(MapReduce) 잡을 이용해 데이터를 로드한다.
■ HBase 셸 또는 SQL 유사 질의 언어를 이용한 하이브(Hive)를 사용해 HBase의 데이터를 액세스한다.
■ HBase 테이블의 데이터뿐만 아니라 데이터의 분포까지 백업하고 복구한다. 그리고 서로 다른 HBase 클러스터 사이에 데이터를 옮기고 복사한다.
■ 커널 설정과, JVM GC, 하둡, HBase 설정을 튜닝해 최대의 성능을 얻는다.
■ 문제해결 툴을 사용해 HBase를 사용하며 자주 발생하는 문제를 해결한다.
■ 읽기 또는 쓰기가 많은 클러스터를 튜닝하기 위한 고급 설정과 튜닝 방법을 소개한다.

이 책의 대상 독자
이 책은 HBase 관리자, 개발자를 위한 책이며, 하둡 관리자에게도 도움이 될 것이다. HBase에 대한 경험은 필요치 않으나 하둡과 맵리듀스에 대한 기본적인 이해는 필요하다.

이 책의 구성
1장, HBase 클러스터 설치: 1장에서는 HBase 클러스터를 셋팅하는 방법을 설명한다. 기본적인 스탠드얼론 HBase 인스턴스를 구축하는 것에서부터 아마존 EC2에 분산, 고가용성 HBase 클러스터를 설치하는 것까지 다룬다.

2장, 데이터 마이그레이션: 2장에서는 우선, HBase의 Put API를 사용해 MySQL에서 HBase로 데이터를 임포트하는 간단한 작업에 대해 설명한다. 그 후, TSV 데이터 파일을 로드하는 importtsv와 벌크 로드 툴의 사용법을 설명한다. 또한 맵리듀스 샘플을 사용해 다른 파일 포맷에서 데이터를 임포트하는 방법도 소개할 것이다. 여기서는 HBase 테이블에 데이터를 바로 적재하는 것과 하둡 분산 파일 시스템(HDFS)에 HFile 포맷 파일을 작성하는 방법도 다룬다. 그리고 마지막으로 HBase에 데이터를 적재하기 전에 영역을 미리 생성하는 방법을 설명한다.
2장에는 자바로 작성된 예제가 여러 개 있다. 독자가 자바의 기초적인 사용방법을 알고 있다고 가정하며 예제의 샘플 자바 코드를 컴파일하고 패키지화하는 방법은 다루지 않았다.

3장, 관리 도구 사용 방법: 3장에서는 HBase 웹 UI, HBase 셸, HBase hbck 등의 여러 가지 관리 툴의 사용법을 설명한다. 툴의 목적과 특정 작업을 해결하기 위한 툴의 사용법을 설명한다.

4장, HBase 데이터 백업과 복구: 4장에서는 HBase 데이터를 백업하는 다양한 방법을 설명하고, 각 방법의 장단점과 데이터셋의 크기, 자원, 요구사항에 따라 어떤 방법을 선택해야 하는지 설명한다.

5장, 모니터링과 진단: 5장에서는 Ganglia, OpenRSDB, Nagios 등의 툴을 사용해 HBase 클러스터를 모니터하고 진단하는 방법을 설명한다. 먼저 HBase 테이블의 디스크 사용량을 확인하는 방법부터 소개한다. Ganglia를 설치하고 HBase를 모니터하도록 설정하고 Ganglia 그래프의 사용방법을 보여줄 것이다. 또한 OpenTSDB도 설치하는데, OpenTSDB는 Ganglia와 비슷하지만 HBase를 사용하기 때문에 좀더 확장성이 있다.
Nagios를 설치해 HBase 관련 데몬의 상태, 하둡/HBase 로그, HBase 일관성 상태, HDFS의 상태와 사용량 등을 체크할 것이다.
마지막으로 핫 스팟 영역 이슈를 진단하고 고치는 방법을 설명한다.

6장, 관리 유지와 보안: 6장에서 소개되는 처음의 여섯 개의 예제에서는 결함을 찾고 고치는 작업, 클러스터 크기 변경, 설정 변경 등과 같은 여러 가지 HBase 관리 작업에 대해 배울 것이다.
6장에서는 보안 관련 이슈들도 살펴본다. 마지막 세 개의 예제에서는 커버로스(Kerberos)를 설치하고 이를 이용해 HDFS 보안을 설정하는 방법과 마지막으로 HBase 클라이언트 접근을 설정하는 방법을 다룬다.

7장, 문제 해결: 7장에서는 여러 가지 자주 부딪히는 문제들에 대해 살펴본다. 각 이슈들의 에러 메시지를 설명하고, 문제의 원인과 툴을 사용해 해결하는 방법을 설명한다.

8장, 기본 성능 튜닝: 8장에서는 좀더 좋은 성능을 얻기 위한 HBase 튜닝 방법을 설명한다. 우리는 또한 하둡 설정, JVM 가비지 콜렉션, OS 커널 파라미터와 같은 튜닝 포인트를 조절하는 방법도 설명한다.

9장, 고급 설정과 튜닝: 9장은 이 책에서 두 번째 성능 튜닝과 관련된 장이다. 8장에서는 HBase의 전반적인 성능 향상을 위한, 하둡 그리고 OS 설정, 자바, HBase 자체를 튜닝하는 방법을 설명했다. 이들은 많은 경우에 적용할 수 있는 일반적인 방법이다. 9장에서는 좀더 특수한 케이스를 다룬다. 그 중에서는 쓰기가 많은 클러스터에 특화되거나 클러스터의 읽기 성능 개선을 목표로 하는 방법들도 있다.

저자 서문
HBase는 오픈소스 분산 빅데이터 저장소로, 수백만 개의 컬럼(column)을 가진 수십억 개의 로우(row)를 처리할 수 있으며, 일반 범용 컴퓨터로 구성된 클러스터에서 동작한다. 대용량 데이터를 저장하고 실시간으로 액세스하고 싶다면 HBase가 최적의 선택이 될 것이다. HBase Administration Cookbook은 HBase를 쉽게 관리하기 위한 실제적인 예제와 단계별로 수행할 수 있는 지시사항을 제공한다. 각 예제들은 클라우드상에서 동작하는 분산, 고가용성 HBase 클러스터를 관리하는데 필요한 다양한 프로세스를 다룬다. 이와 같은 대용량 데이터를 다루는데 있어서 가장 중요한 것은 조직화되고 관리 가능한 프로세스이며, 이 책은 독자가 이것 들을 확립할 수 있는데 도움을 줄 것이다. 이 책은 분산 HBase 클러스터를 설정하고 데이터를 옮기는 것에서부터 시작한다. 독자는 일상적인 관리에 필요한 모든 툴의 사용법뿐만 아니라, 가장 최상의 성능을 얻기 위해 클러스터를 효율적으로 관리하고 모니터링 하는 방법까지 배우게 될 것이다. 하둡과 HBase와의 관계를 이해하면 HBase를 더 잘 활용할 수 있다. 따라서 이 책은 하둡 클러스터를 셋팅하고, 하둡이 HBase와 연동되도록 설정하는 방법, 그리고 성능을 튜닝하는 방법도 다룬다.

옮긴이의 말
최근 IT의 가장 큰 화두로 빅데이터가 부상하고 있습니다. 이는 최근의 데이터의 개념과 관리 기술의 변화를 보여줍니다. 모바일 디바이스의 발달은 사용자가 생성하는 데이터가 폭발적으로 증가시켰습니다. 또한, 스토리지 기술의 발달은 기업이 이전에 생각지 못한 대량의 비즈니스 데이터를 축적할 수 있게 했습니다. 이와 더불어 클러스터 기술의 발달은 이런 대용량 데이터에 대한 실시간 처리 및 분석을 가능케 했습니다. 이제 모든 것이 데이터로 표현되고 저장되며 이런 데이터를 누가 얼마나 잘 관리하고 이로부터 얼마나 가치 있는 정보를 이끌어내는지가 비즈니스의 성패를 좌우하는 시대가 됐습니다.

이와 같은 빅데이터 시대에 HBase는 가장 주목 받는 오픈소스 NoSQL 데이터베이스입니다. HBase는 2006년 구글이 발표한 빅테이블(BigTable)이라는 논문에서 시작했습니다. 빅테이블은 빅데이터를 처리하기 위해 여러 상용 머신을 클러스터로 구축한 클러스터를 기반으로 동작합니다. 이런 빅테이블을 오픈소스로 구현한 구현체가 HBase입니다. HBase의 등장은 기존의 데이터베이스 패러다임을 RDBMS에서 NoSQL로 변화시킨 계기가 됐고, 그 이후로 많은 오픈소스 NoSQL 데이터베이스가 등장하게 된 시작점이 됐습니다. 이 책은 HBase를 실제로 운영하는 관리자나 HBase를 공부하려는 초심자 모두에게 매우 유용한 내용을 담고 있습니다. 저자는 자신이 근무하는 회사에서 실제로 대규모의 HBase 클러스터를 운영하고 있으며 이를 기반으로 운영되는 서비스를 관리하고 있습니다. 이 책은 이와 같은 저자의 다년간 경험을 바탕으로 HBase 운영에 가장 필요한 핵심 내용을 예제 형식으로 제공합니다. 이 책의 예제는 HBase 클러스터의 설치와 관리 방법에서 시작해 고급 튜닝 기법까지, HBase 클러스터를 운영하기 위한 전반적인 내용을 풍부하게 다룹니다. 시작은 초보자를 위해 실제 HBase 클러스터를 구축하기 위한 하둡(Hadoop) 클러스터 및 주키퍼(ZooKeeper) 등을 설치하고 이를 기반으로 HBase를 설치하는 방법을 쉽게 설명합니다. 이후에는 HBase 클러스터의 데이터 백업 및 복구, 모니터링과 같은 관리 방법을 다루며 클러스터 운영에 매우 중요한 보안 이슈도 다룹니다. 또한, 최적의 HBase 클러스터를 운영하기 위한 저자의 경험이 담긴 고급 튜닝 기법도 전수해줍니다. 이와 같은 내용은 모두 예제 형식으로 구성되어 초보자도 쉽게 실습하고 이해할 수 있으며, 예제마다 단계별 지시 사항뿐만 아니라 예제의 바탕에 깔린 핵심 원리도 자세히 설명하고 있습니다. 각 예제는 모두 HBase 관리자라면 꼭 알아야 할 핵심 내용을 다루고 있으며 예제를 실습하는 동안 자신도 모르는 사이에 HBase 전문가가 될 수 있다고 생각합니다. 이 책을 통해 빅데이터 시대의 데이터베이스 관리에 필수적인 저자의 오랜 실전 경험과 노하우를 전수받을 수 있을 것입니다.

1장 HBase 클러스터 설치
소개
빠르게 시작하기
아마존 EC2 사용하기
하둡 설치
주키퍼 설치
커널 설정 변경
HBase 설치
기본 하둡/주키퍼/HBase 설정
다중 고가용성 마스터 셋팅

2장 데이터 마이그레이션
소개
단일 클라이언트를 사용한 MySQL 데이터 임포트
벌크 로드 툴을 사용한 TSV 파일 임포트
맵리듀스를 사용한 데이터 임포트
HBase에 데이터를 옮기기 전에 리전 생성하기

3장 관리 도구 사용 방법
소개
HBase 마스터 웹 UI
HBase 셸을 사용한 테이블 관리 방법
HBase 셸을 사용한 HBase 데이터 액세스 방법
HBase 셸을 사용한 클러스터 관리 방법
HBase 셸에서 자바 메소드를 실행하는 방법
로우 카운터
WAL 툴: 수동으로 WAL을 분할하고 덤프하기
HFile 툴: HFile의 내용을 텍스트로 보기
HBase hbck: HBase 클러스터의 일관성consistency 확인
하이브를 이용해 HBase 사용하기-SQL 유사 언어를 사용해 HBase에 질의하기

4장 HBase 데이터 백업과 복구
소개
distcp를 이용한 풀 셧다운 백업
CopyTable을 이용한 테이블 간 데이터 복사
HBase 테이블을 HDFS에 덤프 파일로 익스포트하기
HDFS 덤프 파일을 임포트해 HBase 데이터 복구하기
NameNode 메타데이터 백업
리전 시작 키 백업
클러스터 복제

5장 모니터링과 진단
소개
HBase 테이블의 디스크 사용량 보기
HBase 클러스터 모니터한 Ganglia 설치하기
OpenTSDB-HBase를 사용한 HBase 클러스터 모니터
HBase 프로세스 모니터를 한 Nagios 설치
Nagios를 사용한 하둡/HBase 로그 체크
클러스터 상태 보고를 위한 간단한 스크립트
핫 리전-쓰기 진단

6장 관리 유지와 보안
소개
HBase RPC DEBUG 레벨 로깅
그레이스풀 노드 제거
클러스터에 노드 추가
롤링 재시작
간단한 HBase 프로세스 관리 스크립트
간단한 배치 스크립트
하둡과 HBase를 위한 커버로스 인증
커버로스를 사용한 HDFS 보안 설정
HBase 보안 설정

7장 문제 해결
소개
문제 해결 툴
XceiverCount 에러 처리
‘too many open files’ 에러 처리
‘unable to create new native thread’ 에러 처리
‘HBase ignores HDFS client configuration’ 이슈 처리
주키퍼 클라이언트 접속 에러 처리
주키퍼 세션 만료 에러 처리
EC2에서의 HBase 시작 에러 처리

8장 기본 성능 튜닝
소개
디스크 I/O를 분산하도록 하둡 설정하기
하둡의 랙을 인식을 위한 네트워크 토폴로지 스크립트
noatime과 nodiratime을 사용한 디스크 마운트
스왑을 막기 위해 vm.swappiness를 0으로 설정
자바 GC와 HBase 힙 설정
압축 사용
컴팩션 관리
리전 분할 관리

9장 고급 설정과 튜닝
소개
YCSB를 사용한 HBase 클러스터 벤치마킹
리전 서버 핸들러 개수 증가
사용자가 작성한 알고리즘으로 리전 미리 생성하기
쓰기 연산이 많은 클러스터에서 업데이트 대기 피하기
멤스토어의 메모리 크기 튜닝
낮은 지연 시간 시스템의 클라이언트 튜닝
컬럼 패밀리의 블록 캐시 설정
읽기 연산이 많은 클러스터의 블록 캐시 크기 증가
클라이언트 측 스캐너 설정
탐색 성능 향상을 위한 블록 크기 튜닝
전체 처리량 증가를 위한 블룸 필터 활성화

저자소개

이펑 지앙 [저] 신작알림 SMS신청

생년월일	-

해당작가에 대한 소개가 없습니다.

김기성 [역] 신작알림 SMS신청

생년월일	-

해당작가에 대한 소개가 없습니다.

주간랭킹
더보기

상품정보제공고시

판매자정보

인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

상호	(주)교보문고
대표자명	안병현
사업자등록번호	102-81-11670
연락처	1544-1900
전자우편주소	callcenter@kyobobook.co.kr
통신판매업신고번호	01-0653
영업소재지	서울특별시 종로구 종로 1(종로1가,교보빌딩)

교환/환불

반품/교환 방법	‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능
반품/교환가능 기간	변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능 단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환 비용	변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담 상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담
반품/교환 불가 사유	·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우 (단지 확인을 위한 포장 훼손은 제외) ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 예) 화장품, 식품, 가전제품(악세서리 포함) 등 ·복제가 가능한 상품 등의 포장을 훼손한 경우 예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집 ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우 ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
상품 품절	공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음
소비자 피해보상 환불지연에 따른 배상	·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨 ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의소비자 보호에 관한 법률에 따라 처리함

(주)KG이니시스 구매안전서비스

(주)인터파크커머스는 회원님들의 안전거래를 위해 구매금액, 결제수단에 상관없이 (주)인터파크커머스를 통한 모든 거래에 대하여
(주)KG이니시스가 제공하는 구매안전서비스를 적용하고 있습니다.

배송안내

교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.
출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.
군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.
배송비는 업체 배송비 정책에 따릅니다.

- 도서 구매 시 15,000원 이상 무료배송, 15,000원 미만 2,500원

- 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용

인터파크 롯데카드	5% (25,650원) (최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드	30% (18,900원) (최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드	20% (21,600원) (최대할인 4만원 / 2만원 이상 결제)

신한	2~3개월(5만원↑) ※5만원 이상 결제 시 (단, 법인/체크/기업/선불카드/BC 계열 제외)
비씨	2~3개월(5만원↑) ※5만원 이상 결제 시 (단, 법인/체크/기업/선불/Non-BC카드 제외)
국민	2~3개월(5만원↑) ※5만원 이상 결제 시 (단, 법인/체크/기업/선불카드/BC 계열 제외)
삼성	2~5개월(5만원↑) ※5만원 이상 결제 시 (단, 법인/체크/기업/선불카드 제외)
현대	2~3개월(1만원↑) ※1만원 이상 결제 시 (단, 법인/체크/기업/선불카드 제외)
롯데	2~3개월(5만원↑) ※5만원 이상 결제 시 (단, 법인/체크/기업/선불카드/BC 계열 제외)
NH	2~4개월(5만원↑) ※5만원 이상 결제 시 (단, 법인/체크/기업/선불카드/BC 계열 제외)
하나SK	2~3개월(5만원↑) ※5만원 이상 결제 시 (단, 법인/체크/기업/선불카드/BC 계열 제외)

할인혜택	카드할인/무이자 할부 이달의 혜택 도서상품권
적립혜택	1,500P (5%적립) 5만원이상 주문시 2천P+등급별 최대 1.5%적립
	S-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택

배송정보	4/25(목) 이내 발송 예정 (서울시 강남구 삼성로 512) 무료배송
주문수량	감소증가 감소 증가

추가 적립 안내

HBase 클러스터 구축과 관리 : NoSQL데이터베이스 관리를위한 하둡과 HBase클러스터설치에서 고급튜닝까지

이상품의 분류

책소개

출판사 서평

목차

저자소개

주간랭킹
더보기

상품정보제공고시

이벤트 기획전

이 책과 연관있는 항공권

리뷰

0.0 (총 0건)

리뷰쓰기

100자평

작성시 유의사항

100자평

0.0

(총 0건)

최근순

평점 높은순

판매자정보

교환/환불

(주)KG이니시스 구매안전서비스

배송안내

파워링크 광고

추가 적립 안내

HBase 클러스터 구축과 관리 : NoSQL데이터베이스 관리를위한 하둡과 HBase클러스터설치에서 고급튜닝까지

이상품의 분류

책소개

출판사 서평

목차

저자소개

주간랭킹 더보기

상품정보제공고시

이벤트 기획전

이 책과 연관있는 항공권

리뷰 0.0 (총 0건) 리뷰쓰기

100자평 작성시 유의사항

100자평 0.0 (총 0건) 최근순 평점 높은순

판매자정보

교환/환불

(주)KG이니시스 구매안전서비스

배송안내

파워링크 광고

주간랭킹
더보기

리뷰

0.0 (총 0건)

리뷰쓰기

100자평

작성시 유의사항

100자평

0.0

(총 0건)

최근순

평점 높은순