청구할인 안내(인터파크 제휴카드) | 안내
삼성카드 3% (3만원 이상 결제/최대 1만원 할인)
북피니언 롯데카드 30% (최대할인 3만원 / 3만원 이상 결제)
하나SK 북&카드 30% (최대할인 3만원 / 3만원 이상 결제)
EBS 롯데카드 20% (최대할인 3만원 / 3만원 이상 결제)
인터파크 NEW 우리V카드 10% (최대할인 3만원 / 3만원 이상 결제)
인터파크 현대카드 7% (최대할인 3만원 / 3만원 이상 결제)
Close

2013년 9월 9일 이후 누적수치입니다.

추천 엔진을 구축하기 위한 기본서 : R, 파이썬, 스파크, 머하웃, Neo4j를 이용해 추천 엔진 구축 시작하기

원제 : Building Recommendation Engines
판매지수 780
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
정가

33,000원

  • 29,700 (10%할인)

    1,650P (5%적립)

  • 중고판매

    이 책을 인터파크에
    판매하세요

할인혜택
적립혜택자동적립
배송정보
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(277)

  • 사은품(4)

책소개

R, 파이썬(Python), 스파크(Spark), 머하웃(Mahout), Neo4j 기술을 이용하여 협업 필터링, 컨텐츠 기반 추천 엔진, 상황 인지 추천 엔진과 같은 추천 엔진을 구현하는 가이드를 제공한다. 산업계에서 광범위하게 사용되는 다양한 추천 엔진들을 다루기 때문에 실무에 있어서 기본 내용들을 한눈에 파악할 수 있다. 추천 시스템을 구축할 때 일상적으로 사용되는 유명한 데이터 마이닝 기술을 파악할 수 있으며, 추천 엔진의 미래에 대해서 설명하기 때문에 추천 엔진에 대해서 많은 인사이트를 얻을 수 있도록 돕는다.

출판사 서평

이 책에서 다루는 내용

- 첫 번째 추천 엔진 구축 방법
- 추천 엔진을 구축하는 데 필요한 도구
- 공동 작업, 콘텐츠 기반 및 교차 추천과 같은 추천 시스템의 다양한 기법
- 업무를 쉽게 할 수 있는 효율적인 의사 결정 시스템
- 다양한 프레임워크에서의 머신 러닝 알고리즘
- 실제 코드 예제를 사용한 다양한 버전의 추천 엔진 마스터링
- 다양한 추천 시스템의 탐색과 R, 파이썬, 스파크 등의 기술을 이용하는 구현 방법

이 책의 대상 독자

이 책은 R, 파이썬, 스파크, Neo4j, 하둡을 사용한 추천 엔진과 복잡한 예측 의사 결정 시스템을 이해하고 구축하려는 초보자나 관련 경험이 있는 데이터 과학자를 대상으로 한다.

이 책의 구성

1장. '추천 엔진 소개'에서는 데이터 과학자들에게 추천 기능에 대해 다시 설명하고, 초보자들을 위해 추천 엔진을 다룬다. 그리고 사람들이 일상생활에서 사용하는 인기 있는 추천 엔진을 소개하고 인기 있는 추천 엔진의 장점과 단점을 살펴본다.
2장. '첫 번째 추천 엔진 구축하기'에서는 추천 엔진의 세계로 떠나기 전에 영화 추천 엔진을 어떻게 만드는지 간단히 살펴본다.
3장. '추천 엔진 이해'에서는 사용자 기반 협업 필터링 추천 엔진, 항목 기반 협업 필터링, 콘텐츠 기반 추천 엔진, 컨텍스트 기반 추천인(recommender), 하이브리드 추천인, 머신 러닝 모델 및 수학 모델과 같은 모델 기반 추천인 시스템 등 널리 사용되는 다양한 권장 엔진 기술을 설명한다.
4장. '추천 엔진에서 사용되는 데이터 마이닝 기법'에서는 유사성 측정, 분류, 회귀, 차원 축소 기술과 같은 추천 엔진 구축에서 사용되는 다양한 머신 러닝 기술을 다룬다. 추천 엔진의 예측 성능을 테스트하는 평가 측정 항목도 설명한다.
5장. '협업 필터링 추천 엔진 구축하기'에서는 R과 파이썬에서 사용자 기반 협업 필터링과 항목 기반 협업 필터링을 작성하는 방법을 다룬다. 또한 R과 파이썬에서 사용할 수 있는 다양한 라이브러리도 살펴본다. 이 라이브러리는 추천 엔진 구축 시에 광범위하게 사용된다.
6장. '개인화 추천 엔진 구축하기'에서는 R과 파이썬, 그리고 콘텐츠 기반 추천 시스템 및 상황 인식 권장 엔진을 작성하는 데 사용되는 다양한 라이브러리를 사용해 개인화 추천 엔진을 만드는 방법을 설명한다.
7장. '스파크를 사용해 실시간 추천 엔진 구축하기'에서는 실시간 추천 시스템을 구축하는 데 필요한 스파크 및 MLlib의 기본에 대해 설명한다.
8장. 'Neo4j로 실시간 추천 엔진 구축하기'에서는 graphDB와 Neo4j의 기본 개념을 살펴보고 Neo4j를 사용해 실시간 추천 시스템을 구축하는 방법을 설명한다.
9장. '머하웃을 이용한 추천 엔진 구축하기'에서는 확장 가능한 추천 시스템을 구축하는 데 필요한 하둡과 머하웃의 기본 빌딩 블록에 대한 내용을 다룬다. 또한 머하웃과 SVD를 사용해 확장 가능한 시스템을 구축하고, 단계별로 구현하는 데 필요한 아키텍처 관련 내용도 다룬다.
10장. '추천 엔진의 미래: 다음은 무엇일까?'에서는 이전까지 배운 내용을 요약해 설명한다. 그리고 의사 결정 시스템 구축에 사용되는 사례와 추천 시스템의 미래 모습도 살펴본다.

목차

1장. 추천 엔진 소개
추천 엔진 정의
추천 시스템의 필요성
추천 시스템을 운영하는 빅데이터
추천 시스템 종류
- 협업 필터링 추천 시스템
- 콘텐츠 기반 추천 시스템
- 하이브리드 추천 시스템
- 상황 인식 추천 시스템
기술 발전에 따른 추천 시스템의 발전
- 확장 가능한 추천 시스템을 위한 머하웃
- 실시간 확장 가능 추천 시스템을 위한 아파치 스파크
- 실시간 그래프 기반 추천 시스템을 위한 Neo4j
요약

2장. 첫 번째 추천 엔진 구축하기
기본 추천 엔진 구축하기
- 데이터 로드 및 형식 변환
- 사용자 사이의 유사도 계산
- 사용자의 등급 예측
요약

3장. 추천 엔진 이해
추천 엔진의 진화
최근접 이웃 기반 추천 엔진
- 사용자 기반 협업 필터링
- 아이템 기반 협업 필터링
- 장점
- 단점
콘텐츠 기반 추천 시스템
- 아이템 프로필 생성
- 사용자 프로필 생성
- 장점
- 단점
상황 인식 추천 시스템
- 상황의 정의
- 사전 필터링 방식
- 사후 필터링 방식
- 장점
- 단점
하이브리드 추천 시스템
- 가중 방식
- 혼합 방식
- 캐스케이드 방식
- 특징 조합 방식
- 장점
모델 기반 추천 시스템
- 확률적 접근법
- 머신 러닝 접근법
- 수학적 접근법
- 장점
요약

4장. 추천 엔진에서 사용되는 데이터 마이닝 기법
이웃 기반 기법
- 유클리드 거리
- 코사인 유사도
- 자카드 유사도
- 피어슨 상관계수
수학적 모델 기법
- 행렬 인수 분해
- 교대 최소 제곱
- 특이값 분해
머신 러닝 기법
- 선형 회귀
- 분류 모델
- -선형 분류
- -KNN 분류
- -서포트 벡터 머신
- -결정 트리
- -앙상블 방법
클러스터링 기법
- K-평균 클러스터링
차원 축소
- 주성분 분석
벡터 공간 모델
- 단어 빈도
- 단어 빈도-역문서 빈도
평가 기법
- 교차 검증
- 정규화
- -평균 제곱근 오차
- -평균 절대 오차
- -정확도와 재현율
요약

5장. 협업 필터링 추천 엔진 구축하기
RStudio에 recommenderlab 패키지 설치하기
recommenderlab 패키지에서 사용 가능한 데이터 세트
- Jester5K 데이터 세트 탐색
- -설명
- -사용법
- -형식
- -상세 설명
데이터 세트 탐색하기
- 평가 값 탐색하기
recommenderlab으로 사용자 기반의 협업 필터링 구축하기
- 훈련 데이터와 테스트 데이터 준비하기
- 사용자 기반 협업 모델 생성하기
- 테스트 세트에서의 예측
- 데이터 세트 분석하기
- k-교차 검증을 통한 추천 모델 평가하기
- 사용자 기반 협업 필터링 평가하기
아이템 기반 추천인 모델 구축하기
- IBCF 추천인 모델 구축하기
- 모델 평가
- 메트릭을 사용한 모델 정확도
- 플롯을 사용한 모델 정확도
- IBCF의 매개변수 튜닝하기
파이썬을 사용한 협업 필터링
- 필요한 패키지 설치하기
- 데이터 소스
데이터 탐사
- 평가 행렬 표현
- 훈련과 테스트 세트 생성하기
- UBCF를 구축하는 단계
- 사용자 기반 유사도 계산
- 활성 사용자의 알려지지 않은 평가 예측하기
k-최접 이웃과의 사용자 기반 협업 필터링
- 최접 N 이웃 찾기
아이템 기반 추천
- 모델 평가하기
- k-최접 이웃에 대한 훈련 모델
- 모델 평가하기
요약

6장. 개인화 추천 엔진 구축하기
개인화 추천인 시스템
콘텐츠 기반 추천인 시스템
- 콘텐츠 기반 추천 시스템 구축하기
- R을 사용한 콘텐츠 기반 추천
- -데이터 세트 설명
- 파이썬을 사용한 콘텐츠 기반 추천
- -데이터 세트 설명
- -사용자 활동
- -아이템 프로필 생성
- -사용자 프로필 생성
상황 인식 추천인 시스템
- 상황 인식 추천인 시스템 구축하기
- R을 사용한 상황 인식 추천
- -상황 정의하기
- -상황 프로필 생성하기
- -상황 인식 추천 생성하기
요약

7장. 스파크를 사용해 실시간 추천 엔진 구축하기
스파크 2.0
- 스파크 아키텍처
- 스파크 구성 요소
- 스파크 코어
- -스파크 SQL을 이용한 구조화된 데이터
- -스파크 스트리밍을 사용하는 스트리밍 분석
- -MLlib를 사용하는 머신 러닝
- -GraphX를 사용한 그래픽 계산
- 스파크의 장점
- 스파크 셋업하기
- SparkSession에 대해
- RDD
- ML 파이프라인에 대해
교대 최소 제곱을 이용한 협업 필터링
pyspark를 사용한 모델 기반 추천 시스템
MLlib 추천 엔진 모듈
추천 엔진 접근 방식
- 구현 방법
- -데이터 로딩
- -데이터 탐색
- -기본 추천 엔진 만들기
- -예측하기
- 사용자 기반 협업 필터링
- 모델 평가
- 모델 선택 및 하이퍼 매개변수 튜닝
- -교차 유효성 검사
- -CrossValidator
- -학습 유효성 검사 분할
- -ParamMaps/매개변수 설정하기
- -평가자 객체 설정하기
요약

8장. Neo4j로 실시간 추천 엔진 구축하기
서로 다른 그래프 데이터베이스 식별
- 레이블이 지정된 프로퍼티 그래프
- -GraphDB 핵심 개념 이해하기
Neo4j
- Cypher 쿼리 언어
- -Cypher 쿼리 기본
- 노드 문법
- 관계 문법
- 첫 번째 그래프 만들기
- -노드 만들기
- -관계 만들기
- -관계에 프로퍼티 설정하기
- -csv에서 데이터 불러오기
Neo4j 윈도우 버전 설치하기
리눅스에서 Neo4j 설치하기
- Neo4j 다운로드하기
- Neo4j 설정하기
- 명령행에서 Neo4j 시작하기
추천 엔진 만들기
- 데이터를 Neo4j로 보내기
- Neo4j를 사용해 추천 정보 만들기
- 유클리드 거리를 이용한 협업 필터링
- 코사인 유사성을 사용한 협업 필터링
요약

9장. 머하웃을 이용한 추천 엔진 구축하기
머하웃: 개요
머하웃 설정하기
- 독립 모드: 라이브러리로서 머하웃 사용하기
- 분산 모드용 머하웃 설정하기
머하웃의 코어 빌딩 블록
- 사용자 기반 협업 추천 엔진의 컴포넌트
- 머하웃을 사용해 추천 엔진 만들기
- 데이터 세트 내용
- 사용자 기반의 협업 필터링
아이템 기반의 협업 필터링
협업 필터링 평가하기
사용자 기반 추천인 평가
아이템 기반 추천인 평가
SVD 추천
머하웃을 이용한 분산 추천
- 하둡에서의 ALS 추천 방법
확장 가능한 시스템 아키텍처
요약

10장. 추천 엔진의 미래: 다음은 무엇일까?
추천 엔진의 미래
추천 엔진의 단계
- 단계 1: 일반적인 추천 엔진
- 단계 2: 개인화된 추천인 시스템
- 단계 3: 미래 지향적 추천 시스템
- -검색의 종료
- -웹 검색의 종말
- -웹에서의 새로운 등장
- 차선책
- 유스케이스 고려
- -스마트 홈
- -헬스케어 추천인 시스템
- -추천 뉴스
인기 있는 방법론
- 세렌디피티
추천 엔진의 시간적 측면
- A/B 테스트
- 피드백 메커니즘
요약

본문중에서

R, 파이썬(Python), 스파크(Spark), 머하웃(Mahout), Neo4j 기술을 이용해 협업 필터링, 콘텐츠 기반 추천 엔진, 상황 인지 추천 엔진과 같은 추천 엔진을 구현하는 가이드를 제공한다. 이 책에서는 산업계에서 광범위하게 사용되는 다양한 추천 엔진들을 다룬다. 4장에서는 추천 시스템을 구축할 때 일상적으로 사용되는 유명한 데이터 마이닝 기술을 다루며, 마지막 장에서는 추천 엔진의 미래에 대해 간략히 논의하는 시간을 가진다.
('지은이의 말' 중에서)

최근 들어 책이나 영화와 같은 매체를 선택하는 데 도움이 되는 다양한 추천 서비스가 제공되고 있다. 이뿐만 아니라 쇼핑하는 동안에도 구매 욕구를 불러일으키는 다양한 상품들을 추천받기도 한다. 이렇게도 추천 서비스는 머신 러닝의 진화와 함께 기술적으로 눈부시게 발전하고 있다. 1990년대에 연구가 시작됐을 무렵, 추천 시스템은 다소 조잡하고 그다지 정확하지 못했지만 웹 기술이 발전하고 웹사이트 이용자들이 증가함에 따라 그들에 대한 다양한 데이터를 활용하면서 시스템이 빠르게 개선됐다. 또한 딥러닝과 인공지능의 발전으로 추천 시스템은 더욱 정교해져 현재 훨씬 더 개인화된 추천 서비스를 제공한다. 구글, 아마존, 페이스북, 유튜브, 넷플릭스 등의 미국 기업뿐만 아니라 국내 기업에서도 사용자의 활동, 습관 등의 데이터를 수집하고, 딥러닝 기술을 이용해 그 데이터를 분석한 결과를 기반으로 개인 취향에 맞는 콘텐츠를 추천한다. 그리고 이러한 추천 시스템의 효과는 어마어마하다. 아마존의 경우 판매의 35%가 추천 엔진으로부터 비롯됐으며, 넷플릭스의 경우 구독자의 80%가 추천 시스템을 통해 영화를 선택한다고 추정할 뿐 아니라 추천 엔진 덕분에 연간 10억 달러를 절약할 수 있다고 밝혔다. 네이버 역시 인공지능 기반 추천 시스템을 적용해 뉴스 소비량은 약 17%, 동영상 소비량은 약 18% 증가했으며, 이런 성과를 바탕으로 점차 적용 범위를 확대하고 있다. 추천 엔진을 구축하는 데 바탕이 되는 이론을 이해하는 것은 성능이 좋은 추천 엔진을 구축하는 중요한 기반이 된다. 이 책에서는 R 언어를 사용해 콘텐츠 기반의 추천 엔진과 협업 필터링 방식의 추천 엔진을 실제로 구현해볼 뿐만 아니라, 각 추천 엔진의 기반이 되는 이론도 충실하게 다룬다. 이 책이 모든 독자들이 추천 엔진에 대한 기본 이론을 이해하고 정확도가 높은 추천 엔진을 실제로 구현하는 데 많은 도움이 되길 바란다.
('옮긴이의 말' 중에서)

저자소개

수레시 고라칼라(Suresh K. Gorakala) [저] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 2종
판매수 17권

인공지능에 주력하는 데이터 과학자다. 여러 도메인의 다양한 글로벌 고객과 협력하며, 향상된 빅데이터 분석 기법을 사용해 비즈니스 문제를 해결하는 데 기여하고 있다. 추천 엔진, 자연어 처리, 고급 머신 러닝, 그래프 데이터베이스와 관련된 폭넓은 작업을 했으며, [R로 만드는 추천 시스템](에이콘, 2017)을 공동 저술했다. 열정적인 여행자며, 취미 생활로 사진 작가를 겸하기도 한다.

저자의 다른책

전체보기
테크 트랜스 그룹 T4 [역] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 0종
판매수 0권

최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경에서 오픈소스를 활용해 프레임워크를 구축하는 데 관심이 많으며, 최근에는 모바일을 접목한 하이브리드 환경에서의 HTML5, 스프링(Spring), NoSQL, React.js, Node.js 등의 기술과 빅데이터/데이터 분석 기술에 주목하고 있다. 또한 오픈소스 기반의 다양한 데이터베이스를 플랫폼 개발에 활용하는 데도 관심이 많다. 에이콘출판사가 펴낸 [구글 애널리틱스로 하는 데이터 분석 3/e](2017), [웹 개발자 레퍼런스 가이드](2017) 등을 번역했다.

이 상품의 시리즈

acorn+PACKT 시리즈(총 300권 / 현재구매 가능도서 278권)

펼쳐보기

리뷰

0.0 (총 0건)

기대평

작성시 유의사항

평점
0/200자
등록하기

기대평

0.0

교환/환불

교환/환불 방법

‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

교환/환불 가능 기간

고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

교환/환불 비용

고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

교환/환불 불가사유

반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

소비자 피해보상

소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

기타

도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

배송안내

  • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

  • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

  • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

  • 배송비

도서(중고도서 포함) 구매

2,000원 (1만원이상 구매 시 무료배송)

음반/DVD/잡지/만화 구매

2,000원 (2만원이상 구매 시 무료배송)

도서와 음반/DVD/잡지/만화/
중고직배송상품을 함께 구매

2,000원 (1만원이상 구매 시 무료배송)

업체직접배송상품 구매

업체별 상이한 배송비 적용