간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (30,780원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (22,680원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (25,920원)
(최대할인 4만원 / 2만원 이상 결제)
Close

R을 활용한 머신러닝 : R로 머신러닝 알고리즘 작성, 데이터 준비, 데이터 예측 기법 깊이 파기

원제 : Machine Learning with R - 3rd ed
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 406
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

36,000원

  • 32,400 (10%할인)

    1,800P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
주문수량
감소 증가

* 배송예정일이 오늘이나 내일인 경우 1) 당일/하루배송 보장! 2) 배송 지연 시 I-Point 2,000P또는 4,000원 도서상품권 지급 &n 더보기

책소개

이 책을 읽다 보면 ‘머신러닝이 이렇게 쉬운 것이라니?’라는 생각이 들기도 하고, 수학이나 프로그래밍 언어를 잘 몰랐어도 직관적으로 머릿속에 쏙쏙 들어오는 머신러닝 개념에 흥미를 느끼고 있는 자신을 발견하게 될 것이다. 몇 줄의 R 코드로 머신러닝이 어떻게 작동되는지 눈으로 직접 확인할 수 있고 최신 기법까지 내 손으로 직접 짜 볼 수 있는 짜릿한 경험과 자신감을 제공하는 것이 이 책의 매력이다. 머신러닝을 즐겁게 시작하고 싶은 독자 여러분에게 이 책을 추천한다.
3판에서는 정돈된 데이터를 만드는 방법을 새롭게 설명하고 최신 버전의 예제를 제공한다.

출판사 서평

★ 이 책에서 다루는 내용 ★

■ 머신러닝의 근원과 컴퓨터가 예시를 학습하는 원리
■ R 프로그래밍 언어를 사용해 머신러닝 작업에 맞도록 데이터 준비
■ 최근접 이웃과 베이즈 기법을 사용해 중요한 결과 분류
■ 결정트리, 규칙, 서포트 벡터 머신을 사용한 미래의 사건 예측
■ 회귀 기법을 사용한 수치 데이터 예측 및 금융 수치 추정
■ 신경망을 사용해 복잡한 프로세스 모델링
■ 모델 평가 및 성능 개선
■ R을 Spark, H2O, TensorFlow 등 SQL 데이터베이스나 떠오르는 빅데이터 기술과 연결

★ 이 책의 대상 독자 ★

데이터를 활용하고자 하는 모든 이를 위해 썼다. 머신러닝을 어느 정도 알고 있지만 R은 전혀 사용해보지 않았거나 조금만 아는 독자를 염두하고 썼으며 어떤 경우든 이 책은 빠른 학습을 지원한다. 기초 수학과 프로그램에 익숙하다면 다소 도움이 되겠지만 어떠한 경험도 필수요건은 아니다. 필요한 것은 호기심뿐이다.

★ 이 책의 구성 ★

1장, ‘머신러닝 소개’에서는 기계 학습자(machine learner)를 정의하고 구분해주는 용어와 개념을 살펴보고, 학습 작업을 적절한 알고리즘에 매칭하는 방법을 제시한다.
2장, ‘데이터의 관리와 이해’에서는 R을 이용해서 데이터를 직접 다룰 수 있는 기회를 제공한다. 데이터를 로딩하고, 탐색하고, 이해하는 데 사용되는 필수 데이터 구조와 절차를 설명한다.
3장, ‘게으른 학습: 최근접 이웃을 사용한 분류’에서는 단순하지만 강력한 머신러닝 알고리즘을 이해하고, 첫 번째 실제 작업인 암의 악성 샘플 식별에 적용하는 방법을 알려준다.
4장, ‘확률적 학습: 나이브 베이즈 분류’에서는 최첨단 스팸 필터링 시스템에서 사용하고 있는 확률의 핵심 개념을 소개한다. 독자는 자신만의 스팸 필터를 개발하는 과정에서 텍스트 마이닝의 기초를 배울 수 있다.
5장, ‘분할 정복: 의사 결정 트리와 규칙 기반의 분류’에서는 예측을 정확하고 쉽게 설명하는 두 가지 학습 알고리즘을 탐색한다. 이 방법은 투명성이 중요한 작업에 적용된다.
6장, ‘수치 데이터 예측: 회귀 방법’에서는 수치 예측에 사용되는 머신러닝 알고리즘을 소개한다. 이 기법은 통계 분야에 아주 많이 포함돼 있으므로, 수치 관계를 이해하는 데 필요한 필수 척도도 함께 알아본다.
7장, ‘블랙박스 방법: 신경망과 서포트 벡터 머신’에서는 복잡하고 강력한 두 종류의 머신러닝 알고리즘을 다룬다. 수학이 위협적으로 보일 수 있겠지만, 내부 작동을 보여주는 예제와 함께 간단한 용어로 진행한다.
8장, ‘패턴 찾기: 연관 규칙을 이용한 장바구니 분석’에서는 많은 소매업체가 채택한 추천 시스템의 알고리즘을 접할 수 있다. 소매업체가 나의 구매 습관을 나보다 더 잘 아는 이유가 궁금한 적이 있었다면 8장에서 그 비밀을 밝혀준다.
9장, ‘데이터 그룹 찾기: k-평균 군집화’에서는 관련 아이템을 군집화하는 절차를 알아본다. 이 알고리즘을 활용해 온라인 커뮤니티에서 프로파일을 식별한다.
10장, ‘모델 성능 평가’에서는 머신러닝 프로젝트의 성공 여부를 측정하고 미래 데이터에 대해 학습자가 신뢰할 만한 성능 추정치를 얻는 방법의 정보를 제공한다.
11장, ‘모델 성능 개선’에서는 머신러닝 대회의 최상위 팀이 사용하는 방법을 소개한다. 경쟁이 심하거나 데이터를 최대한 활용하고 싶다면 이런 기술을 레퍼토리에 추가해야 한다.
12장, ‘특화된 머신러닝 주제’에서는 머신러닝의 최첨단 분야를 탐구한다. 빅데이터로 작업하는 것에서 더 빠르게 R 작업하는 것까지 12장에서 다루는 주제는 R로 할 수 있는 범위를 넓히는 데 도움이 된다.

★ 옮긴이의 말 ★

평소에 어떤 것이 너무 궁금해서 공부는 하고 싶은데 “과연 할 수 있을까?” 걱정만 하다가 어느 날 아주 우연히 어떤 글이나 책을 보고 “아! 이렇게 쉬운 거였어?”하며 아주 허탈해한 적이 있을 것이다. 아마도 머신러닝을 시작하고 싶은 많은 분께 이 책이 그런 경험을 선사하지 않을까 생각한다.
이 책은 수학이나 프로그래밍 언어에 대한 깊은 지식이 없이도 머신러닝의 개념을 직관적으로 이해하고, 어떻게 활용하면 되는지를 아주 쉽게 설명한다. 간결한 몇 줄의 R 코드로 머신러닝의 존재감을 입증하면서 말이다. 그렇다고 결코 가볍지만은 않은 것이 이 책의 매력이다. 3판에서 저자는 기존의 여러 예제를 최신의 예제로 바꾸거나 추가하고, 머신러닝이 발전해 오면서 변화하는 트렌드를 책에 반영했다. 빠르게 변하는 머신러닝 세상을 보다 정확하게 독자에게 전달하고자 하는 저자의 세심한 배려가 돋보인다다. 머신러닝을 즐겁게 시작하고 싶은 독자 분들께 이 책을 추천한다. 처음으로 머신러닝을 배우고자 하는 사람은 물론 최신의 경향을 알고자 하는 사람에게도 좋은 영감을 제공해 줄 것이다.

목차

1장. 머신러닝 소개
__머신러닝의 기원
__머신러닝의 사용과 남용
____머신러닝 성공 사례
____머신러닝의 한계
____머신러닝의 윤리
__기계의 학습 방법
____데이터 저장소
____추상화
____일반화
____평가
__실전 머신러닝
____입력 데이터 형식
____머신러닝 알고리즘 형식
____입력 데이터와 알고리즘 매칭
__R을 이용한 머신러닝
____R 패키지 설치
____패키지 로딩과 언로딩
____RStudio 설치
__요약

2장. 데이터의 관리와 이해
__R 데이터 구조
____벡터
____팩터
____리스트
____데이터 프레임
____행렬과 배열
__R을 이용한 데이터 관리
____데이터 구조 저장, 로드, 제거
____CSV 파일에서 데이터 임포트와 저장
__데이터 탐색과 이해
____데이터 구조 탐색
____수치 변수 탐색
____범주 변수 탐색
____변수 간의 관계 탐색
__요약

3장. 게으른 학습: 최근접 이웃을 사용한 분류
__최근접 이웃 분류의 이해
____k-NN 알고리즘
____k-NN 알고리즘이 게으른 이유
__예제: k-NN 알고리즘으로 유방암 진단
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

4장. 확률적 학습: 나이브 베이즈 분류
__나이브 베이즈의 이해
____베이지안 기법의 기본 개념
____나이브 베이즈 알고리즘
__예제: 나이브 베이즈 알고리즘을 이용한 휴대폰 스팸 필터링
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

5장. 분할 정복: 의사 결정 트리와 규칙 기반의 분류
__의사 결정 트리의 이해
____분할 정복
____C5.0 의사 결정 트리 알고리즘
__예제: C5.0 의사 결정 트리를 이용한 위험 은행 대출 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__분류 규칙 이해
____분리 정복
____1R 알고리즘
____리퍼 알고리즘
____의사 결정 트리에서 규칙 구성
____무엇이 트리와 규칙을 탐욕스럽게 만드는가?
__예제: 규칙 학습자를 이용한 독버섯 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

6장. 수치 데이터 예측: 회귀 방법
__회귀의 이해
____단순 선형 회귀
____보통 최소 제곱 추정
____상관관계
____다중 선형 회귀
__예제: 선형 회귀를 이용한 의료비 예측
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__회귀 트리와 모델 트리의 이해
____트리에 회귀 추가
__예제: 회귀 트리와 모델 트리로 와인 품질 평가
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

7장. 블랙박스 방법: 신경망과 서포트 벡터 머신
__신경망의 이해
____생물학적 뉴런에서 인공 뉴런으로
____활성 함수
____네트워크 토폴로지
____역전파로 신경망 훈련
__예제: ANN으로 콘크리트 강도 모델링
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__서포트 벡터 머신의 이해
____초평면을 이용한 분류
____비선형 공간을 위한 커널의 사용
__예제: SVM으로 OCR 수행
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 향상
__요약

8장. 패턴 찾기: 연관 규칙을 이용한 장바구니 분석
__연관 규칙의 이해
____연관 규칙 학습을 위한 아프리오리 알고리즘
____규칙 흥미 측정: 지지도와 신뢰도
____아프리오리 원칙을 이용한 규칙 집합의 구축
__예제: 연관 규칙으로 자주 구매되는 식료품 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

9장. 데이터 그룹 찾기: k-평균 군집화
__군집화의 이해
____머신러닝 작업으로서 군집화
____k-평균 군집화 알고리즘
__k-평균 군집화를 이용한 십대 시장 세분화 발굴
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

10장. 모델 성능 평가
__분류 성능 측정
____분류기의 예측 이해
____혼동 행렬 자세히 보기
____혼동 행렬을 사용한 성능 측정
____정확도를 넘어: 다른 성능 척도
____ROC 곡선으로 성능 트레이드오프 시각화
__미래의 성능 예측
____홀드아웃 방법
__요약

11장. 모델 성능 개선
__성능 개선을 위한 신용 모델 튜닝
____자동 파라미터 튜닝을 위한 caret 사용
__메타학습으로 모델 성능 개선
____앙상블의 이해
____배깅
____부스팅
____랜덤 포레스트
__요약

12장. 특화된 머신러닝 주제
__실세계 데이터 관리와 준비
____tidyverse 패키지를 이용한 정돈된 데이터 만들기
____외부 파일에서 읽고 쓰기
____SQL 데이터베이스의 데이터 쿼리
__온라인 데이터와 서비스 작업
____웹 페이지의 전체 텍스트 다운로드
____웹 페이지에서 데이터 파싱
__도메인에 특화된 데이터 작업
____생체 정보학 데이터 분석
____네트워크 데이터 분석과 시각화
__R 성능 개선
____대용량 데이터셋 관리
____병렬 컴퓨팅으로 더 빠른 학습
____최적 학습 알고리즘 도입
____GPU 컴퓨팅
__요약

저자소개

브레트 란츠 [저] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 0종
판매수 0권

해당작가에 대한 소개가 없습니다.

윤성진, (주)크라스랩 [역] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 0종
판매수 0권

해당작가에 대한 소개가 없습니다.

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    0.0

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    판매자

    (주)교보문고

    상호

    (주)교보문고

    사업자 종류

    법인사업자

    사업자번호

    102-81-11670

    연락처

    1544-1900

    이메일

    callcenter@kyobobook.co.kr

    통신판매 신고 번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시, 1만 원 이상 무료, 1만원 미만 2천 원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용