간편결제, 신용카드 청구할인
PAYCO(페이코) 최대 5,000원 할인
(페이코 신규 회원 및 90일 휴면 회원 한정)
네이버페이 1%
(네이버페이 결제 시 적립)
북피니언 롯데카드 30% (21,420원)
(최대할인 3만원 / 3만원 이상 결제)
EBS 롯데카드 20% (24,480원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 NEW 우리V카드 10% (27,540원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 현대카드 7% (28,460원)
(최대할인 3만원 / 3만원 이상 결제)
Close

가볍게 시작하는 통계학습 : R로 실습하는

원제 : An Introduction to Statistical Learning: with Applications in R
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 2,468
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

34,000원

  • 30,600 (10%할인)

    1,700P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 출고완료 후 14일 이내 마이페이지에서 적립받기한 경우만 적립됩니다.
  • 추가혜택
    배송정보
    •  당일배송을 원하실 경우 주문시 당일배송을 선택해주세요.
    • 서울시 강남구 삼성로 512변경
    • 배송지연보상 안내
    • 무료배송
    • 해외배송가능
    주문수량
    감소 증가
    • 북카트 담기
    • 바로구매
    • 매장픽업
    • 이벤트/기획전

    • 연관도서

    • 사은품(5)

    책소개

    기계학습의 필수 요소인 통계적 학습의 이론적 개념과 활용 기법 소개!

    이 책은 기계학습의 필수 요소인 통계적 학습의 이론적 개념과 활용 기법을 소개하고 다양한 모델링과 예측 기법을 어떻게 적용할 수 있는지를 예제와 Lab을 통해 보여준다. 각 장의 내용은 이공계 배경지식이 없어도 이해하는 데 큰 어려움이 없다. Lab은 R을 사용하여 실행하며 각 장에서 설명한 모든 통계적 방법에 대한 코드는 충분히 설명되어 있다. 실제 데이터를 사용한 R 프로그래밍 예제는 실질적인 경험을 제공하며 통계학습과 기계학습을 어떻게 구현하는지에 대한 명확하고 직관적인 가이드를 제공한다.

    출판사 서평

    * 이 책은 1도(흑백)로 되어 있습니다. 컬러 그래프는 원문 PDF에서 확인할 수 있습니다. 원문 PDF는 루비페이퍼 자료실이나 다음 링크에서 내려받을 수 있습니다.
    - 원문 PDF: http://www-bcf.usc.edu/~gareth/ISL/

    이 책은 10장으로 구성되어 있다.
    1장은 통계적 학습의 몇 가지 응용을 보여주는 데 사용되는 실제 자료인 Wage 자료, 주식시장 자료, 그리고 유전자 발현 자료에 대해 소개하고 책 전반에 걸쳐 사용될 표기법과 간단한 행렬 대수를 살펴본다.
    2장은 통계학습의 기본 개념을 살펴보고 모델의 추정방법과 예측 정확도, 그리고 모델의 정확도 평가에 대해 알아본다. 또한, R에 대한 기본적인 사용법에 대해 간략히 소개한다.
    3장에서는 단순한 지도학습 기법인 선형회귀의 주요 개념과 모델의 적합에 이용되는 최소제곱법에 대해 알아보고 질적 설명변수의 처리와 선형모델의 확장에 대해 다룬다.
    4장은 질적 반응변수를 예측하는 방법인 분류에 대해 다루며 광범위하게 사용되는 분류기인 로지스틱 회귀, 선형판별분석, k-최근접이웃에 대해 살펴본다.
    5장은 훈련 데이터의 일부를 사용하여 동일한 통계적 방법을 여러 번 적합하여 정보를 얻는 재표본추출 방법에 대해 다룬다. 여기서는 가장 일반적으로 사용되는 2가지 재표본추출 방법인 교차검증과 붓스트랩에 대해 상세히 살펴본다.
    6장은 최소제곱적합을 다른 적합절차로 바꾸어 단순선형모델을 개선할 수 있는 방법에 대해 다룬다. 여기서는 반응변수와 관련이 있는 설명변수들의 서브셋을 찾는 부분집합 선택, 계수 추정치들을 제한하여 추정치들의 분산을 줄일 수 있는 수축방법, 원래의 설명변수보다 작은 수의 변환된 변수들을 사용하는 차원축소에 대해 자세히 살펴본다.
    7장에서는 선형모델의 해석력은 높게 유지하면서 선형성에 대한 가정은 완화하는 선형모델의 확장에 대해 다루며, 다항식회귀와 계단함수와 같은 단순한 선형모델의 확장뿐만 아니라 스플라인, 국소회귀, 그리고 일반화가법모델과 같은 정교한 기법에 대해서도 살펴본다.
    8장은 설명변수의 공간을 다수의 영역으로 분할하는 회귀와 분류에 대한 트리 기반의 방법에 대해 다루며, 의사결정트리와 트리의 장단점에 대해 살펴보고 다중트리를 통해 예측 정확도를 개선하는 배깅, 랜덤 포리스트, 부스팅에 대해 알아본다.
    9장은 다양한 설정에서 최상의 분류기 중 하나로 알려진 서포트 벡터 머신에 대해 소개하고 비선형 결정경계를 수용하도록 확장하는 것에 대해 살펴본다.
    10장에서는 연관된 반응변수 없이 측정된 설명변수들만으로 데이터에서 흥미로운 것을 발견하고자 하는 비지도학습에 대해 다루며, 데이터의 시각화 또는 전처리에 사용되는 주성분분석과 관측치들의 서브그룹을 찾아내는 데 이용되는 클러스터링에 대해 자세히 알아본다.

    추천사

    이 책은 수학/통계 또는 컴퓨터 공학이 전공이 아닌데, 데이터마이닝/머신러닝에 관심이 있는 초보자들에게 유용하다. 특히 산업공학이나 화학공학, 바이오인포메틱스 등의 응용분야에서 데이터 분석을 하는 이들에게 적합하다. 학부 수준의 교육을 받았다면(처음에는 조금 익숙지 않을 수도 있으나) 충분히 이해할 수 있다. 모든 챕터에서 개념을 설명하는 것에 더해서, 챕터 말미에는 그 챕터에서 다룬 내용을 R을 이용해서 분석하는 예제도 함께 수록되었기 때문에, 수식이나 이론을 도출하는 수학/통계학자 또는 새로운 알고리즘/애플리케이션을 구현해야 하는 컴공 전공자가 아닌, 응용분야의 공학자들에게 안성맞춤이다. 물론 단점도 있다. Murphy의 책에서 다루듯이 이 분야의 거의 전체를 다루지는 않는다. 심화학습이 필요한 이들에게는 별로 추천하지 않는다. 그리고 책이 지나치게 Supervised, Regression, 선형성에 초점을 맞춰져 있다. 즉, unsupervised나 비선형성 문제/해법은 많이 다루지 않는다. (초보자들에게는 이게 더 큰 장점일 수도 있다.) 물론 이를 베이스로해서 더 학습하면 좋은 결과를 얻을 수 있으리라 믿는다. 보통의 데이터마이닝 책이 분류 classification을 베이스로 다루는데, 회귀분석 regression을 베이스로 다루는 것이 조금 특이하다. 그리고 회귀분석에서 최근에 나온 Ridge regression과 Lasso를 다뤄서 개인적으로 많은 도움이 되었다. 일부 알고리즘은 더 자세히 다뤄줬으면 좋겠다는 생각이 들지만, R을 이용해서 실전에서 해당 알고리즘을 사용하는 데는 문제가 없다. 수학/통계 및 컴퓨터공학 비전공자들 중에서 데이터마이닝/데이터분석에 관심이 있다면 시작하기에 안성맞춤인 책이다. 더 공부하고 싶으면 Murphy의 책이나 다른 책들을 참조하면 된다.
    - 정부환 / 데이터사이언티스트@카카오

    목차

    1 도입(introduction)
    1.1 통계학습의 개요
    1.2 통계학습의 간단한 역사
    1.3 표기법과 간단한 행렬 대수
    1.4 Lab과 연습문제에 사용된 자료

    2 통계학습(Statistical Learning)
    2.1 통계학습이란?
    2.1.1 f를 추정하는 이유는?
    2.1.2 어떻게 f를 추정하는가?
    2.1.3 예측 정확도와 모델 해석력 사이의 절충(Trade-Off)
    2.1.4 지도학습과 비지도학습
    2.1.5 회귀와 분류문제
    2.2 모델의 정확도 평가
    2.2.1 적합의 품질 측정
    2.2.2 편향-분산 절충
    2.2.3 분류 설정
    2.3 Lab: R에 대한 소개
    2.3.1 기본 명령어
    2.3.2 그래프
    2.3.3 데이터 인덱싱(Indexing)
    2.3.4 데이터 로딩(Loading)
    2.3.5 추가적인 그래프와 수치 요약
    2.4 연습문제

    3 선형회귀(Linear Regression)
    3.1 단순선형회귀
    3.1.1 계수 추정
    3.1.2 계수 추정값의 정확도 평가
    3.1.3 모델의 정확도 평가
    3.2 다중선형회귀
    3.2.1 회귀계수의 추정
    3.2.2 몇 가지 중요한 질문
    3.3 회귀모델에서 다른 고려할 사항
    3.3.1 질적 설명변수
    3.3.2 선형모델의 확장
    3.3.3 잠재적 문제
    3.4 마케팅 플랜(Marketing Plan)
    3.5 선형회귀와 K-최근접이웃의 비교
    3.6 Lab: 선형회귀
    3.6.1 라이브러리
    3.6.2 단순선형회귀
    3.6.3 다중선형회귀
    3.6.4 상호작용 항
    3.6.5 설명변수의 비선형 변환
    3.6.6 질적 설명변수
    3.6.7 함수의작성
    3.7 연습문제

    4 분류(Cassification)
    4.1 분류의 개요
    4.2 왜 선형회귀를 사용하지 않는가?
    4.3 로지스틱 회귀(Logistic Regression)
    4.3.1 로지스틱 모델
    4.3.2 회귀계수의 추정
    4.3.3 예측하기
    4.3.4 다중로지스틱 회귀
    4.3.5 반응변수의 클래스가 2개보다 많은 로지스틱 회귀
    4.4 선형판별분석(Linear Discriminant Analysis)
    4.4.1 분류를 위한 베이즈 정리의 사용
    4.4.2 선형판별분석(p = 1)
    4.4.3 선형판별분석(p > 1)
    4.4.4 이차선형판별분석
    4.5 분류방법의 비교
    4.6 Lab: 로지스틱 회귀, LDA, QDA, KNN
    4.6.1 주식시장자료
    4.6.2 로지스틱 회귀
    4.6.3 선형판별분석
    4.6.4 이차판별분석
    4.6.5 K-최근접이웃
    4.6.6 Caravan 보험 자료에 적용
    4.7 연습문제

    5 재표본추출 방법
    5.1 교차검증(Cross-Validation)
    5.1.1 검증셋 기법(Validation Set Approach)
    5.1.2 LOOCV(Leave-One-Out Cross-Validation)
    5.1.3 k-fold 교차검증
    5.1.4 k-fold 교차검증에 대한 편향-분산 절충
    5.1.5 분류문제에 대한 교차검증
    5.2 붓스트랩(Bootstrap)
    5.3 Lab: 교차검증과 붓스트랩
    5.3.1 검증셋 기법
    5.3.2 LOO(Leave-One-Out) 교차검증
    5.3.3 k-fold 교차검증
    5.3.4 붓스트랩
    5.4 연습문제

    6 선형모델 선택 및 Regularization
    6.1 부분집합 선택
    6.1.1 최상의 부분집합 선택
    6.1.2 단계적 선택
    6.1.3 최적의 모델 선택
    6.2 Shrinkage 방법
    6.2.1 능형회귀
    6.2.2 Lasso
    6.2.3 조율 파라미터 선택
    6.3 차원축소 방법
    6.3.1 주성분회귀
    6.3.2 부분최소제곱
    6.4 고차원의 고려
    6.4.1 고차원 데이터
    6.4.2 고차원에서 무엇이 문제인가?
    6.4.3 고차원에서의 회귀
    6.4.4 고차원에서의 결과 해석
    6.5 Lab 1: 부분집합(서브셋) 선택 방법
    6.5.1 최상의 서브셋 선택
    6.5.2 전진 및 후진 단계적 선택
    6.5.3 검증셋 기법과 교차검증을 사용한 모델 선택
    6.6 Lab 2: 능형회귀와 Lasso
    6.6.1 능형회귀
    6.6.2 Lasso
    6.7 Lab 3: PCR과 PLS 회귀
    6.7.1 주성분회귀
    6.7.2 부분최소제곱
    6.8 연습문제

    7 선형성을 넘어서
    7.1 다항식회귀
    7.2 계단함수
    7.3 기저함수
    7.4 회귀 스플라인
    7.4.1 조각별 다항식
    7.4.2 제약조건과 스플라인
    7.4.3 스플라인 기저 표현
    7.4.4 매듭의 수와 위치 선택
    7.4.5 다항식회귀와 비교
    7.5 평활 스플라인
    7.5.1 평활 스플라인의 개요
    7.5.2 평활 파라미터 λ의 선택
    7.6 국소회귀
    7.7 일반화가법모델(Generalized Additive Models)
    7.7.1 회귀문제에 대한 GAMs
    7.7.2 분류문제에 대한 GAMs
    7.8 Lab: 비선형모델링
    7.8.1 다항식회귀와 계단함수
    7.8.2 스플라인(Splines)
    7.8.3 GAMs
    7.9 연습문제

    8 트리 기반의 방법
    8.1 의사결정트리의 기초
    8.1.1 회귀트리
    8.1.2 분류트리
    8.1.3 트리와 선형모델
    8.1.4 트리의 장단점
    8.2 배깅, 랜덤 포리스트, 부스팅
    8.2.1 배깅(Bagging)
    8.2.2 랜덤 포리스트(Random Forests)
    8.2.3 부스팅(Boosting)
    8.3 Lab: 의사결정 트리
    8.3.1 분류트리 적합
    8.3.2 회귀트리 적합
    8.3.3 배깅(Bagging)과 랜덤 포리스트(Random Forest)
    8.3.4 부스팅(Boosting)
    8.4 연습문제

    9 서포트 벡터 머신(Support Vector Machines)
    9.1 최대 마진 분류기
    9.1.1 초평면은 무엇인가?
    9.1.2 분리 초평면(Separating Hyperplane)을 사용한 분류
    9.1.3 최대 마진 분류기
    9.1.4 최대 마진 분류기의 구성
    9.1.5 분류 불가능한 경우
    9.2 서포트 벡터 분류기
    9.2.1 서포트 벡터 분류기의 개요
    9.2.2 서포트 벡터 분류기의 세부 사항
    9.3 서포트 벡터 머신
    9.3.1 비선형 결정경계를 가진 분류
    9.3.2 서포트 벡터 머신
    9.3.3 심장질환 자료에 적용
    9.4 클래스가 2개보다 많은 SVM
    9.4.1 일대일 분류
    9.4.2 일대전부(One-Versus-All) 분류
    9.5 로지스틱 회귀에 대한 상관관계
    9.6 Lab: 서포트 벡터 머신
    9.6.1 서포트 벡터 분류기
    9.6.2 서포트 벡터 머신
    9.6.3 ROC 곡선
    9.6.4 다중클래스 SVM
    9.6.5 유전자 발현 자료에 적용
    9.7 연습문제

    10 비지도학습(Unsupervised Learning)
    10.1 비지도학습의 어려움
    10.2 주성분분석
    10.2.1 주성분은 무엇인가?
    10.2.2 주성분의 다른 해석
    10.2.3 PCA에 대해 더 알아보기
    10.2.4 주성분에 대한 다른 사용 예
    10.3 클러스터링 방법
    10.3.1 K-평균 클러스터링
    10.3.2 계층적 클러스터링
    10.3.3 클러스터링에서의 실질적 이슈
    10.4 Lab 1: 주성분분석
    10.5 Lab 2: 클러스터링
    10.5.1 K-평균 클러스터링
    10.5.2 계층적 클러스터링
    10.6 Lab 3: NCI60 데이터 예제
    10.6.1 NCI60 데이터에 대한 PCA
    10.6.2 NCI60 데이터의 관측치에 대한 클러스터링
    10.7 연습문제

    저자소개

    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    [가볍게 시작하는 통계학습]

    Daniela Witten [저] 신작알림 SMS신청 작가DB보기
    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    [가볍게 시작하는 통계학습]

    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    [가볍게 시작하는 통계학습]

    Robert Tibshirani [저] 신작알림 SMS신청 작가DB보기
    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    [가볍게 시작하는 통계학습]

    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    IT 번역 전문 그룹 장독대 멤버

    역자의 다른책

    전체보기

    이 책과 내용이 비슷한 책 ? 내용 유사도란? 이 도서가 가진 내용을 분석하여 기준 도서와 얼마나 많이 유사한 콘텐츠를 많이 가지고 있는가에 대한 비율입니다.

      리뷰

      0.0 (총 0건)

      기대평

      작성시 유의사항

      평점
      0/200자
      등록하기

      기대평

      10.0

      교환/환불

      교환/환불 방법

      ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

      교환/환불 가능 기간

      고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

      교환/환불 비용

      고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

      교환/환불 불가사유

      반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
      배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

      소비자 피해보상

      소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
      교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

      기타

      도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

      배송안내

      • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

      • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

      • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

      • 배송비

      도서(중고도서 포함) 구매

      2,000원 (1만원이상 구매 시 무료배송)

      음반/DVD/잡지/만화 구매

      2,000원 (2만원이상 구매 시 무료배송)

      도서와 음반/DVD/잡지/만화/
      중고직배송상품을 함께 구매

      2,000원 (1만원이상 구매 시 무료배송)

      업체직접배송상품 구매

      업체별 상이한 배송비 적용