간편결제, 신용카드 청구할인
네이버페이 1%
(네이버페이 결제 시 적립)
NH(올원페이)카드 12% (27,720원)
(3만원 이상 결제/최대 1만원 할인)
북피니언 롯데카드 30% (22,050원)
(최대할인 3만원 / 3만원 이상 결제)
하나SK 북&카드 30% (22,050원)
(최대할인 3만원 / 3만원 이상 결제)
EBS 롯데카드 20% (25,200원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 NEW 우리V카드 10% (28,350원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 현대카드 7% (29,300원)
(최대할인 3만원 / 3만원 이상 결제)
Close

머신 러닝과 통계 : 파이썬과 R로 배우는 머신 러닝

원제 : Statistics for Machine Learning: Techniques for exploring supervised, unsupervised, and reinforcement learning models with Python and R

2013년 9월 9일 이후 누적수치입니다.

판매지수 614
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

35,000원

  • 31,500 (10%할인)

    1,750P (5%적립)

할인혜택
적립혜택자동적립
배송정보
주문수량
감소 증가
  • 이벤트/기획전(1)

  • 연관도서(321)

  • 사은품(3)

책소개

통계와 머신 러닝의 관계에 대해 기초적인 개념을 정립할 수 있도록 돕는다. 또한 지도학습, 비지도학습, 강화학습에 이르기까지 머신 러닝에서 주로 사용되는 대부분의 기법에 대해 파이썬과 R 예제를 제공한다.
책의 초반에 통계와 머신 러닝의 전반적인 관계에 대해 설명한 다음, 지도학습, 비지도학습, 강화학습 순으로 각각의 기법에서 통계적 방법과 머신 러닝 기법을 비교하며 설명한다. 거의 대부분의 예제에 대해서 파이썬과 R 코드를 같이 제공하기 때문에 코드를 직접 실행해 가면서 책을 읽을 수 있다.

출판사 서평

[이 책에서 다루는 내용]

- 모델 구축에 필요한 머신 러닝과 통계학 기초 이해
- 문제 해결을 위한 통계적 방식과 머신 러닝 방식 사이의 차이점 및 유사점 이해
- 데이터를 준비하는 방법 및 준비된 데이터로 R과 파이썬 패키지의 머신 러닝 알고리즘을 사용해 모델을 직접 구축하는 방법
- 결과를 분석하고 목적에 맞게끔 모델을 튜닝하는 방법
- 머신 러닝을 위해 필요한 통계학 개념 이해
- 지도학습과 딥러닝 비지도학습 모델에 필요한 필수 기초 지식
- 강화학습과 인공지능 응용분야

[이 책의 대상 독자]

이 책은 머신 러닝을 시스템에 구현하려는 사람이라면 통계학 지식의 유무와 상관없이 읽을 수 있다. R과 파이썬 프로그래밍에 관한 사전 지식은 많은 도움이 된다.

[이 책의 구성]

1장, '통계로부터 머신 러닝으로의 여행'에서는 통계와 머신 러닝의 기초 및 기본 요소를 소개한다. 모든 기초 지식은 전체 장에 걸쳐 파이썬과 R 코드를 통해 설명한다.
2장, '통계학과 머신 러닝의 유사점'에서는 선형 회귀와 라소/리지 회귀 예제를 통해 통계 모델링과 머신 러닝 사이의 차이점과 유사점을 비교해본다.
3장, '로지스틱 회귀와 랜덤 포레스트'에서는 분류 예제를 통해 로지스틱 회귀와 랜덤 포레스트의 세부 단계를 상세히 설명하면서 비교한다. 이 장이 끝날 때쯤에는 통계학과 머신 러닝 두 주류 학문에 관한 큰 그림을 그릴 수 있을 것이다.
4장, '트리 기반 머신 러닝 모델'에서는 실제 현업에서 많이 사용되고 있는 다양한 트리 기반 머신 러닝 모델을 알아본다. HR 퇴사자 데이터 예제를 통해 의사결정 트리(decision trees), 배깅(bagging), 랜덤 포레스트(random forest), 에이다 부스트(AdaBoost), 기울기 부스팅(gradient boosting), XG부스트X(GBoost)를 파이썬과 R 언어를 사용해 배운다.
5장, 'K-최근접 이웃과 나이브 베이즈'에서는 간단한 머신 러닝 기법인 k-최근접 이웃을 유방암 데이터와 함께 설명한다. 나이브 베이즈 모델은 다양한 자연어 전처리 기술, 메시지 분류 예제와 함께 설명한다.
6장, '서포트 벡터 머신과 신경망'에서는 서포트 벡터 머신과 관련한 다양한 기능에 관해 기술하고 커널 함수 사용법을 알아본다. 그런 다음, 신경망을 소개하고 딥러닝의 기초에 관한 모든 것을 다룬다.
7장, '추천 엔진'에서는 사용자-사용자 유사도 행렬로부터 찾아낸 '유사한 사람'의 정보에서 '유사한 영화'를 찾는 방법을 알아본다. 두 번째 절에서는 코사인 유사도(cosine similarity)를 계산한 후 영화-영화 유사도 행렬을 구성해 추천 시스템을 직접 만들어본다. 마지막으로 최종 추천을 위해 사용자와 영화 간에 교대 최소 자승법을 활용한 협업 필터링(collaborative filtering) 기술을 사용한다.
8장, '비지도학습'에서는 K-평균 군집화(k-means clustering), 주성분 분석(principal component analysis), 특이값 분해(singular value decomposition), 딥러닝 기반의 딥 오토 인코더(deep auto encoders) 같은 다양한 기술을 소개한다. 마지막 부분에서는 딥 오토 인코더가 전통적인 PCA기법과 비교했을 때 갖고 있는 장점을 알아본다.
9장, '강화학습'에서는 에피소드 상태를 통해 최적 경로를 학습하는 마르코프 결정 프로세스 (Markov decision process), 동적 프로그래밍(dynamic programming), 몬테카를로 기법(Monte Carlo methods), 시간차 학습(temporal difference learning)과 같은 완전 탐색 기법(exhaustive techniques)에 관해 알아본다.
마지막에는 머신 러닝과 강화학습을 사용한 좋은 응용 사례 몇 가지를 소개한다.

목차

1장. 통계학에서 머신 러닝으로의 여행

-모델 구축과 검증을 위한 통계 용어
-머신 러닝
-통계 모델링과 머신 러닝의 주요 차이점
-머신 러닝 모델 개발과 배치를 위한 단계
-통계학 기초 및 모델 구축과 검증에 관련된 용어
-편향과 분산의 트레이드 오프
-훈련 데이터와 테스트 데이터
-모델 구축과 검증을 위한 머신 러닝 용어
-선형 회귀 vs 기울기 하강법
-머신 러닝 손실
-머신 러닝 모델 튜닝을 멈추는 시점
-훈련, 검증, 테스트 데이터
-교차 검증
-그리드 검색
-머신 러닝 모델 개관
-요약

2장. 통계학과 머신 러닝의 유사점

-회귀와 머신 러닝 모델의 비교
-머신 러닝 모델의 보상 요인들
-선형 회귀의 가정들
-선형 회귀 모델링에 적용된 단계들
-기본 원리로 해결하는 간단한 선형 회귀 예제
-와인 품질 데이터를 이용한 단순 선형 회귀 예제
-다중 선형 회귀 예제 - 모델 구축을 위한 단계별 기법
-후진 제거법과 전진 선택법
-머신 러닝 모델 - 리지와 라소 회귀
-리지 회귀 분석 머신 러닝 예
-라소 회귀 분석 머신 러닝 모델
-선형 회귀와 리지/라소 회귀의 매개변수 정규화
-요약

3장. 로지스틱 회귀 vs 랜덤 포레스트

-최대 우도 추정
-로지스틱 회귀 - 소개 및 장점
-로지스틱 회귀에서 사용되는 용어
-로지스틱 회귀 모델링의 적용 단계
-독일 신용 데이터를 이용한 로지스틱 회귀 예
-랜덤 포레스트
-독일 신용 데이터를 이용한 랜덤 포레스트 예
-랜덤 포레스트에서의 그리드 검색
-변수 중요도 그래프
-로지스틱 회귀와 랜덤 포레스트 비교
-요약

4장. 트리 기반 머신 러닝 모델

-결정 트리 분류기 소개
-결정 트리에 사용되는 용어들
-기본 원리로 본 결정 트리의 작동 원리
-로지스틱 회귀와 결정 트리 비교
-다양한 모델 형식 간의 오차항 비교
-이상적인 영역으로 가는 개선책
-HR 퇴직율 데이터 예제
-의사결정 트리(DT) 분류기
-트리 분류기의 가중값 튜닝
-배깅 분류기
-랜덤 포레스트 분류기
-랜덤 포레스트 - 그리드 검색
-에이다 부스트 분류기
-기울기 부스팅 분류기
-에이다 부스팅과 기울기 부스팅의 비교
-극단 기울기 부스팅 - XG 부스트 분류기
-앙상블들의 앙상블 - 모델 스태킹
-서로 다른 분류기 형태 간의 앙상블들의 앙상블
-동일 형식 분류기를 사용한 부트스트랩 표본을 통한 앙상블들의 앙상블
-요약

5장. K-최근접 이웃과 나이브 베이즈

-K-최근접 이웃
-KNN투표 예제
-차원의 저주
-차원의 저주 1차, 2차, 3차원 예제
-위스콘신 유방암 진단 데이터를 이용한 KNN 분류기
-KNN분류기에서 K 값 튜닝
-나이브 베이즈
-확률 기초
-결합 확률
-조건부 확률과 베이즈 정리의 이해
-나이브 베이즈 분류기
-라플라스 계산
-나이브 베이즈 SMS 스팸 분류 예
-요약

6장. 서포트 벡터 머신과 신경망

-SVM 동작 원리
-최대 마진 분류기
-서포트 벡터 분류기
-서포트 벡터 머신
-커널 함수
-SVM 다중 레이블 분류기를 사용한 문자 인식 예제
-최대 마진 분류기 - 선형 커널
-다항 커널
-RBF 커널
-인공 신경망
-활성 함수
-순전파와 역전파
-신경망의 최적화
-확률 경사 하강법(SGD)
-모멘텀
-NAG
-에이다 그래드
-에이다 델타
-RMS프랍
-적응 모멘트 계산 - Adam
-L-BFGS 최적화 알고리즘
-신경망에서의 드롭아웃
-scikit-learn을 사용해 필기체 숫자 인식에 적용한 ANN 분류기
-딥러닝 소개
-해결 기법
-딥러닝 소프트웨어
-필기체 숫자 인식을 위해 케라스를 사용한 딥 신경망 분류기
-요약

7장. 추천 엔진

-내용 기반 필터링
-코사인 유사도
-협업 필터링
-내용 기반 필터링 대비 협업 필터링의 장점
-협업 필터링을 위한 교대 최소 자승법에 의한 행렬 인수 분해
-추천 엔진 모델의 평가
-그리드 검색을 사용한 추천 엔진의 초매개변수 선택
-무비렌즈 데이터에 적용한 추천 엔진
-사용자-사용자 유사도 행렬
-영화-영화 유사도 행렬
-ALS를 사용한 협업 필터링
-협업 필터링에서의 그리드 검색
-요약

8장. 비지도학습

-K-평균 군집화
-K-평균 군집화 기본 작동 원리362
-최적 클러스터 개수와 클러스터 평가
-엘보 기법
-붓꽃 데이터 예제를 이용한 K-평균 군집화
-주성분 분석 - PCA
-기본 원리로 본 PCA작동 기법
-scikit-learn를 활용한 필기체 숫자 인식에 PCA적용
-특이점 분해 - SVD
-scikit-learn를 사용한 필기체 숫자에 SVD적용
-딥 오토 인코더
-인코더-디코더 구조를 이용한 모델 구축 기법
-케라스를 이용한 필기체 숫자 인식에 딥 오토 인코더 적용
-요약

9장. 강화학습

-강화학습 소개
-지도·비지도·강화학습의 상세 비교
-강화학습의 특성
-강화학습 기초
-범주 1 - 가치 기반
-범주 2 - 정책 기반
-범주 3 - 액터 크리틱
-범주 4 - 비모델 기반
-범주 5 - 모델 기반
-순차적 의사결정의 기본 범주
-마르코프 결정 프로세스와 벨만 방정식
-동적 프로그래밍
-동적 프로그래밍으로 최적 정책을 계산하는 알고리즘
-파이썬으로 격자 세상에 가치와 정책 반복 알고리즘 구현
-몬테카를로 기법
-동적 프로그래밍과 몬테카를로 기법의 비교
-DP기법 대비 MC기법의 핵심 우위점
-몬테카를로 예측
-그리드 문제에 적용한 몬테카를로 예측의 적합성
-파이썬을 사용해 블랙잭 게임을 몬테카를로 기법으로 모델링
-시간차 학습
-몬테카를로 기법과 시간차 학습의 비교
-TD 예측
-TD 학습을 위한 회사까지 운전 예제
-SARSA 온-폴리시 TD 제어
-Q-러닝 오프-폴리시 TD 제어
-절벽 걷기 예제에 적용한 온-폴리시와 오프-폴리시 TD 제어
-머신 러닝과 딥러닝을 통합한 강화학습의 응용
-자율 운행 제어 - 자율 주행 차량
-구글 딥마인드의 알파고
-로봇 축구
-참고문헌
-요약

본문중에서

개발자들에게 있어 머신 러닝의 복잡한 통계학은 골칫거리다. 주어진 문제를 최적화하는 머신 러닝 모델을 구축하려면 통계 지식이 필요하다. 어떤 머신 러닝 전문가라도 통계와 수학에 관한 해박한 지식을 갖고 있어야만 머신 러닝 문제를 효율적으로 파악하고 해결할 수 있다. 이 책은 통계와 머신 러닝의 기본을 살펴봄으로써 머신 러닝으로 문제를 해결할 때 전체적인 시각을 가질 수 있게 해준다. 책에서는 다양한 분야에 걸쳐 빈번하게 사용되는 알고리즘을 살펴보고, 이를 위해 R과 파이썬 프로그래밍으로 scikit-learn, e1071, randomForest, c50, xgboost 같은 라이브러리를 다룬다. 또한 케라스 소프트웨어를 활용해 딥러닝의 기초를 알아보고 순수 파이썬 언어를 사용해 강화학습을 개괄적으로 알아본다.
('지은이의 말' 중에서)

통계학을 모르고서는 머신 러닝을 이해할 수 없다. 이 책은 파이썬과 R을 이용해 다양한 예제와 함께 다양한 머신 러닝을 설명하는 것과 함께 통계적 기법과의 연계성을 설명함으로써 각각의 기법이 문제를 해결하는 방식과 목표에 대해 알려준다. 단 한 권의 책에 완전한 내용을 다 담을 수는 없지만 이 책을 통해 통계와 머신 러닝의 관계에 대해 기초적인 개념을 정립할 수 있다. 또 머신 러닝에서 주로 사용되는 거의 대부분의 기법에 대해 파이썬과 R 예제를 직접 제공함으로써 현업의 적용에 있어서도 많은 도움이 되리라 생각한다.
풍부한 실전 예제와 소스코드를 꼼꼼히 따라가다 보면 머신 러닝에서 사용되고 있는 거의 모든 기법을 익히게 될 것이다.
('옮긴이의 말' 중에서)

저자소개

프라탑 단게티(Pratap Dangeti) [저] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 1종
판매수 51권

방갈로 TCS 혁신 연구소의 '분석과 통찰' 부서에서 구조화 이미지 및 텍스트 솔루션 개발과 관련된 머신 러닝과 딥러닝 솔루션을 개발하고 있다. 분석학과 데이터 과학 분야에 폭넓은 경험을 갖고 있으며, 봄베이 IIT에서 산업공학과 오퍼레이션 리서치로 석사 학위를 받았다. 인공지능에 큰 관심을 갖고 있으며, 쉬는 날에는 차세대 기술과 혁신적 기법과 관련된 책을 즐겨 읽는다.

생년월일 -
출생지 -
출간도서 0종
판매수 0권

KAIST 전산학과에서 학사 및 석사를 취득하고, LG전자에서 소프트웨어 연구원으로 재직했다. 이때 미국 마이크로소프트 본사에서 공동으로 한글 윈도우 CE 1.0과 2.0을 개발하기도 했으며, ㈜보험넷을 창업했다. 그 뒤 삼성생명을 비롯한 국내 유수의 생명 보험사와 손해 보험사에서 마케팅 기획, 영업 기획, 최고 마케팅 임원(CMO, 상무), 최고 영업 및 마케팅 임원(CSMO, 전무)으로 활약했으며, 최근에는 핀테크 관련 분야, 특히 블록체인과 빅데이터를 활용한 머신 러닝에 관심이 많다. 저서 [비트코인과 블록체인, 탐욕이 삼켜버린 기술](에이콘, 2018)을 썼다.

이벤트 기획전

이 상품의 시리즈

acorn+PACKT 시리즈(총 351권 / 현재구매 가능도서 322권)

펼쳐보기

이 책과 내용이 비슷한 책 ? 내용 유사도란? 이 도서가 가진 내용을 분석하여 기준 도서와 얼마나 많이 유사한 콘텐츠를 많이 가지고 있는가에 대한 비율입니다.

    리뷰

    0.0 (총 0건)

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    10.0

    교환/환불

    교환/환불 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

    교환/환불 가능 기간

    고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

    교환/환불 비용

    고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

    교환/환불 불가사유

    반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
    배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

    소비자 피해보상

    소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
    교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

    기타

    도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

    배송안내

    • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

    • 배송비

    도서(중고도서 포함) 구매

    2,000원 (1만원이상 구매 시 무료배송)

    음반/DVD/잡지/만화 구매

    2,000원 (2만원이상 구매 시 무료배송)

    도서와 음반/DVD/잡지/만화/
    중고직배송상품을 함께 구매

    2,000원 (1만원이상 구매 시 무료배송)

    업체직접배송상품 구매

    업체별 상이한 배송비 적용