간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (25,650원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (18,900원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (21,600원)
(최대할인 4만원 / 2만원 이상 결제)
Close

Do it! 데이터 과학자를 위한 실전 머신러닝 : 13가지 핵심 머신러닝 모델을 직접 구현하며 레벨업!

소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 223
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

30,000원

  • 27,000 (10%할인)

    1,500P (5%적립)

할인혜택
적립혜택
  • S-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
배송정보
  • 12/4(월) 이내 발송 예정  (서울시 강남구 삼성로 512)
  • 무료배송
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(61)

  • 상품권

AD

책소개

10년 차 데이터 분석가의 실력 상승 비법을 담았다!
13가지 핵심 머신러닝 모델을 직접 구현하면서
머신러닝 입문자를 실무의 세계로 안내하는 책

이 책은 저자가 데이터 분석가로 10년 동안 일하며 깨달은 실력 상승의 비법을 예비 실무자에게 전하고자 집필한 책이다. 그 비법은 바로 기본으로 돌아가 선형 모델, 트리 모델 등 13가지 핵심 머신러닝 모델을 집중적으로 공부하는 것이다. 먼저 각 모델의 밑바탕에 있는 알고리즘 기초과 수리 이론을 살펴보고, 간단한 형태로 모델을 직접 구현해 본다. 그리고 최적화된 파이썬 패키지로 다시 모델링한 다음, 둘 사이에 어떤 차이가 발생하는지를 비교해 보며 머신러닝의 작동 원리를 탐구한다.
머신러닝은 이론만 공부하던 입문자가 처음 실무를 맞닥뜨릴 때 큰 어려움을 겪는 분야이다. 이때 겪는 어려움은 결국 실력이 쌓여야만 근본적으로 극복할 수 있다. 기본 모델을 깊이 이해할수록 다양한 모델들이 서로 동떨어져 있지 않고 기본 모델과 이론적으로 많은 부분을 공유한다는 사실을 깨달을 것이다. 그러고 나면 실제 업무나 연구에서 전보다 더 유연하고 효율적으로 머신러닝 모델링을 수행할 수 있을 것이다.

출판사 서평

머신러닝에 입문하고 실무에서 막혔다면?
실무에 필요한 역량을 기를 때!

머신러닝은 입문과 실무의 간극이 매우 넓은 분야이다. 입문서에 나오는 패키지 사용법과 실습 코드는 실제 연구나 업무 환경에 맞춰 적용하기 쉽지 않고, 상황에 따라 그때그때 구글링으로 코드를 찾아 사용하려 해도 환경이나 조건이 조금만 바뀌는 순간 먹통이 되기 일쑤다.
이 책의 저자 또한 머신러닝을 처음 공부하기 시작할 때 비슷한 문제를 겪었다. 십여 년 동안 현장에서 머신러닝과 씨름하면서 진짜 실력을 기르려면 모든 머신러닝 기법의 기본이 되는 주요 모델의 이론과 사용법을 완벽하게 터득하는 데에 집중해야 한다는 것을 깨달았다. 이 책은 머신러닝에 입문한 뒤 실무에서 헤매는 과거의 저자와 같은 분들에게 조금 힘겹지만 지나고 보면 가장 빠른 실력 향상의 정도이자 지름길을 알려 준다.

13가지 핵심 모델을 직접 구현해 보면서
진짜 업무에 곧바로 쓸 수 있는 응용력을 갖춘다

그렇다면 어떻게 해야 기본 모델을 완벽하게 이해할 수 있을까? 이 책에서는 핵심 머신러닝 모델 13가지를 소개하고, 이를 간단한 형태로 직접 구현해 보는 방법을 제안한다. 단순히 다양하고 복잡한 모델을 만들어 문제를 풀어 보는 경험은 현재 내 실력으로 온전히 체화되지 않을 수 있다. 또한 실전에서는 언제나 주어진 환경이 달라지기 마련이므로, 그에 따라 모델의 형태를 자신이 원하는 대로 변형할 줄 알아야 한다.
주요한 기본 모델의 이론과 사용법을 깊이 알아갈수록 다른 모델을 쉽게 이해할 수 있고, 나아가 어떤 머신러닝 모델이든 핵심 부분은 대부분 기본 모델과 이론적으로 공유한다는 사실을 깨달을 수 있다. 이렇게 학습하다 보면 실제 업무나 연구에서 머신러닝 모델링을 수행할 때 변화에 유연해지며 불필요한 시도를 줄일 수 있다.

알고리즘 이론부터 하이퍼파라미터 분석까지
머신러닝의 처음부터 끝까지 철저하게 파헤친다

이 책에서는 머신러닝을 다음 순서대로 학습한다. 먼저 각 머신러닝 모델의 밑바탕에 있는 알고리즘 기초 이론을 다시 살펴보고, 수리 이론과 함께 작동 원리를 깊이 이해한다. 그리고 간단한 형태로 모델을 직접 코딩하여 구현해 본다. 그다음 사이킷런에 내장된 해당 모델에 최적화된 파이썬 패키지를 활용해 모델링하고, 앞서 직접 만든 모델과 비교하며 그 차이점을 탐구한다. 마지막으로 파이썬 패키지에 사용한 하이퍼파라미터를 알아보며 패키지의 동작을 더 자세히 이해해 본다.
머신러닝을 처음 공부하거나 공부한 지 오래되었다면 '사전 지식 훑어보기'를 읽으며 각 장에서 다루는 모델을 이해하는 데 필요한 지식을 미리 살펴볼 수 있다. 또한 각 장의 마지막에는 머신러닝 전문가가 되고자 하는 사람이 알아 두면 좋을 양질의 지식을 '보충 수업'으로 소개한다.

머신러닝의 세계를 한눈에 조망할 수 있는
'머신러닝 용어 지도' 수록!

머신러닝의 다양한 분야와 종류, 개념을 한눈에 파악할 수 있는 ‘용어 지도’를 부록으로 제공한다. 이 지도를 살펴보면서 머신러닝의 세계는 어떻게 구성되어 있는지, 그중에 이 책을 통해 어떤 부분을 배웠는지 알아보자. 앞으로 머신러닝의 어떤 곳을 탐험할지도 즐겁게 고민해 보자.

함께 배우고, 나누고, 성장하는 ‘Do it! 스터디룸’으로 오세요!

혼자 계획을 세우고 공부하다 보면 금방 지치기 마련이다. 나와 비슷한 고민을 하는 독자를 만나 어려운 내용을 공유해 보자. 서로 도움을 주고받으며 공부하다 보면 더 보람차다. 멀리 가려면 친구와 함께해 보자.
- Do it! 스터디룸: cafe.naver.com/doitstudyroom

예제 소스 파일은 이지스퍼블리싱 홈페이지 자료실 또는 저자 깃허브에서 제공합니다

- 이지스퍼블리싱 홈페이지: www.easyspub.co.kr → [자료실] 클릭 → 도서명 검색
- 저자 깃허브: github.com/giwoong2/doit_hands-on_ML

목차

첫째마당 머신러닝 준비하기

1장 머신러닝과 파이썬
__1.1 머신러닝 알아보기
____1.1.1 머신 러닝은 왜 생겨났을까?
____1.1.2 이 책에서 배우는 머신러닝 모델 한눈에 보기
____1.1.3 이 책의 학습 구성 한눈에 보기
__1.2 머신러닝에 쓰는 알고리즘 개념 이해하기
__1.3 실습 환경 설정하기
____1.3.1 이 책에서 사용하는 파이썬 패키지 살펴보기
__1.4 머신러닝 절차 빠르게 체험하기
____1.4.1 데이터셋 준비하기
____1.4.2 데이터셋 분할하기
____1.4.3 데이터 전처리
____1.4.4 학습 데이터를 이용한 모델 학습
____1.4.5 학습 데이터와 검증 데이터 쌍을 이용한 하이퍼파라미터 튜닝
____1.4.6 테스트 데이터셋에 대한 최종 성능 측정과 평가

둘째마당 선형 모델을 이용한 지도 학습
__선형 모델 준비하기

2장 최소 제곱법 모델
__2.1 최소 제곱법 모델이란?
____2.1.1 최소 제곱법 모델의 정의
__2.2 정규 방정식으로 최소 제곱법 모델 구현하기
____2.2.1 정규 방정식을 이용한 풀이 이론
____2.2.2 정규 방정식으로 풀이 구현하기
____2.2.3 정규 방정식 구현의 단점
__2.3 특잇값 분해를 이용한 최소 제곱법 모델 구현하기
____2.3.1 SVD-OLS를 이용한 풀이 이론
____2.3.2 정규 방정식 풀이의 단점과 SVD-OLS 풀이의 장점
____2.3.3 SVD-OLS를 이용한 풀이 구현하기
__2.4 TSVD-OLS를 이용한 모델 구현하기
____2.4.1 TSVD-OLS를 이용한 풀이 이론
____2.4.2 TSVD-OLS를 이용한 풀이 구현하기
__2.5 패키지로 표현하기
__2.6 최소 제곱법 모델 보충 수업
____2.6.1 통계 모델로서의 OLS
____2.6.2 결정 계수
____2.6.3 화이트 박스 모델과 블랙 박스 모델
__되새김 문제

3장 로지스틱 회귀 모델
__사전 지식 훑어보기
__3.1 로지스틱 회귀 모델이란?
__3.2 로지스틱 회귀 모델 구현하기
____3.2.1 로지스틱 회귀 모델의 기본 이론
____3.2.2 로지스틱 회귀 모델의 심화 이론
____3.2.3 로지스틱 회귀 모델 구현하기
__3.3 패키지로 표현하기
__3.4 로지스틱 회귀 모델 보충 수업
____3.4.1 피처 스케일링과 파이프라인
____3.4.2 통계 모델로서의 로지스틱 회귀 기법
____3.4.3 교차검증법
____3.4.4 피처선택법
__되새김 문제

4장 라쏘 모델
__사전 지식 훑어보기
__4.1 라쏘 모델이란?
__4.2 라쏘 모델 구현하기
____4.2.1 라쏘 모델의 이론
____4.2.2 라쏘 모델 구현하기
__4.3 패키지로 표현하기
__4.4 라쏘 모델 보충 수업
____4.4.1 LARS 기반 라쏘 모델
____4.4.2 모델 선택법
__되새김 문제

5장 릿지 회귀 모델
__사전 지식 훑어보기
__5.1 릿지 회귀 모델이란?
__5.2 릿지 회귀 모델 구현하기
____5.2.1 릿지 회귀 모델의 기본 이론
____5.2.2 릿지 회귀 모델의 심화 이론
____5.2.3 릿지 회귀 모델 구현하기
__5.3 패키지로 표현하기
__5.4 릿지 회귀 모델 보충 수업
____5.4.1 편향-분산 상충 관계와 릿지 회귀의 분산
____5.4.2 릿지 분류 모델
____5.4.3 엘라스틱 넷 회귀 모델
__되새김 문제

셋째마당 트리 모델을 이용한 지도 학습
__트리 모델 준비하기

6장 결정 트리 모델
__사전 지식 훑어보기
__6.1 결정 트리 모델이란?
__6.2 결정 트리 모델 구현하기
____6.2.1 결정 트리 분류 모델의 이론
____6.2.2 결정 트리 분류 모델 구현하기
__6.3 패키지로 표현하기
__6.4 결정 트리 모델 보충 수업
____6.4.1 회귀 트리
____6.4.2 그리드 서치
____6.4.3 피처 중요도
__되새김 문제

7장 랜덤 포레스트 모델
__사전 지식 훑어보기
__7.1 랜덤 포레스트 모델이란?
__7.2 랜덤 포레스트 모델 구현하기
____7.2.1 랜덤 포레스트 모델의 이론
____7.2.2 랜덤 포레스트 분류 모델 구현하기
__7.3 패키지로 표현하기
__7.4 랜덤 포레스트 모델 보충 수업
____7.4.1 랜덤 포레스트 회귀 모델
____7.4.2 OOB 점수
____7.4.3 ExtraTrees
____7.4.4 피처 중요도
__되새김 문제

8장 그레이디언트 부스팅 트리 모델
__사전 지식 훑어보기
__8.1 그레이디언트 부스팅 트리 모델이란?
__8.2 그레이디언트 부스팅 트리 모델 구현하기
____8.2.1 그레이디언트 부스팅 트리 모델의 이론
____8.2.2 부스팅 트리 회귀 모델 구현하기
__8.3 패키지로 표현하기
__8.4 그레이디언트 부스팅 트리 모델 보충 수업
____8.4.1 설명 가능 인공지능
____8.4.2 GBT 모델 이후의 부스팅 기법
__되새김 문제

넷째마당 기타 지도 학습 모델

9장 K-최근접 이웃 모델
__사전 지식 훑어보기
__9.1 K-최근접 이웃 모델이란?
__9.2 K-최근접 이웃 모델 구현하기
____9.2.1 KNN 모델의 기본 이론
____9.2.2 KNN 모델의 심화 이론
____9.2.3 KNN 분류 모델 구현하기
__9.3 패키지로 표현하기
__9.4 K-최근접 이웃 모델 보충 수업
____9.4.1 KNN 회귀 모델
____9.4.2 결정 경계
____9.4.3 고정 반지름 근접 이웃 모델
____9.4.4 KNN 이상값 모델
__되새김 문제

10장 서포트 벡터 머신 모델
__10.1 서포트 벡터 머신 모델이란?
__10.2 서포트 벡터 머신 모델 구현하기
____10.2.1 서포트 벡터 머신 모델의 이론
____10.2.2 SVM 모델 구현하기
__10.3 패키지로 표현하기
____10.3.1 다른 패키지로 구현하기
__10.4 서포트 백터 머신 모델 보충 수업
____10.4.1 서포트 벡터 회귀로 확장하기
____10.4.2 클래스 분류의 확률 판정법
__되새김 문제

11장 다층 퍼셉트론 모델
__사전 지식 훑어보기
__11.1 다층 퍼셉트론 모델이란?
__11.2 다층 퍼셉트론 모델 구현하기
____11.2.1 다층 퍼셉트론 모델의 이론
____11.2.2 다층 퍼셉트론 모델 구현하기
__11.3 패키지로 표현하기
__11.4 다층 퍼셉트론 모델 보충 수업
____11.4.1 MLP 회귀 모델
__되새김 문제

다섯째마당 비지도 학습 모델

12장 K-평균 군집화 모델
__12.1 K-평균 군집화 모델이란?
__12.2 K-평균 군집화 모델 구현하기
____12.2.1 K-평균 군집화 모델의 이론
____12.2.2 K-평균 군집화 모델 구현하기
__12.3 패키지로 표현하기
__12.4 K-평균 군집화 모델 보충 수업
____12.4.1 K-평균 군집화 모델 적용이 부적절한 데이터셋
____12.4.2 군집화 결과 평가하기
__되새김 문제

13장 계층적 군집화 모델
__13.1 계층적 군집화 모델이란?
__13.2 계층적 군집화 모델 구현하기
____13.2.1 계층적 군집화 모델의 이론
____13.2.2 계층적 군집화 모델 구현하기
__13.3 패키지로 표현하기
__13.4 계층적 군집화 모델 보충 수업
____13.4.1 덴드로그램으로 군집 계층 시각화하기
__되새김 문제

14장 주성분 분석 모델
__사전 지식 훑어보기
__14.1 주성분 분석 모델이란?
__14.2 주성분 분석 모델 구현하기
____14.2.1 주성분 분석 모델의 이론
____14.2.2 PCA 모델 구현하기
__14.3 패키지로 표현하기
__14.4 주성분 분석 모델 보충 수업
____14.4.1 다양한 차원 축소 기법
__되새김 문제

[부록] 한눈에 보는 머신러닝 용어 지도
되새김 문제 풀이
참고문헌

찾아보기

관련이미지

저자소개

배기웅 [저] 신작알림 SMS신청
생년월일 -

카이스트 수리과학과에서 학사와 석사 학위를 받은 후 실제 사회 현상에 대한 머신러닝 모델링에 관심이 생겨 카이스트 기술경영학부에서 박사 과정으로 머신러닝을 활용한 계량 마케팅을 전공했다. 영화나 드라마 등의 엔터테인먼트 산업에서 제품의 제목과 소비자 리뷰 등의 텍스트 정보를 이용해 매출을 모델링하는 연구로 박사 학위를 취득했다. 이후 삼성 SDS에서 데이터 분석가로 일하고 있다. 데이터 분석 교육, 검정, 인력 양성에 관심이 많아 현재 관련 업무를 담당하고 있다.

이 상품의 시리즈

(총 67권 / 현재구매 가능도서 62권)

선택한 상품 북카트담기
펼쳐보기

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    100자평

    작성시 유의사항

    평점
    0/100자
    등록하기

    100자평

    0.0
    (총 0건)

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    상호

    (주)교보문고

    대표자명

    안병현

    사업자등록번호

    102-81-11670

    연락처

    1544-1900

    전자우편주소

    callcenter@kyobobook.co.kr

    통신판매업신고번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    (주)KG이니시스 결제대금예치업 등록번호: 02-006-00013

    (주)인터파크커머스는 회원님들의 안전거래를 위해 구매금액, 결제수단에 상관없이 (주)인터파크커머스를 통한
    모든 거래에 대하여 (주)KG이니시스가 제공하는 구매안전서비스를 적용하고 있습니다.
    등록 여부는 e-금융민원센터 홈페이지(www.fcsc.kr)의 등록·신고>전자금융업등록현황 메뉴에서 확인하실 수 있습니다. 서비스 가입사실 확인

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시 15,000원 이상 무료배송, 15,000원 미만 2,500원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용