간편결제, 신용카드 청구할인
카카오페이 3,000원
(카카오페이 5만원 이상 결제시, 5/1~5/31 기간 중 1회)
삼성카드 6% (38,070원)
(삼성카드 6% 청구할인)
인터파크 롯데카드 5% (38,480원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (28,350원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (32,400원)
(최대할인 4만원 / 2만원 이상 결제)
Close

데이터 예측을 위한 머신 러닝 : 기본 알고리즘 및 적용 예제, 사례 연구로 살펴보는

원제 : Fundamentals of Machine Learning for Predictive Data Analytics
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 21
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

45,000원

  • 40,500 (10%할인)

    2,250P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(71)

  • 상품권

AD

책소개

[데이터 예측을 위한 머신 러닝]은 데이터를 바탕으로 결과를 예측하는 데이터 예측이라는 대표적인 머신 러닝 적용 분야를 통해 다양한 머신 러닝의 기본 원리를 알아보고, 각 방식의 장단점과 상황에 맞는 선택 기준을 알아본다. 실제 머신 러닝을 사용할 때 알고리즘 선택 만큼이나 중요한 데이터 준비, 데이터 탐색 과정을 비롯해 수립한 모델의 평가 및 적용, 모니터링에 이르는 데이터 예측 프로젝트의 전 과정을 상세히 다룬다. 이와 관련된 여러 개념을 다양한 분야의 적용 예제, 사례 연구를 통해 구체적으로 이해하기 쉽게 설명한다.

출판사 서평

★ 이 책의 대상 독자 ★

이 책은 전산 과학, 자연 과학, 사회 과학, 공학, 경영학 학부생과 대학원생을 위한 머신 러닝, 데이터 마이닝, 데이터 분석이나 인공지능 강의에 사용할 수 있다.
또한 이 책은 데이터 분석가 관점에서 머신 러닝을 산업에 적용하는 사례 연구를 담고 있으므로, 현업 실무자의 입문서나 해당 분야 산업 교육 교재로도 사용할 수 있다.

★ 이 책의 구성 ★

1장. '데이터 예측 분석을 위한 머신 러닝'에서는 머신 러닝을 소개하고,표준 데이터 분석 프로젝트의 생애에서 머신 러닝의 역할을 설명한다.
2장. '데이터에서 통찰을 거쳐 결정으로'에서는 머신 러닝을 바탕으로 비즈니스 목적에 맞는 예측 분석 해법을 설계하고 구축하기 위한 체계를 제공한다. 모든 머신 러닝 알고리즘은 학습에 필요한 데이터셋을 가정하고 있으며,
3장. '데이터 탐색'에서 예측 모델 수립에 사용할 데이터셋을 설계, 구축하고 품질을 확인하는 방법을 설명한다.
4장부터 머신 러닝을 소개한다. 4장. '정보 기반 학습'에서는 정보 수집을 통한 학습, 5장. '유사도 기반 학습'에서는 유추를 통한 학습, 6장. '확률 기반 학습'에서는 가능성 높은 결과를 예측하는 학습, 7장. '오류 기반 학습'에서는 오차를 최소화하는 해법을 찾는 방식의 학습을 제시한다.
각 장들은 크게 두 부분으로 구성된다. 첫 번째 부분에서는 해당 장에서 제시할 주제에 대해 비공식적인 소개를 하고, 내용을 이해하는 데 필요한 근본적인 기술적 개념에 대해 자세히 소개하고, 제시한 학습 방식이 사용하는 표준 머신 러닝 알고리즘을 자세한 적용 예제를 곁들여 설명한다.
두 번째 부분에서는 표준 알고리즘을 잘 알려진 변형 알고리즘으로 확장하는 다양한 방법을 설명한다. 기술적 내용이 실린 장을 이렇게 두 부분으로 구성한 이유는 이렇게 하면 각 장의 내용이 자연스럽게 분리되기 때문이다. 결과적으로 각 장의 첫 번째 부분(기본 발상,원리, 표준 알고리즘, 적용 예제)만 강의에서 다뤄도 주제가 포함된다.
8장. '평가'에서는 예측 모델 성능 평가 방법을 설명하고,다양한 평가 지표를 소개한다. 그리고 표준 방식 다음에 확장과 변형을 설명한다. 기술적인 내용을 다루는 이런 장들은 데이터셋이 포함된 자세한 완전한 실세계 예제들과 예제를 뒷받침하는 논문을 통해 예측 분석과 연결이 유지되고 있다.
9장. '사례 연구: 고객 이탈'과 10장. '사례 연구: 은하 분류'의 사례 연구를 통해 더 넓은 사업적 맥락과 머신 러닝과의 연결 고리를 볼 수 있다. 특히 사례 연구들은 예측 분석 프로젝트의 성공에 필수적인 모델 수립 너머의 비즈니스 이해, 문제 정의, 데이터 수집 및 준비, 통찰을 얻기 위한 의사소통과 같은 다양한 문제와 작업들 을 강조하고 있다.
마지막으로 11장. '데이터 예측 분석을 위한 머신 러닝의 예술'은 머신 러닝의 다양한 근본 주제들을 살펴보고, 주어진 작업에 적절한 머신 러닝 방식을 모델 정확도 이상의 요소들을 고려해 선택하는 방법들도 살펴본다. 또한 모델의 특성과 비즈니스 필요 사항도 다룬다.

★ 지은이의 말 ★

이 책을 쓰는 목적은 머신 러닝의 기본 원리에 대한 접근 가능한 입문용 교과서를 제공하고 사업 분야, 과학 분야, 기타 조직의 실제 데이터 예측 분석 문제를 푸는 데 사용하는 머신 러닝 방법을 제공하는 것이다. 따라서 이 책은 머신 러닝 책들이 다루는 표준 주제를 넘어 예측 분석 프로젝트의 생애, 데이터 준비, 속성 설계, 모델 적용 등의 주제를 다룬다.
이 책의 설계는 수년간의 머신 러닝 강의 경험에 따른 것이며 책의 접근 방식과 자료들은 강의실에서 개발되고 실제 테스트를 거친 것들이다.
이 책은 접하기 쉬운 책으로 만들기 위해 다음과 같은 원칙들을 따른다.
1. 머신 러닝의 전체를 개관하기보다는 가장 중요하고 인기 있는 알고리즘을 명확하게 설명한다. 교사로서 분야를 관통하는 핵심 개념에 대한 깊은 지식을 학생에게 전달하면 학생에게 단단한 토대가 돼 해당 분야를 학생 스스로 탐색할 수 있다고 믿는다. 이렇게 좁게 집중함으로써 분야의 근본 알고리즘과 그 사용에 대해 소개하고, 설명하고, 시각화, 개념화하는 데 더 많은 시간을 할애할 수 있었다.
2. 알고리즘의 기술적, 형식적 설명을 제시하기 전에 알고리즘이 하려고 하는 바를 편안하게 설명한다. 각 주제에 대한 비공식적 소개를 제공함으로써 학생에게 더 기술적인 내용을 공략할 수 있는 탄탄한 토대를 제공한다. 이 교재를 이용해 학부생, 대학원생,전문가 등의 여러 청중에게 가르쳐 본 경험에 따르면 비공식적인 소개를 통해 학생이 주제에 쉽게 접근할 수 있었다.
3. 완전히 동작하는 예제를 제공한다. 이 책이 제시하는 예제는 모두 완전히 동작하며 이를 통해 독자들은 이해한 바를 자세히 확인할 수 있다.

★ 옮긴이의 말★

인공지능은 현대 과학의 오랜 꿈이다. 2001년이 지난 지 오래지만, 우리는 아직도 ‘2001년 스페이스 오디세이’의 HAL과 같은 평균 이상 인간의 능력을 갖추고 인간을 대신해 인간의 일을 하는 존재를 꿈꾼다. 컴퓨터 프로그래밍을 처음 접했을 때 컴퓨터가 바둑으로 인간을 이기는 날이 언제 올까 궁금해하며, 나름의 알고리즘을 공상해보곤 했다. 절대 오지 않을 것 같던 그 순간이 어느 날 갑자기 눈앞에 나타났을 때의 그 충격과 흥분이 생생합니다.
제한적인 분야에서 인간을 대신하는 약한 인공지능들은 대부분 인간의 학습과 추론 과정을 흉내 내는 머신 러닝을 이용합니다. 사실 머신 러닝은 우리 생활 속에 이미 깊이 들어와 있습니다. 요즘 컴퓨터들은 인간과 바둑, 체스 같은 게임을 겨루기도 하고, 음성을 인식해서 질문에 답하기도 하고, 외국어 문서를 번역해주기도 하며 심지어는 인간을 대신해 자동차 운전을 하기도 합니다. 이런 최근의 성과들은 딥러닝으로 대표되는 머신 러닝 분야 최신 기술들에 의존하고 있습니다.
모든 머신 러닝은 본질적으로 학습을 통해 직관과 통찰을 얻어내고, 이를 이용해 주어진 상황에 맞는 예측을 추론해내는 과정으로 볼 수 있습니다. 이 책은 이 과정을 대표하는 과거 데이터를 바탕으로 미래의 결과를 예측하는 데이터 예측 분야를 통해 머신 러닝의 기본 원리들을 설명합니다. 머신 러닝 알고리즘들은 인간의 귀납적 학습과 추론 과정을 관찰해 얻은 간단한 발상들을 이용합니다.
이 책은 다양한 발상에 따른 각 알고리즘의 장단점과 적절한 선택 기준들을 설명합니다. 그뿐만 아니라 머신 러닝을 적용할 때 알고리즘 선택보다 더 현실적으로 와 닿는 문제인 데이터 준비,데이터 탐색, 모델 평가 및 적용, 모니터링에 이르는 데이터 예측 프로젝트의 전 과정도 상세히 다루고 있습니다. 머신 러닝 알고리즘이 내포하고 있는 다소 난해한 개념들을 다양한 분야의 적용 예제, 사례 연구를 통해 구체적이고 실제적으로 이해하기 쉽게 설명합니다.
최근 각광 받고 있는 최첨단 머신 러닝 알고리즘을 처음 접하게 되면 아주 난해한 외계인이 던져준 마법 상자 같은 인상을 받기가 쉽습니다. 그러나 머신 러닝의 발전 과정을 살펴보면 마법 같은 알고리즘보다는 문제의 대상을 파악하고 주어진 데이터에 맞는 해법을 찾고 적합한 머신 러닝 모델을 설계하는 전체 과정을 이해하는 것이 더 중요하다는 것을 알게 됩니다. 이 책은 머신 러닝에 대한 이러한 기본기를 구체적으로 단단하게 갖출 수 있게 도와주는 좋은 책입니다. 여기서 쌓은 탄탄한 배경지식들은 이 책이 미처 다루지 못한 비지도 학습,
강화 학습, 딥러닝 등의 최신 개념들을 좀 더 수월하게 익히는 데 큰 도움이 될 것입니다.

목차

1장. 데이터 예측 분석을 위한 머신 러닝
__1.1 데이터 예측 분석이란?
__1.2 왜 머신 러닝인가?
__1.3 머신 러닝의 동작 방식
__1.4 머신 러닝이 잘못되는 경우
__1.5 데이터 예측 분석 프로젝트의 생애: CRISP-DM
__1.6 데이터 예측 분석 도구
__1.7 앞으로의 여정
__1.8 연습문제

2장. 데이터에서 통찰을 거쳐 결정으로
__2.1 비즈니스 문제를 분석적 해법으로 전환
____2.1.1 사례 분석: 자동차 보험 사기
__2.2 적용 가능성 평가
____2.2.1 사례 연구: 자동차 보험 사기
__2.3 기본 분석 테이블 설계
____2.3.1 사례 연구: 자동차 보험 사기
__2.4 속성 설계와 구현
____2.4.1 여러 가지 데이터 유형
____2.4.2 여러 가지 속성 유형
____2.4.3 시간 처리
____2.4.4 법적 문제
____2.4.5 속성 구현
____2.4.6 사례 연구: 자동차 보험 사기
__2.5 정리
__2.6 더 읽을거리
__2.7 연습문제

3장. 데이터 탐색
__3.1 데이터 품질 보고서
____3.1.1 사례 연구: 자동차 보험 사기
__3.2 데이터 알아가기
____3.2.1 정규 분포
____3.2.2 사례 연구: 자동차 보험 사기
__3.3 데이터 품질 문제 확인
____3.3.1 값 누락
____3.3.2 원소 개수 이상
____3.3.3 이상치
____3.3.4 사례 연구: 자동차 보험 사기
__3.4 데이터 품질 문제 처리
____3.4.1 값 누락 처리
____3.4.2 이상치 처리
____3.4.3 사례 연구: 자동차 보험 사기
__3.5 고급 데이터 탐색
____3.5.1 속성 관계 시각화
____3.5.2 공분산과 상관계수 측정
__3.6 데이터 준비
____3.6.1 정규화
____3.6.2 이산화
____3.6.3 표본 추출
__3.7 정리
__3.8 더 읽을거리
__3.9 연습문제

4장. 정보 기반 학습
__4.1 기본 발상
__4.2 원리
____4.2.1 결정 트리
____4.2.2 셰넌의 엔트로피 모델
____4.2.3 정보 이득
__4.3 표준 방식: ID3 알고리즘
____4.3.1 작동 예제: 작물 분포 예측
__4.4 확장과 변형
____4.4.1 속성 선택과 불균질성 지표의 대안
____4.4.2 연속 서술 속성 다루기
____4.4.3 연속 대상 속성 예측
____4.4.4 트리 가지치기
____4.4.5 모델 앙상블
__4.5 정리
__4.6 참고 문헌
__4.7 연습문제

5장. 유사도 기반 학습
__5.1 기본 발상
__5.2 원리
____5.2.1 속성 공간
____5.2.2 거리 함수를 이용한 유사도 측정
__5.3 표준 접근 방식: 최근접 이웃 알고리즘
____5.3.1 작동 예제
__5.4 확장과 변형
____5.4.1 데이터 잡음 처리
____5.4.2 효율적인 메모리 탐색
____5.4.3 데이터 정규화
____5.4.4 연속 목표에 대한 예측
____5.4.5 기타 유사도 지표
____5.4.6 속성 선택
__5.5 정리
__5.6 더 읽을거리
__5.7 에필로그
__5.8 연습문제

6장. 확률 기반 학습
__6.1 기본 발상
__6.2 원리
____6.2.1 베이즈 정리
____6.2.2 베이지언 예측
____6.2.3 조건부 독립과 인수분해
__6.3 표준 방식: 나이브 베이즈 모델
____6.3.1 적용 예제
__6.4 확장과 변형
____6.4.1 스무딩
____6.4.2 연속 속성: 확률 밀도 함수
____6.4.3 연속 속성: 이산화
____6.4.4 베이지안 네트워크
__6.5 정리
__6.6 참고 문헌
__6.7 연습문제

7장. 오류 기반 학습
__7.1 기본 발상
__7.2 원리
____7.2.1 단순 선형 회귀
____7.2.2 오차 측정
____7.2.3 오차 표면
__7.3 표준 방식: 경사 하강법을 이용한 다변수 선형 회귀
____7.3.1 다변수 선형 회귀
____7.3.2 경사 하강법
____7.3.3 학습률과 가중치 초깃값 선택
____7.3.4 적용 예제
__7.4 확장과 변형
____7.4.1 다변수 선형 회귀 모델 해석
____7.4.2 가중치 감쇄를 이용한 학습률 설정
____7.4.3 분류 서술 속성 처리
____7.4.4 분류 대상 속성 처리: 로지스틱 회귀
____7.4.5 비선형 관계 모델링
____7.4.6 다항 로지스틱 회귀
____7.4.7 서포트 벡터 머신
__7.5 정리
__7.6 더 읽을거리
__7.7 연습문제

8장. 평가
__8.1 기본 발상
__8.2 원리
__8.3 표준 방식: 유보 테스트 집합에 대한 오분석율
__8.4 확장과 변형
____8.4.1 평가 실험 설계
____8.4.2 성능 지표: 분류 대상
____8.4.3 성능 지표: 예측 점수
____8.4.4 성능 지표: 다항 대상
____8.4.5 성능 지표: 연속 대상
____8.4.6 모델 적용 이후의 평가
__8.5 정리
__8.6 더 읽을거리
__8.7 연습문제

9장. 사례 연구: 고객 이탈
__9.1 비즈니스 이해
__9.2 데이터 이해
__9.3 데이터 준비
__9.4 모델링
__9.5 평가
__9.6 적용

10장. 사례 연구: 은하 분류
__10.1 비즈니스 이해
____10.1.1 상황적 능숙함
__10.2 데이터 이해
__10.3 데이터 준비
__10.4 모델링
____10.4.1 기준 모델
____10.4.2 속성 선택
____10.4.3 5단계 모델
__10.5 평가
__10.6 적용

11장. 데이터 예측 분석을 위한 머신 러닝의 예술
__11.1 예측 모델에 대한 다른 관점
__11.2 머신 러닝 방식 선택
____11.2.1 프로젝트에 맞는 머신 러닝 방식
____11.2.2 데이터에 맞는 머신 러닝 방식
__11.3 그다음 단계

A장. 머신 러닝을 위한 기술 통계학 및 데이터 시각화
__연속 속성을 위한 기술 A.1 술 통계학
____A.1.1 중심 경향성
____A.1.2 분산
__A.2 분류 속성을 위한 기술 통계학
__A.3 모집단과 표본
__A.4 데이터 시각화
____A.4.1 막대그래프
____A.4.2 히스토그램
____A.4.3 박스 그래프

B장. 머신 러닝을 위한 확률론 소개
__B.1 확률론 기초
__B.2 확률 분포와 확률 합계
__B.3 유용한 확률 규칙 몇 가지
__B.4 정리

C장. 머신 러닝을 위한 미분 기법
__C.1 연속 함수의 도함수
__C.2 연쇄 법칙
__C.3 편도함수

저자소개

브라이언 맥 네미, 이퍼 다시 [저] 신작알림 SMS신청
생년월일 -

해당작가에 대한 소개가 없습니다.

황정동 [역] 신작알림 SMS신청
생년월일 -

해당작가에 대한 소개가 없습니다.

이 상품의 시리즈

(총 76권 / 현재구매 가능도서 71권)

선택한 상품 북카트담기
펼쳐보기

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    0.0

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    판매자

    (주)교보문고

    상호

    (주)교보문고

    사업자 종류

    법인사업자

    사업자번호

    102-81-11670

    연락처

    1544-1900

    이메일

    callcenter@kyobobook.co.kr

    통신판매 신고 번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    (주) 인터파크 안전결제시스템 (에스크로) 안내

    (주)인터파크의 모든 상품은 판매자 및 결제 수단의 구분없이 회원님들의 구매안전을 위해 안전결제 시스템을 도입하여 서비스하고 있습니다.
    결제대금 예치업 등록 : 02-006-00064 서비스 가입사실 확인

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시, 1만 원 이상 무료, 1만원 미만 2천 원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용