간편결제, 신용카드 청구할인
카카오페이 3,000원
(카카오페이 결제 시 최대할인 3천원 / 5만원 이상 결제, 기간 중 1회)
PAYCO(페이코) 최대 5,000원 할인
(페이코 신규 회원 및 90일 휴면 회원 한정)
북피니언 롯데카드 30% (15,750원)
(최대할인 3만원 / 3만원 이상 결제)
EBS 롯데카드 20% (18,000원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 NEW 우리V카드 10% (20,250원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 현대카드 7% (20,930원)
(최대할인 3만원 / 3만원 이상 결제)
Close

Python Machine Learning by Example : 예제로 배우는 머신 러닝 알고리즘

원제 : Python Machine Learning By Example: Easy-to-follow examples that get you up and running with machine learning
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 21
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

25,000원

  • 22,500 (10%할인)

    1,250P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 출고완료 후 14일 이내 마이페이지에서 적립받기한 경우만 적립됩니다.
  • 추가혜택
    배송정보
    주문수량
    감소 증가
    • 이벤트/기획전

    • 연관도서(28)

    • 사은품(3)

    책소개

    예제로 배우는 머신 러닝 알고리즘

    머신 러닝은 이제 거의 모든 비즈니스에서 필수적인 기술로 자리잡고 있다. 하지만 이런 인기에도 불구하고 많은 사람이 여전히 머신 러닝에 장벽을 느끼고 있다. 이 책은 파이썬부터 머신 러닝에서 필요한 소프트웨어 설치, 다양한 머신 러닝 알고리즘 소개뿐 아니라 비즈니스 문제의 활용 방법까지 알기 쉽게 소개한다. 실행 결과를 바로 확인할 수 있는 소스 코드와 친절한 설명으로 머신 러닝의 기초를 확실히 다질 수 있을 것이다.

    출판사 서평

    [이 책에서 다루는 내용]

    - 파이썬을 적극 활용한 데이터 추출, 가공, 탐색 기술
    - 파이썬을 이용해서 다차원상에서 데이터를 시각화하고 의미 있는 피처 추출해내기
    - 상황을 제대로 예측하기 위해 분석 방법 자세히 살펴보기
    - 파이썬을 이용한 머신 러닝 분류 및 회귀 알고리즘 구현
    - 야후와 구글의 금융 데이터로 주식 시장의 주가 분석 및 예측
    - 머신 러닝 모델의 성능 평가와 최적화
    - 머신 러닝과 파이썬으로 다뤄보는 실제로 접할 수 있는 재미있는 문제들

    [이 책의 대상 독자]

    데이터 과학에 관심이 있는 사람 중 머신 러닝을 이용하는 누구에게나 도움이 될 것이다. 다만 파이썬 프로그래밍의 기본 지식은 갖추고 있어야 한다.

    [이 책의 구성]

    1장, '파이썬과 머신 러닝 시작하기'에서는 파이썬을 이용해서 머신 러닝 분야를 경험할 수 있는 방법을 설명한다. 파이썬과 머신 러닝의 기본 내용을 충실히 다루고, 실제 프로그램을 실행할 때 필요한 소프트웨어 설치 방법을 소개한다.
    2장, '텍스트 분석 알고리즘을 이용한 20 뉴스그룹 데이터세트 분석'에서는 데이터 수집, 피처(feature), 데이터 전처리 같은 중요한 개념을 설명한다. 아울러 차원 축소화 기술, 주성분 분석(PCA), KNN(K-nearest neighbors) 알고리즘도 다룬다.
    3장, '나이브 베이즈를 이용한 스팸 메일 탐지'에서는 분류(classification)의 기본 개념, 나이브 베이즈 알고리즘 및 실제 코드 구현, 분류 성능 평가, 모델 선택과 튜닝, 교차 검증 등을 종합적으로 학습한다. 스팸 메일 탐지 같은 예제를 통해 실제로 어떻게 동작하는지도 살펴본다.
    4장, 'SVM을 이용한 뉴스 토픽 분류'에서는 다중 클래스 분류, 서포트 벡터 머신(SVM)의 기본 개념과, 이들을 토픽 분류에 적용시키는 방법을 알아본다. 아울러 커널 머신, 오버피팅, 정규화 같은 중요한 개념도 살펴본다.
    5장, '트리 기반 알고리즘을 이용한 클릭스루 예측'에서는 의사결정 트리와 랜덤 포레스트 알고리즘에 대해 자세히 알아보고, 이를 광고 클릭스루 비율 문제에서 어떻게 활용하는지 학습한다.
    6장, '로지스틱 회귀를 이용한 클릭스루 예측'에서는 로지스틱 회귀 분류기를 자세히 설명한다. 아울러 범주형 변수 인코딩, L1 정규화, L2 정규화, 피처 셀렉션, 온라인 러닝, 스토캐스틱 그래디언트 하강(SGD) 같은 중요한 개념도 자세히 다룬다.
    7장, '회귀 알고리즘을 이용한 주가 예측'에서는 야후나 구글 금융 데이터를 비롯해 여러 데이터를 이용해 주식 시장의 주가 예측을 분석한다. 아울러 금융 업계에서 풀기 어려운 문제와 금융 관련 기본 개념도 간략하게 소개한다.
    8장, '모범 사례'에서는 여러분이 배우고 실제로 개발하는 데 꼭 필요한 지식과 주의 사항, 요령을 소개한다.

    이 책에서 다루는 여러 가지 프로젝트를 충실히 익히고 나면 파이썬 기반의 머신 러닝 에코시스템의 전체 개념이 더욱 명확하게 정립될 것이다.

    목차

    1장. 파이썬과 머신 러닝 시작하기
    -머신 러닝은 무엇이고, 왜 필요한가
    -머신 러닝의 개요
    -머신 러닝 알고리즘의 역사
    -데이터를 이용한 일반화
    -오버피팅, 언더피팅, 바이어스 분산 트레이드오프
    -교차 검증을 이용한 오버피팅 방지
    -정규화를 이용한 오버피팅 방지
    -피처 선택과 차원 축소화를 통한 오버피팅 방지
    -전처리, 탐색 작업, 피처 엔지니어링
    -결측값 처리
    -레이블 인코딩
    -원 핫 인코딩
    -스케일링
    -다항형 피처
    -파워 변환
    -비닝
    -모델의 조합
    -배깅
    -부스팅
    -스태킹
    -블렌딩
    -보팅과 평균화
    -소프트웨어 설치와 설정
    -문제 해결과 도움 요청 방법
    -요약

    2장. 텍스트 분석 알고리즘을 이용한 20 뉴스그룹 데이터세트 분석
    -NLP란
    -newsgroups 데이터
    -데이터 확보
    -피처에 대해 생각해보자
    -시각화
    -데이터 전처리
    -클러스터링
    -토픽 모델링
    -요약

    3장. 나이브 베이즈를 이용한 스팸 메일 탐지
    -분류란 무엇인가
    -분류의 유형
    -텍스트 분류 애플리케이션
    -나이브 베이즈란
    -예제를 통한 베이즈 정리의 이해
    -나이브 베이즈의 메커니즘
    -나이브 베이즈의 구현
    -분류기의 성능 평가
    -모델 튜닝과 교차 검증
    -요약

    4장. SVM을 이용한 뉴스 토픽 분류
    -3장 복습과 IDF
    -SVM
    -SVM의 원리
    -SVM 구현
    -SVM 커널 함수
    -선형 커널 함수와 RBF 커널 함수의 비교
    -SVM을 이용한 뉴스 토픽 분류
    -추가 예제: SVM를 이용해 심전도 데이터로 태아 상태 분류
    -요약

    5장. 트리 기반 알고리즘을 이용한 클릭스루 예측
    -광고 클릭스루 예측이란
    -수치형 데이터와 범주형 데이터
    -의사결정 트리 분류기
    -의사결정 트리 생성
    -트리 분할 측정 기준
    -의사결정 트리 구현
    -의사결정 트리를 이용한 클릭스루 예측
    -랜덤 포레스트: 의사결정 트리의 피처 배깅
    -요약

    6장. 로지스틱 회귀를 이용한 클릭스루 예측
    -원 핫 인코딩: 범주형 피처를 수치형 피처로 변환
    -로지스틱 회귀 분류기
    -로지스틱 회귀
    -로지스틱 회귀의 동작 원리
    -그래디언트 하강을 통한 로지스틱 회귀 모델 학습
    -그래디언트 하강 기법과 로지스틱 회귀를 이용한 클릭스루 예측
    -스토캐스틱 그래디언트 하강 기법을 이용한 로지스틱 회귀 모델 학습
    -정규화 기법을 이용한 로지스틱 회귀 모델 학습
    -온라인 러닝을 이용한 대규모 데이터세트 학습
    -다중클래스 분류 처리
    -피처 셀렉션과 랜덤 포레스트 비교
    -요약

    7장. 회귀 알고리즘을 이용한 주가 예측
    -유가 증권 시장과 주가
    -회귀의 기본 개념
    -회귀 알고리즘을 이용한 주가 예측
    -피처 엔지니어링
    -데이터 확보와 피처 생성
    -선형 회귀
    -의사결정 트리 회귀
    -서포트 벡터 회귀
    -회귀 성능 평가
    -회귀 알고리즘을 이용한 주가 예측
    -요약

    8장. 모범 사례
    -머신 러닝 워크플로우
    -데이터 준비 단계에서 참고할 모범 사례
    -모범 사례 1: 프로젝트의 목표를 완전히 이해할 것
    -모범 사례 2: 관련된 모든 필드를 수집할 것
    -모범 사례 3: 필드 값에 대한 일관성을 유지할 것
    -모범 사례 4: 결측 데이터 처리
    -학습 데이터세트 생성 단계에서 참고할 모범 사례
    -모범 사례 5: 수치형 값을 지닌 범주형 피처 판단
    -모범 사례 6: 범주형 피처로 인코딩 여부 결정
    -모범 사례 7: 피처 선택 여부를 결정하고 선택할 경우 어떻게 할지도 결정한다
    -모범 사례 8: 차원 축소화 여부를 결정하고 선택할 경우 어떻게 할지도 결정한다
    -모범 사례 9: 피처 스케일링 여부 결정
    -모범 사례 10: 도메인 전문성을 이용한 피처 엔지니어링 수행
    -모범 사례 11: 도메인 전문성 없이 피처 엔지니어링 수행
    -모범 사례 12: 각 피처가 생성 과정 문서화하기
    -모델 학습, 평가, 선정 단계에서 참고할 모범 사례
    -모범 사례 13: 적절한 알고리즘 선택
    -모범 사례 14: 오버피팅을 줄일 것
    -모범 사례 15: 오버피팅과 언더피팅이 있는지 진단할 것
    -모델 배포, 모니터링 단계에서 참고할 모범 사례
    -모범 사례 16: 모델 저장, 로딩, 재사용
    -모범 사례 17: 모델 성능 모니터링
    -모범 사례 18: 정기적으로 모델 업데이트
    -요약

    본문중에서

    데이터 과학과 머신 러닝은 요즘 기술 분야에서 가장 주목 받는 유행이다. 데이터 마이닝과 베이지안 분석의 꾸준한 인기에 힘입어 머신 러닝에 대한 관심도 증가하는 추세다. 이 책을 통해 머신 러닝의 세계에 첫발을 잘 디딜 수 있기를 바란다.
    ('지은이의 말' 중에서)

    실제 사례를 바탕으로 한 예제를 이용해 머신 러닝 기술을 직접 경험해볼 수 있다면 무척 유용할 것이다.
    이 책은 머신 러닝에서 많이 활용되는 대표 알고리즘을 친절하게 잘 설명한다. 특히 예제 코드를 통해서 바로 단계별로 결과를 확인해볼 수 있고, 궁극적으로는 비즈니스 시나리오의 전체 흐름도 익힐 수 있다. 데이터 분석의 두 대표 영역인 텍스트 데이터 분석과 수치 데이터 분석(시계열 분석 포함)을 실제 업무에 활용할 수 있는 예제를 이용해 설명하는 점에도 커다란 의미가 있다. 머신 러닝에 대한 모든 것을 한 권의 책으로 배우고 익히기는 어렵겠지만, 이 책으로 꾸준히 공부하고 연습한다면 충분히 좋은 결과를 얻을 것이다.
    ('옮긴이의 말' 중에서)

    저자소개

    요우시 리우(Yuxi(Hayden) Liu) [저] 신작알림 SMS신청 작가DB보기
    생년월일 -
    출생지 -
    출간도서 1종
    판매수 38권

    캐나다 토론토의 다국적 온라인 미디어 회사에서 메시징 앱 최적화를 담당하고 있는 데이터 과학자다. 소셜 그래프 마이닝, 소셜 개인화, 사용자 통계 분석과 관심사 예측, 스팸 탐지, 추천 시스템과 관련된 일을 주로 한다. 수년간 데이터 과학자로서 다양한 온라인 광고 회사에서 일한 경력이 있으며 광고 최적화, 클릭스루 비율과 변환 비율 예측, 클릭 위조 탐지 등에 머신 러닝 관련 전문 지식을 적극적으로 적용해왔다. 캐나다의 토론토 대학교(University of Toronto)에서 학위를 마쳤으며 석사 학위 과정 중 5개의 논문을 미국전기전자학회에서 발간하는 IEEE 트

    펼쳐보기
    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    고려대학교 컴퓨터학과(학사/석사)와 서던캘리포니아 대학교(석사)를 졸업하고, 플로리다 대학교에서 데이터 마이닝을 주제로 컴퓨터공학 박사 학위를 취득했다. 삼성SDS연구소에서 클라우드 컴퓨팅, 빅데이터 인프라 플랫폼, 데이터 과학/분석에 관한 다양한 최신 기술을 연구하며 개발 과제를 수행했다. 클라우드 기반 빅데이터 처리와 분석에 관한 풍부한 컨설팅 경험도 갖고 있다. 현재는 아마존 웹 서비스(Amazon Web Services)에서 AI/ML Specialist Solutions Architect로 활동 중이다.

    이 상품의 시리즈

    데이터 과학 시리즈(총 29권 / 현재구매 가능도서 29권)

    펼쳐보기

    이 책과 내용이 비슷한 책 ? 내용 유사도란? 이 도서가 가진 내용을 분석하여 기준 도서와 얼마나 많이 유사한 콘텐츠를 많이 가지고 있는가에 대한 비율입니다.

      리뷰

      0.0 (총 0건)

      기대평

      작성시 유의사항

      평점
      0/200자
      등록하기

      기대평

      6.3

      교환/환불

      교환/환불 방법

      ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

      교환/환불 가능 기간

      고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

      교환/환불 비용

      고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

      교환/환불 불가사유

      반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
      배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

      소비자 피해보상

      소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
      교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

      기타

      도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

      배송안내

      • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

      • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

      • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

      • 배송비

      도서(중고도서 포함) 구매

      2,000원 (1만원이상 구매 시 무료배송)

      음반/DVD/잡지/만화 구매

      2,000원 (2만원이상 구매 시 무료배송)

      도서와 음반/DVD/잡지/만화/
      중고직배송상품을 함께 구매

      2,000원 (1만원이상 구매 시 무료배송)

      업체직접배송상품 구매

      업체별 상이한 배송비 적용