간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (32,490원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (23,940원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (27,360원)
(최대할인 4만원 / 2만원 이상 결제)
Close

파이썬 데이터 사이언스 핸드북 : IPython, Jupyter, NumPy, Pandas, Matplotlib, Scikit-Learn

원제 : Python Data Science Handbook
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 17
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기

라이브라이브러리를 활용한 데이터 과학과 머신러닝

정가

38,000원

  • 34,200 (10%할인)

    1,900P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
  • 4/1(토) 이내 발송 예정  (서울시 강남구 삼성로 512)
  • 무료배송
  • 주문수량
    감소 증가
    • 이벤트/기획전

    • 연관도서(54)

    • 상품권

    AD

    책소개

    ≪파이썬 데이터 사이언스 핸드북≫은 데이터 과학에 대한 갈증을 해소하기에 좋은 입문서다. 초보자부터 전문가까지 아우르는 넓은 사용자층을 가진 매력적인 언어인 파이썬 언어가 제공하는 과학 스택을 이용해 실제 데이터 과학 분야에서 자주 만나는 상황을 해결해 나감으로써 이론부터 실전까지 적절하게 아우르고 있다.

    이 책에서는 같은 데이터 타입을 가진 배열 기반의 데이터를 처리하기 위한 NumPy, 여러 가지 데이터 타입의 레이블이 붙은 데이터를 처리하는 Pandas, 보편적인 과학 계산 작업을 위한 SciPy, 게재 가능한 수준의 시각화를 위한 MatPlotlib, 대화형 코드 실행과 공유를 위한 IPython, 머신러닝을 위한 Scikit-Learn 라이브러리를 집중적으로 다루며, 특히 5장에서는 머신러닝 전체를 조망하고 각 기법을 어떻게 응용할 수 있는지 살펴볼 수 있어 실전 감각을 익히기에 부족함이 없도록 구성하고 있다.

    출판사 서평

    많은 연구원에게 파이썬은 데이터를 저장, 가공하고 데이터에서 통찰력을 얻을 수 있는 라이브러리 덕분에 데이터를 다루기에 최고의 도구로 여겨진다. 여러 참고 자료에서 파이썬 라이브러리를 소개하지만, 대부분은 각 라이브러리를 개별적으로 다룬다. 하지만 ≪파이썬 데이터 사이언스 핸드북≫은 IPython, NumPy, Pandas, Matplotlib, Scikit-Learn을 비롯한 관련 도구를 모두 다룬다.

    파이썬 코드를 읽고 작성하는 데 익숙한 과학자나 데이터 분석가라면 이 책이 데이터의 가공, 변환, 정제와 다른 유형의 데이터 시각화, 통계 모델이나 머신러닝 모델 구축을 위한 데이터 활용 면에서 흔히 발생하는 문제를 해결하기에 가장 이상적인 종합 참고서가 될 것이다. 간단히 말해, 이 책은 파이썬으로 과학 컴퓨팅을 하기 위해서 반드시 소장해야 할 책이다.

    이 핸드북을 통해 다음 도구의 사용법을 학습할 수 있다.

    ◎ IPython과 Jupyter: 파이썬을 이용하는 데이터 과학자를 위한 컴퓨팅 환경 제공
    ◎ NumPy: 파이썬의 복잡한 데이터 배열을 효율적으로 저장하고 가공할 수 있는 ndarray(n 차원 배열 객체) 제공
    ◎ Pandas: 파이썬에서 레이블이 붙거나 칼럼 형식의 데이터를 효율적으로 저장하고 가공하기 위한 DataFrame 자료구조 제공
    ◎ Matplotlib: 파이썬을 이용한 유연한 데이터 시각화 기능 제공
    ◎ Scikit-Learn: 기존 머신러닝 알고리즘 중 가장 중요한 것을 파이썬으로 효율적이고 깔끔하게 구현한 라이브러리

    추천사

    “파이썬으로 데이터 과학을 배우고자 하는 독자에게 이 책은 환상적인 출발점이 될 것이다. 이 책으로 컴퓨터 과학 및 통계학 전공자들을 성공적으로 가르쳤다. 저자는 오픈소스 도구의 기본을 훨씬 넘어서는 내용을 명확한 언어와 이해하기 쉬운 설명으로 데이터 과학의 기본 개념과 패턴, 사상을 설명하고 있다.” (캘리포니아 폴리테크닉 주립 대학교 물리학부 교수이자 주피터 프로젝트 공동 설립자)

    목차

    ▣ 01장: IPython - 파이썬에 날개를 달자

    셸과 노트북, 어느 것을 사용할까?
    ___IPython 셸 실행하기
    ___Jupyter 노트북 실행하기
    IPython의 도움말과 문서
    ___?로 문서 확인하기
    ___??로 소스코드에 접근하기
    ___탭 자동 완성으로 모듈 탐색하기
    IPython 셸에서 사용할 수 있는 키보드 단축키
    ___탐색 단축키
    ___텍스트 입력 단축키
    ___명령어 이력 단축키
    ___기타 단축키
    IPython 매직 명령어
    ___코드 블록 붙여넣기: %paste와 %cpaste
    ___외부 코드 실행: %run
    ___코드 실행 시간 측정: %timeit
    ___매직 함수에 관한 도움말: ?, %magic, %lsmagic
    입력/출력 이력
    ___IPython의 In과 Out 객체
    ___밑줄 표시 단축키와 이전 출력값
    ___출력값 숨기기
    ___관련 매직 명령어
    IPython과 셸 명령어
    ___셸이란?
    ___IPython에서의 셸 명령어
    ___셸에 값 전달하기 및 셸의 값 전달받기
    셸 관련 매직 명령어
    에러와 디버깅
    ___예외 제어: %xmode
    ___디버깅: 역추적 내용을 확인하는 것으로 충분하지 않을 경우
    코드 프로파일링 및 시간 측정
    ___코드 조각의 실행 시간 측정하기: %timeit과 %time
    ___전체 스크립트 프로파일링하기: %prun
    ___%lprun으로 라인 단위 프로파일링하기
    메모리 사용 프로파일링: %memit과 %mprun
    IPython 추가 참고 자료
    ___웹 자료
    ___책

    ▣ 02장: NumPy 소개

    파이썬의 데이터 타입 이해하기
    ___파이썬 정수는 정수 이상이다
    ___파이썬 리스트는 리스트 이상이다
    ___파이썬의 고정 타입 배열
    ___파이썬 리스트에서 배열 만들기
    ___처음부터 배열 만들기
    ___NumPy 표준 데이터 타입
    NumPy 배열의 기초
    ___NumPy 배열 속성 지정
    ___배열 인덱싱: 단일 요소에 접근하기
    ___배열 슬라이싱: 하위 배열에 접근하기
    ___배열 재구조화
    ___배열 연결 및 분할
    NumPy 배열 연산: 유니버설 함수
    ___루프는 느리다
    ___UFuncs 소개
    ___NumPy 유니버설 함수(UFuncs)
    ___고급 Ufunc 기능
    ___Ufuncs: 더 알아보기
    집계: 최솟값, 최댓값, 그리고 그사이의 모든 것
    ___배열의 값의 합 구하기
    ___최솟값과 최댓값
    ___예제: 미국 대통령의 평균 신장은 얼마일까?
    배열 연산: 브로드캐스팅
    ___브로드캐스팅 소개
    ___브로드캐스팅 규칙
    ___실전 브로드캐스팅
    비교, 마스크, 부울 로직
    ___예제: 비온 날 세기
    ___ufunc으로서의 비교 연산자
    ___부울 배열로 작업하기
    ___마스크로서의 부울 배열
    팬시 인덱싱
    ___팬시 인덱싱 알아보기
    ___결합 인덱싱
    ___예제: 임의의 점 선택하기
    ___팬시 인덱싱으로 값 변경하기
    ___예제: 데이터 구간화
    ___배열 정렬
    ___NumPy의 빠른 정렬: np.sort와 np.argsort
    ___부분 정렬: 파티션 나누기
    ___예제: k 최근접 이웃 알고리즘
    구조화된 데이터: NumPy의 구조화된 배열
    ___구조화된 배열 만들기
    ___고급 복합 타입
    ___레코드 배열: 트위스트를 가진 구조화된 배열
    ___Pandas로 넘어가며

    ▣ 03장: Pandas로 데이터 가공하기

    Pandas 설치 및 사용
    Pandas 객체 소개
    ___Pandas Series 객체
    ___Pandas DataFrame 객체
    ___Pandas Index 객체
    데이터 인덱싱과 선택
    ___Series에서 데이터 선택
    ___DataFrame에서 데이터 선택
    ___Pandas에서 데이터 연산하기
    ___유니버설 함수: 인덱스 보존
    ___유니버설 함수: 인덱스 정렬
    ___유니버설 함수: DataFrame과 Series 간의 연산
    누락된 데이터 처리하기
    ___누락된 데이터 처리 방식의 트레이드오프
    ___Pandas에서 누락된 데이터
    ___널 값 연산하기
    계층적 인덱싱
    ___다중 인덱스된 Series
    ___MultiIndex 생성 메서드
    ___MultiIndex 인덱싱 및 슬라이싱
    ___다중 인덱스 재정렬하기
    ___다중 인덱스에서 데이터 집계
    데이터세트 결합: Concat과 Append
    ___복습: NumPy 배열 연결
    ___pd.concat을 이용한 간단한 연결
    데이터세트 결합하기: 병합과 조인
    ___관계 대수
    ___조인 작업의 분류
    ___병합 키 지정
    ___조인을 위한 집합 연산 지정하기
    ___열 이름이 겹치는 경우: suffixes 키워드
    ___예제: 미국 주 데이터
    집계와 분류
    ___행성 데이터
    ___Pandas의 간단한 집계 연산
    ___GroupBy: 분할, 적용, 결합
    피벗 테이블
    ___피벗 테이블 시작
    ___피벗 테이블 등장 배경
    ___피벗 테이블 구문
    ___예제: 출생률 데이터
    벡터화된 문자열 연산
    ___Pandas 문자열 연산 소개
    ___Pandas 문자열 메서드 목록
    ___예제: 조리법 데이터베이스
    시계열 다루기
    ___파이썬에서의 날짜와 시간
    Pandas 시계열: 시간으로 인덱싱하기
    ___Pandas 시계열 데이터 구조
    ___주기와 오프셋
    ___리샘플링, 시프팅, 윈도잉
    ___추가 학습 자료
    ___예제: 시애틀 자전거 수 시각화
    고성능 Pandas: eval()과 query()
    ___query()와 eval()의 등장 배경: 복합 표현식
    ___효율적인 연산을 위한 pandas.eval()
    ___열 단위의 연산을 위한 DataFrame.eval()
    ___DataFrame.query() 메서드
    ___성능: 이 함수를 사용해야 하는 경우
    추가 자료

    ▣ 04장: Matplotlib을 활용한 시각화

    일반적인 Matplotlib 사용법
    ___matplotlib 임포트하기
    ___스타일 설정하기
    ___show()를 사용할 것인가, 말 것인가 - 플롯 표현 방법
    ___그림을 파일로 저장하기
    하나 가격에 인터페이스 두 개
    간단한 라인 플롯
    ___플롯 수정하기: 선 색상과 스타일
    ___플롯 조정하기: 축 경계
    ___플롯에 레이블 붙이기
    간단한 산점도
    ___plt.plot을 사용한 산점도
    ___plt.scatter를 활용한 산점도
    ___plot과 scatter의 차이: 효율성 측면에서 유의할 점
    오차 시각화하기
    ___기본 오차 막대
    ___연속 오차
    밀도 플롯과 등고선 플롯
    ___3차원 함수 시각화하기
    히스토그램, 구간화, 밀도
    ___2차원 히스토그램과 구간화
    플롯 범례 맞춤 변경하기
    ___범례에 사용할 요소 선택하기
    ___점 크기에 대한 범례
    ___다중 범례
    ___색상 막대 맞춤 변경하기
    ___색상 막대 맞춤 변경하기
    ___예제: 손으로 쓴 숫자
    다중 서브플롯
    ___plt.axes: 직접 만든 서브플롯
    ___plt.subplot: 간단한 서브플롯의 그리드
    ___plt.subplots: 한 번에 전체 그리드 만들기
    ___plt.GridSpec: 복잡한 배치
    텍스트와 주석
    ___예제: 미국 출생률에 휴일이 미치는 영향
    ___변환 및 텍스트 위치
    ___화살표와 주석
    눈금 맞춤 변경하기
    ___주 눈금과 보조 눈금
    ___눈금 또는 레이블 숨기기
    ___눈금 개수 줄이기와 늘리기
    ___팬시 눈금 포맷
    포맷 지시자와 위치 지시자 요약
    Matplotlib 맞춤변경하기: 설정과 스타일시트
    ___직접 플롯 변경하기
    ___기본값 변경하기: rcParams
    ___스타일시트
    Matplotlib에서 3차원 플로팅하기
    3차원 점과 선
    ___3차원 등고선 플롯
    ___와이어프레임과 표면도
    ___표면 삼각측량법
    Basemap을 활용한 지리 데이터
    ___지도 투영법(Map Projections)
    ___지도 배경 그리기
    ___지도상에 데이터 플로팅하기
    ___예제: 캘리포니아 도시
    ___예제: 표면 온도 데이터
    Seaborn을 활용한 시각화
    ___Seaborn과 Matplotlib의 차이
    ___Seaborn 플롯 탐색하기
    ___예제: 마라톤 완주 시간 탐색
    기타 자료
    ___Matplotlib 자료
    ___기타 파이썬 그래픽 라이브러리

    ▣ 05장: 머신러닝

    머신러닝이란 무엇인가?
    ___머신러닝의 범주
    ___머신러닝 응용의 정성적 사례
    ___정리
    Scikit-Learn 소개
    ___Scikit-Learn에서의 데이터 표현 방식
    ___Scikit-Learn의 Estimator API
    ___응용: 손으로 쓴 숫자 탐색
    초모수와 모델 검증
    ___모델 검증에 대한 고려사항
    ___최적의 모델 선택하기
    ___학습 곡선
    ___실제 검증: 그리드 검색
    특징 공학
    ___범주 특징
    ___텍스트 특징
    ___이미지 특징
    ___유도 특징
    ___누락 데이터의 대체
    ___특징 파이프라인
    심화 학습: 나이브 베이즈 분류
    ___베이즈 분류
    ___가우스 나이브 베이즈
    ___다항분포 나이브 베이즈
    ___언제 나이브 베이즈 모델을 사용할 것인가
    심화학습: 선형 회귀
    ___단순 선형 회귀
    ___기저 함수 회귀
    ___예제: 자전거 통행량 예측
    심화 학습: 서포트 벡터 머신
    ___서포트 백터 머신의 동기
    ___서포트 벡터 머신: 마진 최대화
    ___예제: 안면 인식
    ___서포트 벡터 머신 정리
    심화 학습: 의사결정 트리와 랜덤 포레스트
    ___랜덤 포레스트 등장 배경: 의사결정 트리
    ___추정 모델의 앙상블: 랜덤 포레스트
    ___랜덤 포레스트 회귀
    ___예제: 랜덤 포레스트를 사용한 숫자 분류
    랜덤 포레스트 정리
    심화 학습: 주성분 분석
    ___주성분 분석 소개
    ___PCA 응용: 노이즈 필터링
    ___예제: 고유얼굴
    ___주성분 분석 정리
    심화 학습: 다양체 학습
    ___다양체 학습: ‘HELLO’
    ___다차원 척도법(MDS, Multidimensional Sacling)
    ___다양체 학습으로서의 MDS
    ___비선형 임베딩: MDS가 실패한 경우
    ___비선형 다양체 학습: 국소 선형 임베딩
    ___다양체 방식에 대한 몇 가지 생각
    ___예제: 얼굴 데이터에 아이소맵 적용
    ___예제: 숫자 데이터의 구조 시각화
    심화 학습: k-평균 군집화
    ___k-평균 소개
    ___예제
    심화 학습: 가우스 혼합 모델
    ___GMM 등장 배경: k-평균의 약점
    ___E-M 단계 일반화하기: 가우스 혼합 모델
    ___밀도 추정에 GMM 사용하기
    ___예제: 새로운 데이터를 생성하는 GMM
    심화 학습: 커널 밀도 추정
    ___KDE 등장 배경: 히스토그램
    ___커널 밀도 추정의 실제 적용
    ___예제: 구(球)에 KDE 적용하기
    ___예제: 나이브하지 않은 베이즈(Not-So-Naive Bayes)
    응용: 안면 인식 파이프라인
    ___HOG 특징
    ___실제 HOG: 간단한 안면 인식기
    ___주의사항 및 개선사항
    머신러닝 관련 추가 자료
    ___파이썬에서의 머신러닝
    ___일반적인 머신러닝

    관련이미지

    저자소개

    제이크 밴더플래스 [저] 신작알림 SMS신청
    생년월일 -

    해당작가에 대한 소개가 없습니다.

    김정인 [역] 신작알림 SMS신청
    생년월일 -

    저자 김정인은 현재 기업 빅데이터 전략팀에서 근무하고 있다. 옮긴 책으로는 《케라스로 구현하는 고급 딥러닝 알고리즘》 《실전! Core ML을 활용한 머신러닝 iOS 앱 개발》 《실전활용! 텐서플로 딥러닝 프로젝트》 《마이크로소프트 봇 프레임워크 프로그래밍》 《애자일 데이터 과학 2.0》 《구글 애널리틱스 완벽 가이드》 《파이썬 데이터 사이언스 핸드북》 《러닝 스칼라》등이 있다.

    이 상품의 시리즈

    (총 54권 / 현재구매 가능도서 53권)

    선택한 상품 북카트담기
    펼쳐보기

    전공도서/대학교재 분야에서 많은 회원이 구매한 책

      리뷰

      0.0 (총 0건)

      100자평

      작성시 유의사항

      평점
      0/100자
      등록하기

      100자평

      10.0
      (총 0건)

      판매자정보

      • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

      상호

      (주)교보문고

      대표자명

      안병현

      사업자등록번호

      102-81-11670

      연락처

      1544-1900

      전자우편주소

      callcenter@kyobobook.co.kr

      통신판매업신고번호

      01-0653

      영업소재지

      서울특별시 종로구 종로 1(종로1가,교보빌딩)

      교환/환불

      반품/교환 방법

      ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

      반품/교환가능 기간

      변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
      단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

      반품/교환 비용

      변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
      상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

      반품/교환 불가 사유

      ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
      (단지 확인을 위한 포장 훼손은 제외)

      ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
      예) 화장품, 식품, 가전제품(악세서리 포함) 등

      ·복제가 가능한 상품 등의 포장을 훼손한 경우
      예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

      ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

      ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

      상품 품절

      공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

      소비자 피해보상
      환불지연에 따른 배상

      ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

      ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

      (주) 인터파크커머스 안전결제시스템 (에스크로) 안내

      (주)인터파크커머스의 모든 상품은 판매자 및 결제 수단의 구분없이 회원님들의 구매안전을 위해 안전결제 시스템을 도입하여 서비스하고 있습니다.
      결제대금 예치업 등록 : 02-006-00064 서비스 가입사실 확인

      배송안내

      • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

      • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

      • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

      • 배송비는 업체 배송비 정책에 따릅니다.

      • - 도서 구매 시 15,000원 이상 무료배송, 15,000원 미만 2,500원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용