간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (28,220원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (20,790원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (23,760원)
(최대할인 4만원 / 2만원 이상 결제)
Close

밑바닥부터 시작하는 데이터 과학 : 데이터 분석을 위한 파이썬 프로그래밍과 수학·통계 기초

원제 : Data Science from Scratch
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 19
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

33,000원

  • 29,700 (10%할인)

    1,650P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
배송정보
  • 8/17(수) 이내 발송 예정  (서울시 강남구 삼성로 512)
  • 무료배송
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(104)

  • 상품권

AD

책소개

“데이터 과학의 기본 개념을 잡는 입문서!”

이 책은 라이브러리나 프레임워크와 같은 도구를 사용하지 않고 ‘밑바닥부터’ 만들어 보며 데이터 과학과 관련된 알고리즘을 알려 주는 기본서다. 데이터 과학을 배우기 위해 꼭 필요한 기본적인 내용을 중심으로, 책 전반에 걸쳐 수학과 통계학 기초가 녹아든 데이터 과학의 주요 기술을 다룬다.

이번 2판에서는 모든 코드와 예시가 파이썬 3.6으로 수정됐고 타입 어노테이션 등 새로운 기능을 활용한다. 오늘날의 데이터 과학자들이 다루어야 할 딥러닝, 통계, 자연어 처리 등의 주제도 추가됐다. 데이터 분석에 필요한 해킹과 수학·통계학 이론을 살펴보려는 프로그래머라면 기초부터 잡아 주는 강력한 도구로써 이 책의 일독을 권한다.

출판사 서평

〉〉 이 책의 대상 독자
ㆍ 데이터 과학에 필요한 기초와 프로그래밍 두 마리 토끼를 모두 잡고 싶은 전공자
ㆍ 수학·통계학 이론이 녹아든 데이터 과학 관련 알고리즘을 살펴보려는 데이터 과학자
ㆍ 데이터 분석에 필요한 수학·통계학 이론을 살펴보려는 프로그래머

〉〉 이 책에서 다루는 내용
ㆍ 선형대수, 통계, 확률에 관한 기초와 데이터 과학에서 활용하는 법 배우기
ㆍ 데이터를 수집, 탐색, 정제, 가공, 조작하기
ㆍ 기계학습의 원리 탐색하기
ㆍ k-근접 이웃, 나이브 베이즈, 선형 회귀 분석, 로지스틱 회귀 분석, 의사결정나무, 인공신경망, 군집화 등 구현하기
ㆍ 추천 시스템, 자연어 처리, 네트워크 분석, 맵리듀스, 데이터베이스 등 살펴보기
ㆍ 속성으로 파이썬 배우기

추천사

최성철(가천대 산업경영공학과 교수)
데이터 과학을 처음 배울 때 어떤 책을 보면 좋은지 사람들이 물어보면 늘 《밑바닥부터 시작하는 데이터 과학》을 추천한다. “사실 데이터 과학은 어렵지 않다”라고 얘기해 주는 책이기 때문이다. 독자는 처음 볼 때는 어렵게 느껴지는 데이터 과학의 수식들이 코드로 표현하면 얼마나 간단한지 알게 될 것이다. 또 저·역자가 데이터 과학을 얼마나 깊이 이해하고 있는지도 느낄 수 있다. 파이썬을 막 끝내고 처음으로 데이터 과학을 공부하려 한다면 반드시 소장할 것을 권한다.

권정민(ODK Media, 데이터 과학자)
수많은 데이터 과학 관련 책 사이에서 헤매고 있는, 데이터 과학에 발을 들이고자 하는 사람이라면 일단 이 책을 집어 들어도 좋을 것이다. 데이터에 대한 해박한 지식과 실무 감각을 모두 갖춘 저자는 데이터 과학 업무에서 실제로 꼭 필요한 지식을 잘 간추렸다. 파이썬 코드로 많은 내용을 효과적으로 설명하여, 데이터 분석의 기본 개념을 다지면서 흥미를 키우도록 도와준다.

변성윤(쏘카 데이터 그룹, 머신러닝 엔지니어 & 데이터 과학자)
데이터 과학 분야를 처음 접하는 분들이 보면 매우 좋은 책이다. 파이썬, 데이터 시각화, 선형대수, 통계, 데이터 전처리, 기계학습, 데이터베이스, 맵리듀스, 데이터 윤리 등 광범위한 주제를 명확히 설명하여, 데이터 과학에 대한 큰 그림을 그릴 수 있다. 특히 각 장 끝에 있는 “더 공부해 보고 싶다면”을 꼭 읽어보자. 사이킷런이나 텐서플로를 접하기 전에 먼저 이 책을 읽는 것을 추천한다.

목차

1장 들어가기
1.1 데이터 시대의 도래
1.2 데이터 과학이란?
1.3 동기부여를 위한 상상: 데이텀 주식회사
1.3.1 핵심 인물 찾기
1.3.2 데이터 과학자 추천하기
1.3.3 연봉과 경력
1.3.4 유료 계정
1.3.5 관심 주제
1.3.6 시작해 보자

2장 파이썬 속성 강좌
2.1 기본기 다지기
2.2 파이썬 설치하기
2.3 가상 환경
2.4 들여쓰기
2.5 모듈
2.6 함수
2.7 문자열
2.8 예외 처리
2.9 리스트
2.10 튜플
2.11 딕셔너리
2.11.1 defaultdict
2.12 Counter
2.13 Set
2.14 흐름 제어
2.15 True와 False
2.16 정렬
2.17 리스트 컴프리헨션
2.18 자동 테스트와 assert
2.19 객체 지향 프로그래밍
2.20 이터레이터와 제너레이터
2.21 난수 생성
2.22 정규표현식
2.23 함수형 도구
2.24 zip과 인자 언패킹
2.25 args와 kwargs
2.26 타입 어노테이션
2.26.1 타입 어노테이션하는 방법
2.27 데이텀에 오신 것을 환영합니다!
2.28 더 공부해 보고 싶다면

3장 데이터 시각화
3.1 matplotlib
3.2 막대 그래프
3.3 선 그래프
3.4 산점도
3.5 더 공부해 보고 싶다면

4장 선형대수
4.1 벡터
4.2 행렬
4.3 더 공부해 보고 싶다면

5장 통계
5.1 데이터셋 설명하기
5.1.1 중심 경향성
5.1.2 산포도
5.2 상관관계
5.3 심슨의 역설
5.4 상관관계에 대한 추가적인 경고 사항
5.5 상관관계와 인과관계
5.6 더 공부해 보고 싶다면

6장 확률
6.1 종속성과 독립성
6.2 조건부 확률
6.3 베이즈 정리
6.4 확률변수
6.5 연속 분포
6.6 정규분포
6.7 중심극한정리
6.8 더 공부해 보고 싶다면

7장 가설과 추론
7.1 통계적 가설검정
7.2 예시: 동전 던지기
7.3 p-value
7.4 신뢰구간
7.5 p 해킹
7.6 예시: A/B test 해보기
7.7 베이즈 추론
7.8 더 공부해 보고 싶다면

8장 경사 하강법
8.1 경사 하강법에 숨은 의미
8.2 그래디언트 계산하기
8.3 그래디언트 적용하기
8.4 적절한 이동 거리 정하기
8.5 경사 하강법으로 모델 학습
8.6 미니배치와 SGD(Stochastic Gradient Descent)
8.7 더 공부해 보고 싶다면

9장 파이썬으로 데이터 수집하기
9.1 stdin과 stdout
9.2 파일 읽기
9.2.1 텍스트 파일의 기본
9.2.2 구분자가 있는 파일
9.3 웹 스크래핑
9.3.1 HTML과 파싱
9.3.2 예시: 의회 감시하기
9.4 API 사용하기
9.4.1 JSON과 XML
9.4.2 인증이 필요하지 않은 API 사용하기
9.4.3 API 찾기
9.5 예시: 트위터 API 사용하기
9.5.1 인증 받기
9.6 더 공부해 보고 싶다면

10장 데이터 다루기
10.1 데이터 탐색하기
10.1.1 1차원 데이터 탐색하기
10.1.2 2차원 데이터
10.1.3 다차원 데이터
10.2 namedtuple 사용하기
10.3 Dataclasses
10.4 정제하고 합치기
10.5 데이터 처리
10.6 척도 조절
10.7 한편으로: tqdm
10.8 차원 축소
10.9 더 공부해 보고 싶다면

11장 기계학습
11.1 모델링
11.2 기계학습이란?
11.3 오버피팅과 언더피팅
11.4 정확도
11.5 Bias-variance 트레이드오프
11.6 특성 추출 및 선택
11.7 더 공부해 보고 싶다면

12장 k-NN
12.1 모델
12.2 예시: Iris 데이터
12.3 차원의 저주
12.4 더 공부해 보고 싶다면

13장 나이브 베이즈
13.1 바보 스팸 필터
13.2 조금 더 똑똑한 스팸 필터
13.3 구현하기
13.4 모델 검증하기
13.5 모델 사용하기
13.6 더 공부해 보고 싶다면

14장 단순 회귀 분석
14.1 모델
14.2 경사 하강법 사용하기
14.3 최대가능도추정법
14.4 더 공부해 보고 싶다면

15장 다중 회귀 분석
15.1 모델
15.2 최소자승법에 대한 몇 가지 추가 가정
15.3 모델 학습하기
15.4 모델 해석하기
15.5 적합성(Goodness of fit)
15.6 여담: 부트스트랩
15.7 계수의 표준 오차
15.8 Regularization
15.9 더 공부해 보고 싶다면

16장 로지스틱 회귀 분석
16.1 문제
16.2 로지스틱 함수
16.3 모델 적용하기
16.4 적합성
16.5 서포트 벡터 머신
16.6 더 공부해 보고 싶다면

17장 의사결정나무
17.1 의사결정나무란?
17.2 엔트로피
17.3 파티션의 엔트로피
17.4 의사결정나무 만들기
17.5 종합하기
17.6 랜덤포레스트
17.7 더 공부해 보고 싶다면

18장 신경망
18.1 퍼셉트론
18.2 순방향 신경망
18.3 역전파
18.4 예시: Fizz Buzz
18.5 더 공부해 보고 싶다면

19장 딥러닝
19.1 텐서
19.2 층 추상화
19.3 선형 층
19.4 순차적인 층으로 구성된 신경망
19.5 손실 함수와 최적화
19.6 예시: XOR 문제 다시 풀어 보기
19.7 다른 활성화 함수
19.8 예시: FizzBuzz 다시 풀어 보기
19.9 Softmax와 Cross-Entropy
19.10 드롭아웃
19.11 예시: MNIST
19.12 모델 저장 및 불러오기
19.13 더 공부해 보고 싶다면

20장 군집화
20.1 군집화 감 잡기
20.2 모델
20.3 예시: 오프라인 모임
20.4 k 값 선택하기
20.5 예시: 색 군집화하기
20.6 상향식 계층 군집화
20.7 더 공부해 보고 싶다면

21장 자연어 처리
21.1 워드 클라우드
21.2 n-그램 언어모델
21.3 문법 규칙
21.4 여담: 깁스 샘플링
21.5 토픽 모델링
21.6 단어 벡터
21.7 재귀 신경망
21.8 예시: 문자 단위의 RNN 사용하기
21.9 더 공부해 보고 싶다면

22장 네트워크 분석
22.1 매개 중심성
22.2 고유벡터 중심성
22.2.1 행렬 곱셈
22.2.2 중심성
22.3 방향성 그래프와 페이지랭크
22.4 더 공부해 보고 싶다면

23장 추천 시스템
23.1 수작업을 이용한 추천
23.2 인기도를 활용한 추천
23.3 사용자 기반 협업 필터링
23.4 상품 기반 협업 필터링
23.5 행렬 분해
23.6 더 공부해 보고 싶다면

24장 데이터베이스와 SQL
24.1 CREATE TABLE과 INSERT
24.2 UPDATE
24.3 DELETE
24.4 SELECT
24.5 GROUP BY
24.6 ORDER BY
24.7 JOIN
24.8 서브쿼리
24.9 인덱스
24.10 쿼리 최적화
24.11 NoSQL
24.12 더 공부해 보고 싶다면

25장 맵리듀스
25.1 예시: 단어 수 세기
25.2 왜 맵리듀스인가?
25.3 맵리듀스 일반화하기
25.4 예시: 사용자의 글 분석하기
25.5 예시: 행렬 곱셈
25.6 여담: Combiner
25.7 더 공부해 보고 싶다면

26장 데이터 윤리
26.1 데이터 윤리란 무엇인가?
26.2 아니, 진짜로, 데이터 윤리가 뭔데?
26.3 데이터 윤리에 대해 신경 써야 할까?
26.4 나쁜 데이터 제품 만들기
26.5 정확도와 공정함의 균형을 유지하기
26.6 협력
26.7 해석 가능성
26.8 추천
26.9 편향된 데이터
26.10 데이터 보호
26.11 요약
26.12 더 공부해 보고 싶다면

27장 본격적으로 데이터 과학하기
27.1 IPython
27.2 수학
27.3 밑바닥부터 시작하지 않는 방법
27.3.1 NumPy
27.3.2 pandas
27.3.3 scikit-learn
27.3.4 시각화
27.3.5 R
27.3.6 딥러닝
27.4 데이터 찾기
27.5 데이터 과학하기
27.5.1 해커 뉴스
27.5.2 소방차
27.5.3 티셔츠
27.5.4 지구본 위의 트윗
27.5.5 그리고 여러분은?

저자소개

조엘 그루스 [저] 신작알림 SMS신청
생년월일 -

저자 조엘 그루스(Joel Grus)는 Allen Institute for Artificial Intelligence의 연구원이다. 이전에는 구글에서 소프트웨어 엔지니어로, 여러 스타트업에서는 데이터 과학자로 근무했다. 현재 시애틀에 거주하면서 여러 개의 데이터 과학 밋업에 참여하고 있다. joelgrus.com에 종종 글을 쓰며, @joelgrus라는 계정으로 종일 트위터를 한다.

김한결 [역] 신작알림 SMS신청
생년월일 -

저자 김한결은 KAIST에서 산업 및 시스템공학을 전공하고 서울대학교 산업공학과에서 석사 학위를 받았다. 에너지, 자동차, 금융, 제조 등 다양한 분야에서 데이터 분석 프로젝트를 진행했다. 《D3를 이용한 시각적 스토리텔링》(인사이트)을 공역했다.

하성주, 박은정 [역] 신작알림 SMS신청
생년월일 -

해당작가에 대한 소개가 없습니다.

이 상품의 시리즈

(총 115권 / 현재구매 가능도서 105권)

선택한 상품 북카트담기
펼쳐보기

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    9.5

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    상호

    (주)교보문고

    대표자명

    안병현

    사업자등록번호

    102-81-11670

    연락처

    1544-1900

    전자우편주소

    callcenter@kyobobook.co.kr

    통신판매업신고번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    (주) 인터파크 안전결제시스템 (에스크로) 안내

    (주)인터파크의 모든 상품은 판매자 및 결제 수단의 구분없이 회원님들의 구매안전을 위해 안전결제 시스템을 도입하여 서비스하고 있습니다.
    결제대금 예치업 등록 : 02-006-00064 서비스 가입사실 확인

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시, 1만 원 이상 무료, 1만원 미만 2천 원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용