간편결제, 신용카드 청구할인
네이버페이 1%
(네이버페이 결제 시 적립)
NH(올원페이)카드 12% (23,760원)
(3만원 이상 결제/최대 1만원 할인)
북피니언 롯데카드 30% (18,900원)
(최대할인 3만원 / 3만원 이상 결제)
하나SK 북&카드 30% (18,900원)
(최대할인 3만원 / 3만원 이상 결제)
EBS 롯데카드 20% (21,600원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 NEW 우리V카드 10% (24,300원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 현대카드 7% (25,110원)
(최대할인 3만원 / 3만원 이상 결제)
Close

데이터 과학자가 되는 핵심 기술 : 데이터 분석에 필요한 수학, 통계, 프로그래밍의 기본

원제 : Principles of Data Science: Learn the techniques and math you need to start making sense of your data

2013년 9월 9일 이후 누적수치입니다.

판매지수 171
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

30,000원

  • 27,000 (10%할인)

    1,500P (5%적립)

할인혜택
적립혜택자동적립
배송정보
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(320)

  • 사은품(2)

책소개

이 책은 데이터 과학의 원리를 전달하려는 기본적 취지에 맞게, 통계나 수학적 수식이 형성되는 개념을 설명해 준다. 꼭 필요한 최소한의 수학적 개념만 소개하기 때문에 수학 울렁증이 있는 사람도 쉽게 읽을 수 있다. 목적을 이해하고 원리를 알면 수식을 무작정 외울 필요가 없다는 것을 이제야 깨닫게 될 것이다. 더불어 데이터 과학에서 통계, 수학, R과 파이썬 같은 프로그래밍 지식이 왜 필요한지 확실히 알게 된다. 데이터의 수집부터 필요한 정보만 정제하고, 유형을 살펴서 분석하고, 결과의 해석까지 필요한 원리를 복합적으로 다룬다.

출판사 서평

이 책에서 다루는 내용
- 데이터 과학의 가장 중요한 다섯 가지 단계
- 데이터를 현명하게 다루는 방법
- 수학과 프로그래밍 간의 격차 해소
- 확률과 계산법, 통계적 모델을 사용해 데이터를 정제하고 실행 가능한 결과를 얻는 방법
- 기본적인 머신 러닝 모델의 구축과 평가
- 머신 러닝 모델의 성공 여부를 결정짓는 가장 효과적인 측정 지표 탐색
- 실행 가능한 통찰력을 전달하는 데이터 시각화
- 머신 러닝 개념을 문제에 적용한 실제 예측

이 책의 대상 독자
이 책은 모든 도메인에 대한 데이터 과학의 기본 업무를 이해하고 활용하고자 하는 사람들을 위한 책이다. 기본 수학(대수, 확률)을 잘 알고 있어야 하며, 의사 코드뿐만 아니라 R/파이썬의 코드 조각을 읽기 편해야 한다. 데이터 분야의 작업 경험은 없어도 된다. 그러나 이 책에서 제시한 기술을 배워서 자신들의 데이터셋이나 제공된 데이터셋에 적용하려는 열정은 있어야 한다.

이 책의 구성
1장. '데이터 과학자처럼 말하는 방법'에서는 데이터 과학자가 사용하는 기본 용어를 소개하고, 이 책 전반에 걸쳐 해결할 문제의 유형을 살펴본다.
2장. '데이터 유형'에서는 데이터의 다양한 수준과 유형 및 각 유형을 조작하는 방법을 살펴보면서 데이터 과학에 필요한 수학을 다루기 시작한다.
3장. '데이터 과학의 다섯 단계'에서는 데이터 조작 및 정제를 비롯해 데이터 과학을 수행하는 다섯 가지 기본 단계를 알아보고, 각 단계의 예를 자세히 보여준다.
4장. '기초 수학'에서는 미적분 선형 대수 등의 예를 살펴보고 해결함으로써 데이터 과학자의 행동을 안내하는 기본 수학 원리를 발견할 수 있다.
5장. '확률의 기초와 원리'에서는 초보자의 시각으로 확률 이론을 살펴보고 무작위 세상을 이해하는 데 확률이 어떻게 사용되는지 설명한다.
6장. '고급 확률'에서는 앞에서 살펴본 원리를 사용하고 세상의 숨겨진 의미를 밝히기 위해 베이즈 정리 같은 원리를 소개하고 적용한다.
7장. '기초 통계'에서는 통계적 추론이 실험의 기본, 표준화, 무작위 표본 추출을 사용해서 설명하려는 문제 유형을 다룬다.
8장. '고급 통계'에서는 가설 검정과 신뢰 구간을 사용해 실험으로부터 통찰력을 얻는다. 적절한 검정 방법을 선택하고, p-값과 다른 결과를 해석하는 것은 매우 중요하다.
9장. '데이터 의미 전달'에서는 상관관계와 인과관계가 데이터 해석에 어떻게 영향을 주는지 설명한다. 또한 결과를 세상과 공유하기 위해 시각화를 사용한다.
10장. '머신 러닝 요점'에서는 머신 러닝의 정의에 중점을 두고 머신 러닝이 언제 어떻게 적용되는지에 대한 실제 사례를 살펴본다. 모델 평가의 타당성에 대한 기본적인 지식도 소개한다.
11장. '의사 결정 트리에서 자라는 예측'에서는 좀 더 복잡한 데이터 관련 작업을 해결하기 위해 의사 결정 트리 및 베이지안 기반 예측과 같은 좀 더 복잡한 머신 러닝 모델을 살펴본다.
12장. '필수 요소를 넘어서'에서는 편향과 분산을 포함해 데이터 과학을 안내하는 신비한 힘을 소개한다. 신경망은 현대의 딥러닝 기술로 소개한다.
13장. '사례 연구'에서는 다수의 사례 연구를 통해 데이터 과학의 아이디어를 확고히 한다. 주가 예측 및 필체 감지를 비롯해 여러 가지 예를 통해 전체 데이터 과학의 작업 흐름을 처음부터 끝까지 여러 번 따라갈 것이다.

목차

1장. 데이터 과학자처럼 말하는 방법
데이터 과학이란 무엇인가?
데이터 과학 벤 다이어그램
도메인 지식
더 많은 전문 용어
데이터 과학 사례 연구
요약

2장. 데이터 유형
데이터의 특색
데이터를 구분해야 하는 이유
구조적 데이터와 비구조적 데이터 비교
정량적 데이터와 정성적 데이터
지금까지 정리
데이터의 4가지 수준
제 눈에 안경인 데이터
요약

3장. 데이터 과학의 다섯 단계
데이터 과학 개론
다섯 단계 개요
데이터 탐색
요약

4장. 기초 수학
학문으로서의 수학
기본 기호 및 용어
선형 대수학
요약

5장. 확률의 기초와 원리
기본 정의
확률
베이지안과 빈도 확률
복합 이벤트
조건부 확률
확률의 규칙
조금 깊이 들어가기
요약

6장. 고급 확률
전체 포괄적인 이벤트
베이지안 아이디어 재검토
확률 변수
요약

7장. 기초 통계
통계란?
데이터를 얻고 표본 추출하는 방법
표본 추출 데이터
통계를 측정하는 방법
경험적 규칙
요약

8장. 고급 통계
점 추정치
표본 분포
신뢰 구간
가설 검정
요약

9장. 데이터 의미 전달
커뮤니케이션이 중요한 이유
효과적인 시각화와 비효과적인 시각화 식별
그래프와 통계가 거짓말할 때
구두 의사소통
왜/어떻게/어떤 프레젠테이션 전략
요약

10장. 머신 러닝 요점
머신 러닝이란 무엇인가?
머신 러닝은 완벽하지 않다.
머신 러닝은 어떻게 작동하는가?
머신 러닝의 유형
통계적 모델링은 이 모든 것을 어떻게 맞출까?
선형 회귀
로지스틱 회귀
확률, 공산, 로그 공산

11장. 의사 결정 트리에서 자라는 예측
나이브 베이즈 분류
의사 결정 트리
자율 학습
K-means 클러스터링
K와 클러스터 검증을 위한 최적의 수 선택
특징 추출 및 주요 구성 요소 분석
요약

12장. 필수 요소를 넘어서
편향 분산 트레이드오프
K겹 교차 검증
그리드 검색
앙상블 기술
신경망
요약

13장. 사례 연구
사례 연구 1: 소셜 미디어를 기반주가 예측
사례 연구 2: 왜 일부 사람들은 배우자를 속일까?
사례 연구 3: 텐서플로 사용
요약

본문중에서

이 책의 주제는 데이터 과학이다. 데이터 과학은 지난 수십 년 동안 빠르게 성장해 온 연구 및 응용 분야로, 점점 커져가는 미디어 시장과 직업 시장에서 많은 주목을 받고 있다. 최근 미국은 최초의 수석 데이터 과학자로 DJ 파틸(Patil)을 임명했다. 솔직히 말하면 이러한 움직임은 대대적으로 데이터 팀을 채용하기 시작한 기술 회사를 모델로 한 것이다. 데이터 과학 기술은 수요가 많고 응용 분야는 오늘날의 직업 시장보다 훨씬 더 범위가 확장되고 있다. 이 책은 수학/프로그래밍/도메인 전문 지식 간의 격차를 줄이려고 한다. 오늘날 대부분의 사람은 그중 적어도 한 가지(아마도 두 가지)의 전문 지식을 보유하고 있지만, 바람직한 데이터 과학은 세 가지 모두 조금씩 필요하다. 우리는 세 가지 영역의 주제로 뛰어들어 복잡한 문제를 해결할 것이다. 또한 과학적이고 정확한 결론을 도출하기 위해 데이터를 정제하고 탐색하고 분석할 것이다. 복잡한 데이터 작업을 해결하기 위해 머신 러닝과 딥러닝 기술이 적용될 것이다.
('지은이의 말' 중에서)

구글에서 'Data Science'로 검색하면 약 7천만 건의 결과가 나오고, '데이터 과학'으로 검색하면 70만 건의 한국어 검색 결과가 나온다. 데이터 과학 분야가 자리를 잡아가고 있음을 보여주는 유의미한 숫자다. 데이터 과학은 이미 오래전부터 통계, 수학, 프로그래밍 분야에서 존재해 왔다. 과거 '데이터 과학'은 그리 많지 않은 데이터 속에서 분야별로 추구하는 목적과 접근 방법이 달랐다면, 요즘은 잠자기 전까지도 손을 떼지 못하게 만드는 모바일 디지털 환경과 매 순간을 알리고 싶은 소셜 미디어 유저들의 활동으로 인해 기하급수적으로 늘어난 데이터를 과학적으로 해석하려는 것을 아우르는 개념이 '데이터 과학'이다. 이 책은 데이터 과학에서 통계, 수학, R과 파이썬 같은 프로그램을 왜 공부해야 하는지 확실히 알려준다. 데이터를 수집해서 정제하고, 유형을 살펴서 분석하고, 해석까지 필요한 원리를 복합적으로 다룬다. 꼭 필요한 최소한의 수학적 개념을 소개하지만, 수학 울렁증이 있는 사람도 쉽게 읽을 수 있다. 이 책을 읽고 나면 등한시했던 확률을 중심으로 수학과 통계를 재정립할 수 있다. 또한 데이터 과학의 원리를 전달하려는 이 책의 기본적 취지에 맞게 통계나 수학적 수식이 형성되는 개념도 설명해준다. 목적을 이해하고 원리를 알면 수식을 무작정 외울 필요가 없다는 것을 깨닫게 된다. 그리고 원리를 실행으로 옮겨 보기 위해 파이썬으로 실습할 수 있게 했다. 정확히 말하면 데이터 과학에 필요한 기본적인 파이썬 모듈을 익히게 된다. 프로그래밍을 잘 몰라도 파이썬 코드를 이해하기 쉽도록 기술했다. 읽어 갈수록 어렵다면 파이썬 내장 함수 구문을 따라 하기만 해도 된다. 핵심은 파이썬의 출력 결과를 정확히 해석하는 것이다. 단순히 통계 용어 풀이가 아니라, 다양한 예제를 통해 여러 관점에서 통계를 적용하는 안목을 키울 수 있다. 특히 현실적인 경험을 예제로 다루기 때문에 이해가 쉽고 나중에 응용하기에도 유리하다. 머신 러닝을 알게 되고 실습을 따라 해보면 딥러닝과 텐서플로도 엿볼 수 있다. 여러 가지 재미있는 예제도 많다. 안면 인식, 필체 감지, 트윗으로 주가 예측, 심지어 배우자의 외도를 예측하는 모델도 다룬다. 궁극적으로 이 책은 데이터 과학을 위해 기초 수학과 통계가 어떻게 연결돼 있는지 비밀을 푸는 열쇠를 제공한다. 이제 책을 펼쳐서 열쇠를 찾아보자!
('옮긴이의 말' 중에서)

저자소개

시난 오즈데미르(Sinan Ozdemir) [저] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 2종
판매수 30권

데이터 과학자이고, 스타트업 창업자이자 교육자다. 샌프란시스코 베이 지역에서 강아지 찰리와 고양이 유클리드, 수염 난 도마뱀 피에로와 함께 살고 있다. 존스홉킨스대학교에서 순수 수학을 공부하면서 학업을 시작했다. 존스홉킨스대학교와 주 의회에서 수년간 데이터 과학을 강의했다. 이후에는 인공 지능 및 데이터 과학을 사용하는 스타트업(Legion Analytics)을 설립해 기업의 영업 팀을 지원하고 있다. 와이콤비네이터(Y Combinator) 액셀러레이터에서 연구원 생활을 마친 후 빠르게 성장하고 있는 자신의 회사에서 대부분 시간을 보내고, 데이터 과학을 위한

펼쳐보기
생년월일 -
출생지 -
출간도서 0종
판매수 0권

디지털 분석 기업인 넷스루(NETHRU)에서 전략 기획을 담당하며, 서울과학종합대학원(aSSIST) 빅데이터 MBA 과정에서 웹 마이닝 과목을 가르치고 있다. 한국외국어대학교 경영대학원 경영정보학과에서 웹 마이닝을 가르쳤고, 이 밖에도 한국방송통신대학교에서 인터넷 마케팅, 네이버 사내 강의와 네이버 검색 광고주 대상으로 웹 분석과 관련된 강의를 했다. 국내외 게임 회사와 인터넷 쇼핑몰, 금융권, 공공기관 등의 웹 분석 프로젝트를 수행했다. 월간 마이크로소프트웨어에 데이터 마이닝과 웹 마이닝 주제로 강좌를 연재했고, 네이버 키워드 스퀘어에 인터넷 광고

펼쳐보기

이 상품의 시리즈

acorn+PACKT 시리즈(총 351권 / 현재구매 가능도서 321권)

펼쳐보기

이 책과 내용이 비슷한 책 ? 내용 유사도란? 이 도서가 가진 내용을 분석하여 기준 도서와 얼마나 많이 유사한 콘텐츠를 많이 가지고 있는가에 대한 비율입니다.

    리뷰

    0.0 (총 0건)

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    0.0

    교환/환불

    교환/환불 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

    교환/환불 가능 기간

    고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

    교환/환불 비용

    고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

    교환/환불 불가사유

    반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
    배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

    소비자 피해보상

    소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
    교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

    기타

    도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

    배송안내

    • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

    • 배송비

    도서(중고도서 포함) 구매

    2,000원 (1만원이상 구매 시 무료배송)

    음반/DVD/잡지/만화 구매

    2,000원 (2만원이상 구매 시 무료배송)

    도서와 음반/DVD/잡지/만화/
    중고직배송상품을 함께 구매

    2,000원 (1만원이상 구매 시 무료배송)

    업체직접배송상품 구매

    업체별 상이한 배송비 적용