간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (23,090원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (17,010원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (19,440원)
(최대할인 4만원 / 2만원 이상 결제)
Close

데이터 과학 입문과 실습 : 소규모 데이터셋 처리부터 빅데이터 처리, 머신러닝, 시각화까지

원제 : Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 24
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

27,000원

  • 24,300 (10%할인)

    1,350P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
주문수량
감소 증가

* 배송예정일이 오늘이나 내일인 경우 1) 당일/하루배송 보장! 2) 배송 지연 시 I-Point 2,000P또는 4,000원 도서상품권 지급 &n 더보기

  • 이벤트/기획전

  • 연관도서(46)

  • 상품권

AD

책소개

《파이썬으로 배우는 데이터 과학 입문과 실습》은 데이터 과학의 주요 개념을 설명하고 데이터 과학자로서 기본적인 작업을 완수할 수 있는 법을 가르친다. 데이터 과학의 진행 과정과 데이터 시각화, 그래프 데이터베이스, NoSQL 사용법 등을 살펴보고, 파이썬 언어 및 파이썬 라이브러리를 사용해 큰 규모의 데이터를 다뤄 본다. 데이터의 규모가 너무 크거나 생성 속도가 너무 빨라서 한 대의 컴퓨터로 처리하기 힘든 경우에 파이썬을 어떻게 활용할 수 있는지도 살펴본다. 또한 유명한 파이썬 데이터 과학 라이브러리인 사이킷런(Scikit-learn)과 스태츠모델스(StatsModels)도 탐구해 본다. 이 책을 읽은 후에는 데이터 과학의 커리어를 시작하는 데 필요한 탄탄한 기본기를 갖추게 될 것이다.

★ 이 책에서 다루는 내용 ★
◎ 대규모 데이터 처리
◎ 머신러닝 소개
◎ 파이썬으로 데이터 다루기
◎ 데이터 과학 알고리즘 작성

목차

▣ 01장: 빅데이터 세상에서의 데이터 과학
1.1. 데이터 과학 및 빅데이터의 이점과 활용
1.2. 데이터 종류
___1.2.1. 구조적 데이터
___1.2.2. 비구조적 데이터
___1.2.3. 자연어
___1.2.4. 기계 생성 데이터
___1.2.5. 그래프 데이터 또는 네트워크 데이터
___1.2.6. 오디오, 이미지, 비디오
___1.2.7. 스트리밍 데이터
1.3. 데이터 과학 과정
___1.3.1. 연구 목표 설정
___1.3.2. 데이터 획득
___1.3.3. 데이터 준비
___1.3.4. 데이터 탐색
___1.3.5. 데이터 모델링 또는 모델 구축
___1.3.6. 발표 및 자동화
1.4. 빅데이터 생태계와 데이터 과학
___1.4.1. 분산 파일 시스템
___1.4.2. 분산 프로그래밍 프레임워크
___1.4.3. 데이터 통합 프레임워크
___1.4.4. 머신러닝 프레임워크
___1.4.5. NoSQL 데이터베이스
___1.4.6. 스케줄링 도구
___1.4.7. 벤치마크 도구
___1.4.8. 시스템 배포
___1.4.9. 서비스 프로그래밍
___1.4.10. 보안
1.5. 하둡 작업의 예
1.6. 요약

▣ 02장: 데이터 과학 진행 과정
2.1. 데이터 과학 진행 과정 개요
___2.1.1. 과정의 노예가 되지 마라
2.2. 1단계: 연구 목표 설정 및 프로젝트 사명서 작성
___2.2.1. 연구의 목표와 맥락을 이해하는 데 시간을 투자하라
___2.2.2. 프로젝트 사명서 작성
2.3. 2단계: 데이터 획득
___2.3.1. 회사 내에 저장된 데이터로 시작하기
___2.3.2. 여기저기서 데이터를 사는 일을 두려워 마라
___2.3.3. 문제가 일어나지 않게 데이터의 품질을 미리 확인하라
2.4. 3단계: 데이터 정제, 통합, 변환
___2.4.1. 데이터 정제
___2.4.2. 오류를 최대한 일찍 수정하라
___2.4.3. 서로 다른 출처로부터 얻은 데이터 합치기
___2.4.4. 데이터 변환
2.5. 4단계: 탐색적 데이터 분석
2.6. 5단계: 모델 구축
___2.6.1. 모델과 변수 선택
___2.6.2. 모델링 실시
___2.6.3. 모델 분석과 비교
2.7. 6단계: 분석 결과 표현과 애플리케이션 구축
2.8. 요약

▣ 03장: 머신러닝
3.1. 머신러닝의 정의와 중요성
___3.1.1. 데이터 과학에 머신러닝을 적용
___3.1.2. 데이터 과학 진행 과정에서 머신러닝이 사용되는 곳
___3.1.3. 머신러닝에 사용하는 파이썬 도구
3.2. 모델링 과정
___3.2.1. 특성 공학과 모델 선택
___3.2.2. 모델 훈련
___3.2.3. 모델 검증
___3.2.4. 새로운 관찰을 예측하기
3.3. 머신러닝 종류
___3.3.1. 지도 학습
___3.3.2. 비지도 학습
___3.3.3. 준지도 학습
3.4. 요약

▣ 04장: 컴퓨터 한 대에서 대량 데이터 다루기
4.1. 대량 데이터를 다룰 때의 문제
4.2. 대량 데이터를 처리하는 일반적인 기법
___4.2.1. 적절한 알고리즘 선택
___4.2.2. 적절한 데이터 구조 선택
___4.2.3. 적절한 도구 선택
4.3. 대규모 데이터셋을 다룰 때의 일반적인 프로그래밍 지침
___4.3.1. 바퀴를 재발명하지 말라
___4.3.2. 하드웨어 성능을 최대한 활용하라
___4.3.3. 컴퓨팅의 필요를 줄여라
4.4. 사례 연구 1: 해로운 URL 여부 예측
___4.4.1. 1단계: 연구 목표 설정
___4.4.2. 2단계: URL 데이터 얻기
___4.4.3. 4단계: 데이터 탐색
___4.4.4. 5단계: 모델 구축
4.5. 사례 연구 2: 데이터베이스에 추천 시스템 구축
___4.5.1. 필요한 도구 및 기법
___4.5.2. 1단계: 연구 질문
___4.5.3. 3단계: 데이터 준비
___4.5.4. 5단계: 모델 구축
___4.5.5. 6단계: 표현 및 자동화
4.6. 요약

▣ 05장: 빅데이터 첫걸음
5.1. 프레임워크를 이용해 데이터 저장과 처리를 분산화하기
___5.1.1. 하둡: 대규모 데이터셋을 저장하고 처리하기 위한 프레임워크
___5.1.2. 스파크: 더 높은 성능을 내기 위해 맵리듀스를 대체
5.2. 사례 연구: 금전 대출 위험 평가
___5.2.1. 1단계: 연구 목표 설정
___5.2.2. 2단계: 데이터 획득
___5.2.3. 3단계: 데이터 준비
___5.2.4. 4단계: 데이터 탐색 & 6단계: 보고서 구축
5.3. 요약

▣ 06장: NoSQL 운동에 동참하기
6.1. NoSQL 개요
___6.1.1. ACID: 관계형 데이터베이스의 핵심 원리
___6.1.2. CAP 정리: 여러 노드에 걸쳐 존재하는 DB의 문제
___6.1.3. NoSQL 데이터베이스의 BASE 원칙
___6.1.4. NoSQL 데이터베이스의 종류
6.2. 사례 연구: 질병 진단
___6.2.1. 1단계: 연구 목표 설정
___6.2.2. 2단계와 3단계: 데이터 획득 및 준비
___6.2.3. 4단계: 데이터 탐색
___6.2.4. 3단계를 반복: 질병 프로파일링을 위한 데이터 준비
___6.2.5. 4단계를 반복: 질병 프로파일링을 위한 데이터 탐색
___6.2.6. 6단계: 표현 및 자동화
6.3. 요약

▣ 07장: 그래프 데이터베이스의 부상
7.1. 연결 데이터와 그래프 데이터베이스
___7.1.1. 그래프 데이터는 무엇이며 언제 사용해야 하는가?
7.2. 네오포제이(Neo4j): 그래프 데이터베이스
___7.2.1. 사이퍼(Cypher): 그래프 질의 언어
7.3. 연결 데이터 예제: 요리법 추천 엔진
___7.3.1. 1단계: 연구 목표 설정
___7.3.2. 2단계: 데이터 획득
___7.3.3. 3단계: 데이터 준비
___7.3.4. 4단계: 데이터 탐색
___7.3.5. 5단계: 데이터 모델링
___7.3.6. 6단계: 표현
7.4. 요약

▣ 08장: 텍스트 마이닝과 텍스트 분석
8.1. 실제 세계에서의 텍스트 마이닝
8.2. 텍스트 마이닝 기법
___8.2.1. 단어 주머니
___8.2.2. 형태소 처리와 표제어 추출
___8.2.3. 의사결정 트리 분류기
8.3. 사례 연구: 레딧 게시물 분류
___8.3.1. 자연어 도구 사용하기
___8.3.2. 데이터 과학 과정 개요 및 1단계: 연구 목표
___8.3.3. 2단계: 데이터 획득
___8.3.4. 3단계: 데이터 준비
___8.3.5. 4단계: 데이터 탐색
___8.3.6. 3단계를 반복: 데이터 준비 적응
___8.3.7. 5단계: 데이터 분석
___8.3.8. 6단계: 발표 및 자동화
8.4. 요약

▣ 09장: 최종 사용자를 위한 데이터 시각화
9.1. 데이터 시각화의 선택사항
9.2. Crossfilter: 자바스크립트 맵리듀스 라이브러리
___9.2.1. 구성
___9.2.2. 크로스필터를 사용해 의약품 데이터셋을 필터링
9.3. dc.js로 상호작용 대시보드 만들기
9.4. 대시보드 개발 도구
9.5. 요약

▣ 부록A: 일래스틱서치 설치
A.1. 리눅스에 일래스틱서치 설치하기
A.2. 윈도우에 일래스틱서치 설치하기

▣ 부록B: Neo4j 설치
B.1. 리눅스에 Neo4j 설치하기
B.2. 윈도우에 Neo4j 설치하기

▣ 부록C: MySQL 서버 설치
C.1. 윈도우에 MySQL 서버 설치하기
C.2. 리눅스에 MySQL 서버 설치하기

▣ 부록D: 아나콘다 설치 및 가상 환경 구성
D.1. 리눅스에 아나콘다 설치하기
D.2. 윈도우에 아나콘다 설치하기
D.3. 환경 설정

관련이미지

저자소개

아르노 메이즈맨, 모하메드 알리 [저] 신작알림 SMS신청 작가DB보기
생년월일 -

해당작가에 대한 소개가 없습니다.

생년월일 -

한국방송통신대학교에서 컴퓨터 과학을 전공하고 2000년대 초부터 IT 업계에서 일했다. 은행의 일괄 작업 운영과 서버 운영 자동화를 돕는 외산 소프트웨어의 기술 지원 업무를 주로 했고, 현재는 위키북스에서 교정 업무를 하고 있다.
저서로 《왕초보를 위한 파이썬》(사이버출판사, 2002), 《예제 중심의 파이썬》(인피니티북스) 등이 있으며, 《파이썬으로 배우는 데이터 과학 입문과 실습》(위키북스), 《익스플로링 라즈베리 파이》(위키북스), 《침투 본능, 해커의 기술》(위키북스), 《웹 애플리케이션 보안》(한빛미디어) 등을 번역했다.

이 상품의 시리즈

(총 48권 / 현재구매 가능도서 47권)

선택한 상품 북카트담기
펼쳐보기

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    10.0

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    판매자

    (주)교보문고

    상호

    (주)교보문고

    사업자 종류

    법인사업자

    사업자번호

    102-81-11670

    연락처

    1544-1900

    이메일

    callcenter@kyobobook.co.kr

    통신판매 신고 번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시, 1만 원 이상 무료, 1만원 미만 2천 원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용