간편결제, 신용카드 청구할인
삼성카드 6% (20,310원)
(삼성카드 6% 청구할인)
인터파크 롯데카드 5% (20,520원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (15,120원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (17,280원)
(최대할인 4만원 / 2만원 이상 결제)
Close

데이터 과학자, 무엇을 배울 것인가 : 빅 데이터 시대의 데이터 과학자 양성 독본

원제 : デ-タサイエンティスト養成讀本
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 52
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

24,000원

  • 21,600 (10%할인)

    1,200P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 출고완료 후 14일 이내 마이페이지에서 적립받기한 경우만 적립됩니다.
추가혜택
배송정보
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서

  • 사은품(3)

출판사 서평

데이터 과학자를 꿈꾸는 사람들을 위한 최적의 입문서!
21세기의 가장 섹시한 직업, 데이터 과학자 양성을 위한 필수 기초지식 수록!


현대 사회는 데이터의 홍수 속에 있다고 해도 과언이 아닐 것이다. 이렇게 방대한 데이터들이 정보로서의 가치를 지니게 되려면 서로 어떠한 관계를 형성하고 있는지, 그리고 어떠한 규칙성이 있는지를 찾아내야만 한다. 그래서 데이터가 정보로서의 가치를 갖게 된다면, 이를 통해 미래에 대한 예측이 가능할 수도 있을 것이다. 데이터를 통해 현재를 분석하고 미래를 예측할 수 있는 능력을 갖춘 데이터 과학자를 필요로 하는 시대가 온 것이다.

데이터 과학자는 말 그대로 통계학과 전산학을 이용하여 데이터를 분석해서 알고 싶은 정보를 밝혀내는 일을 하는 사람이다. 이 책은 R 언어를 이용한 데이터 파악, 시각화, 그리고 실제 마케팅 분석 사례를 통해 데이터 과학자의 업무를 소개하고 있다. 또한, 데이터 분석을 위한 Python(파이썬)의 기계 학습과 데이터 마이닝 및 여러 알고리즘에 대해서도 다루고 있다.

이 책에서 배우는 주요 내용은 다음과 같다.

데이터 과학자의 업무 기술
- 데이터 과학자에 필요한 스킬
- 데이터 과학자의 프로세스
- 빅 데이터 인프라 입문

데이터 분석 실천 입문
- R 언어로 통계 해석을 시작하자
- 데이터 과학자 지식
- RStudio로 간편하게 데이터 분석하기
- Python을 이용한 기계 학습
- 데이터 마이닝에 필요한 10가지 알고리즘

마케팅 분석 본격 입문
- R 언어에 의한 마케팅 분석
- 믹시의 대규모 데이터 마이닝 사례
- 소셜 미디어 네트워크 분석

데이터 분석을 위한 필수 기초 지식
- SQL 입문
- 웹 스크래핑 입문

목차

권두 기획 데이터 과학자의 업무 기술: 스킬 세트, 데이터 분석 프로세스, 빅 데이터를 취급하는 방법 ..

Chapter 01 데이터 과학자에 필요한 스킬: 데이터에 스토리를 말하게 해볼까?
일본에서의 빅 데이터 원년
비즈니스 데이터 분석의 역사
고객도, 범인도 빠져나갈 수 없다
의사결정을 위한 움직임(활동)
필요로 하는 스킬들
미래의 데이터 과학자는 어디에 있을까?
정리

Chapter 02 데이터 과학자의 프로세스: 비즈니스 성과를 의식한 분석 방법
시작에 앞서
데이터 가공의 흐름
데이터 과학자가 성공하는 조건
데이터 과학 실패의 본질
정리

Chapter 03 데이터 핸들링을 위한 “빅 데이터 인프라” 입문
대량의 데이터를 고속으로 계산할 수 있는 시대
데이터베이스
데이터베이스의 종류
데이터베이스와의 접속
데이터 분석 기술
데이터베이스와 분석
데이터 과학 Loves 빅 데이터
정리

column 스킬의 표준화와 캐리어 형성을 위한 데이터 과학자 협회의 활동
설립 배경
협회의 개요
협회의 활동
데이터 과학자 협회의 조직과 운영
데이터 과학자의 스킬 표준(DSSS)에 대하여

특집 1 데이터 분석 실천 입문: 데이터 과학자로의 첫걸음 ..

Chapter 01 R 언어로 통계 분석을 시작하자: 데이터의 파악, 시각화와 다변량 분석
시작하며
R 언어의 도입
데이터 파악
다변량 분석: 예측
다변량 분석: 분류
기계 학습
정리

Chapter 02 데이터 과학자 필수 지식: 엔지니어에 필요한 데이터 분석 지식
시작하며
데이터 분석 소프트웨어
데이터의 취득
데이터의 클린징
데이터 분석
정리

Chapter 03 RStudio로 간편하게 데이터 분석하기: R 언어를 좀 더 편리하게 사용할 수 있는 통합 개발환경
시작하며
RStudio를 사용해 보자
Reproducible Research의 추천
한 발짝 앞선 RStudio 활용법
RStudio Server를 사용해 보자
정리

Chapter 04 Python을 이용한 기계 학습: 풍부한 라이브러리를 활용한 데이터 분석
시작하며
정리

Chapter 05 C4.5/k-means/서포트 벡터 머신/아프리오리/ EM 등
데이터 마이닝에 필요한 10가지 알고리즘
시작하며
정리

특집 2 스킬 업을 위한 마케팅 분석 본격 입문 ..

Chapter 01 R 언어를 이용한 마케팅 분석: 데이터 과학을 적용한 광고 전략과 사이트 개선
시작하며
포지셔닝 전략 세우기
광고 전략 세우기
웹 사이트를 개선하여 매출 높이기

Chapter 02 믹시의 대규모 데이터 마이닝 사례: 타기팅 광고 리플레이스의 포인트 공개
시작하며
구 인터레스트 타기팅
신 인터레스트 타기팅
정리

Chapter 03 마케팅에 유용한 소셜 미디어 네트워크 분석 222
시작하며 소셜 네트워크 분석이란?
기본 개념에 대한 정의
소셜 네트워크의 특징량 계산
소셜 네트워크 분석을 마케팅에 활용해 보자
정리

특별 기사 Fluentd 입문: 실시간 로그 수집으로 로그 해석을 스마트하게
Fluentd란?
사용법
Fluentd 활용 방법
사례 소개
정리

특별 기획 데이터 분석을 위한 필수 기초 지식 ..

Chapter 01 SQL 입문: 관계형 데이터베이스 조작에 필요한 언어
기초편
실전편
정리

Chapter 02 웹 스크래핑 입문: 웹 사이트로부터 정보를 수집하는 기술
시작하며
웹 스크래핑을 시작하기 전에
웹 스크래핑에 이용할 수 있는 모듈
urllib2에 의한 리소스 데이터의 취득
BeautifulSoup에 의한 리소스 데이터의 검색과 취득
lxml에 의한 xPath 대응 요소의 취득
정리

찾아보기

본문중에서

본 권두 기획에서는 데이터 과학자가 필요하게 된 시대적 배경부터 데이터 분석의 역사, 필요한 스킬들을 기초 지식으로서 소개한다. 그리고서 데이터 분석 프로세스에서 항상 염두에 둬야 할 비즈니스 성과와 빅 데이터를 지탱하는 인프라의 기초에 대해 설명하겠다. 이 기획을 통해 서 우선 무엇부터 배우면 좋은지, 그리고 어떠한 마음가짐을 가져야 하는지 파악해 보자.
(/ p.1)

지금까지 데이터 과학의 프로세스에 대해 설명하였다. 데이터 과학의 대략적인 흐름을 알았다고 생각한다. 계속해서 데이터 과학의 프로세스 중에서도 특히 많은 시간이 할애되는 데이터 가공에 주목하여 데이터의 종류와 데이터 값의 정의에 대해 설명하겠다.
(/ p.24)

데이터 분석이라는 한마디 말로 말하기에는 다양한 툴이 넘쳐나고 있다. 일단, 데이터 분석에서 주로 사용하는 R 언어로 통계 해설의 지식을 설명하고, 이와 더불어 구체적인 데이터를 사용하여 분석의 흐름을 소개하겠다. 또한, R 언어의 개발을 도와주는 RStudio의 설명과 함께, 데이터 분석 프로젝트의 유지보수 방법을 소개하겠다. 이와 더불어 데이터 분석 라이브러리가 풍부한 Python(파이썬)으로 기계 학습, 데이터 분석에 필요한 알고리즘도 설명하겠다. 여기에서 설명하는 데이터는 일부밖에 없지만, 실제 데이터 분석을 할 때 유용한 것들을 배울 수 있을 것이다.
(/ p.53)

시각화하여 전체 모습을 가늠하는 것도 중요하지만, 데이터의 전체 모습을 수치로 나타내는 방법도 필요하다. 기본 통계량(기술 통계량, 요약 통계량이라고도 함)이 그 하나의 방법인데, 기본 통계량은 표본의 분포를 요약해서 나타내는 값을 말한다. 예를 들어, 데이터 집합이 정규분포에 따르는 경우라면 평균과 분산의 두 숫자로 분포를 기술할 수 있다. 데이터 분석에 익숙해지면 시각화하지 않아도 기본 통계량으로부터 어렴풋이 데이터의 분포가 어떻게 되어 있는지 추측할 수 있다.
(/ p.103)

로그를 분석하려면 로그를 수집하는 것을 전제로 한다. Fluentd는 지금까지의 로그 수집 툴이 해결할 수 없었던 문제를 해결했기 때문에 많은 사용자를 확보하고 있다. 이 장에서는 Fluentd의 도입 방법부터 유용한 플러그인, 운영 방법까지 설명하겠다.
(/ p.236)

저자소개

사토 히로유키(佐藤 洋行) [저] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 0종
판매수 0권

저서 [데이터 과학자, 무엇을 배울 것인가]

생년월일 -
출생지 -
출간도서 0종
판매수 0권

숭실대학교에서 전자계산학을 전공하였다. 사회 초년생 시절 자바에 심취해 현대정보기술에서 웹 애플리케이션을 개발하였고, 그 후 이동통신 단말기 분야로 전직하여 휴대전화 단말기의 부가서비스 개발 업무를 담당하였다. 일본 키스코 모바일사업부 팀장이었으며, 일본 교세라의 북미향 휴대전화기 개발에 참여하였다. 지금은 일본의 주요 이동통신사에서 업무 프로세스 개선을 위한 IT 컨설팅 및 데이터 분석 관련 툴을 개발하고 있다. 옮긴 책으로는 《자바스크립트 마스터 북(제2판)》, 《처음 만나는 알고리즘》을 비롯해 10여 종이 있다.

컴퓨터/인터넷 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    0.0

    교환/환불

    교환/환불 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

    교환/환불 가능 기간

    고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

    교환/환불 비용

    고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

    교환/환불 불가사유

    반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
    배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

    소비자 피해보상

    소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
    교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

    기타

    도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

    배송안내

    • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

    • 배송비

    도서(중고도서 포함) 구매

    2,000원 (1만원이상 구매 시 무료배송)

    음반/DVD/잡지/만화 구매

    2,000원 (2만원이상 구매 시 무료배송)

    도서와 음반/DVD/잡지/만화/
    중고직배송상품을 함께 구매

    2,000원 (1만원이상 구매 시 무료배송)

    업체직접배송상품 구매

    업체별 상이한 배송비 적용