간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (18,810원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (13,860원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (15,840원)
(최대할인 4만원 / 2만원 이상 결제)
Close

쉽게 시작하는 캐글 데이터 분석 : 캐글 대회 참여 방법부터 캐글 그랜드마스터 인터뷰까지!

소득공제

2013년 9월 9일 이후 누적수치입니다.

공유하기
정가

22,000원

  • 19,800 (10%할인)

    1,100P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
주문수량
감소 증가

* 배송예정일이 오늘이나 내일인 경우 1) 당일/하루배송 보장! 2) 배송 지연 시 I-Point 2,000P또는 4,000원 도서상품권 지급 &n 더보기

책소개

캐글 대회 참여 방법부터 캐글 그랜드마스터 인터뷰까지!

캐글은 세계적인 데이터 분석 경진대회 플랫폼으로, 전 세계의 데이터 분석가들이 많이 즐겨 사용한다. 캐글 경진대회에 참여하여 자신의 실력을 뽐낼 수 있으며, 캐글 마스터, 그랜드마스터 등 타이틀을 얻어 인지도를 쌓을 수도 있다. 더불어 개인적인 성취감도 느낄 수 있다.
이 책은 캐글 개요와 경진대회 참여 방법, 데이터 분석을 위한 기초 이론과 실습 환경 구축부터 설명한다. 초보자용 튜토리얼 경진대회인 타이타닉 생존자 예측하기, 주택 가격 예측하기 과제를 직접 해결하면서 데이터 분석 과정과 머신 러닝을 익히고, 실력을 향상시킬 수 있다. 마지막으로 캐글 마스터와 그랜드마스터의 경험과 조언을 들으며 캐글에 성공적으로 입문할 수 있다.

출판사 서평

파이썬으로 세계적인 데이터 분석 경진대회 캐글에 성공적으로 입문하는 법!

캐글을 시작하는 데 필요한 모든 것을 다룬다!
캐글은 세계적인 데이터 분석 경진대회 플랫폼으로, 자신의 데이터 분석 능력을 측정하고 이를 향상시킬 수 있는 공간이면서 서로 논의하고 자신의 코드를 공유할 수 있는 커뮤니티의 장이기도 하다. 책에서는 캐글이 무엇인지 알아보고, 캐글 경진대회의 종류, 메달과 등급, 경진대회에 참가하는 방법 등을 소개한다. 또한, 경진대회 참가 전 데이터 분석을 어떻게 할 것인지 순서를 알아보고, 데이터 분석에 알맞은 환경을 구축한다. 입문자도 경진대회에 참가할 수 있도록 캐글 경진대회의 기본적인 절차와 데이터 분석에 필요한 지식을 모두 설명한다.

경진대회 과제를 해결하며 데이터 분석 과정을 익힌다!
캐글의 대표적인 초보자용 튜토리얼 경진대회에 참여하여 정확도가 높은 모델을 단계별로 구축하고, 같은 데이터에 다른 방법을 적용하여 문제에 접근하기도 한다. 실제 경진대회 과제를 해결하면서 데이터 분석 과정과 머신 러닝을 직접 체험하며 익힐 수 있다. 또한, 이 과정에서 데이터 분석 스킬을 습득해 업무에 활용하거나 캐글 상위권을 목표로 할 수 있는 밑바탕도 다질 수 있다.

캐글 마스터와 그랜드마스터의 경험담에서 평소 궁금했던 내용도 알아보자!
일본 캐글 마스터 2명과 국내 캐글 그랜드마스터 1명의 경험담을 실었다. 어떻게 캐글을 시작했으며, 캐글 마스터/그랜드마스터가 되기 위해 어떻게 공부했는지, 캐글과 업무를 연관시킬 수 있는지 등 캐글 마스터/그랜드마스터가 되기까지의 여정을 소개한다. 이들의 생생한 경험담을 통해 평소 캐글과 관련해 궁금했던 내용들과 다양한 팁도 알아보자.

목차

0장 캐글에서 실용적인 기술을 체험해 보자!
0.1 캐글 세계로 뛰어들어 보자!
__0.1.1 데이터, 데이터 분석으로 알 수 있는 것
__0.1.2 캐글: 세계 각국에서 이용하는 데이터 분석 경진대회 플랫폼
__0.1.3 이 책의 활용 방법

1장 캐글이란
1.1 전 세계 데이터 과학자가 경쟁하는 플랫폼
1.2 캐글의 메달과 등급
1.3 캐글 경진대회 참여 흐름
1.4 경진대회 종류
1.5 캐글 커뮤니티

2장 데이터 분석 절차, 데이터 분석 환경 구축
2.1 데이터 분석의 순서 및 개요
2.2 데이터 분석 환경
__2.2.1 파이썬을 이용한 데이터 분석 환경
__2.2.2 로컬 또는 클라우드에서 데이터 분석 환경
2.3 주피터 노트북을 이용한 대화형 데이터 분석 환경
__2.3.1 로컬 컴퓨터에서 데이터 분석 환경 구축
2.4 아나콘다의 가상 환경 이용(윈도)
2.5 pyenv 환경 이용(맥)
2.6 캐글 분석 도구 사용

3장 캐글 경진대회 도전 ①: 타이타닉 생존자 예측
3.1 캐글을 이용하여 실제 데이터 분석
3.2 타이타닉 생존자 예측 경진대회란
3.3 데이터 내려받기
3.4 데이터 분석을 위한 준비 작업
__3.4.1 [순서 1] 데이터 분석 환경 준비
__3.4.2 [순서 2] 새로운 파일 작성
__3.4.3 [순서 3] 디렉터리 구성 확인
__3.4.4 [순서 4] 라이브러리를 설치하고 가져오기
__3.4.5 [순서 5] 데이터 읽어 보기
__3.4.6 [순서 6] 랜덤 시드 설정
3.5 데이터 개요 파악
3.6 데이터의 시각화
__3.6.1 목적 변수 관련 데이터의 시각화
3.7 데이터 전처리와 특징 값 생성
3.8 머신 러닝 모델링
__3.8.1 검증 데이터로 예측 정확도 확인
__3.8.2 교차 검증을 이용한 학습
3.9 캐글에 결과 제출
3.10 정확도 이외의 여러 가지 분석
__3.10.1 추가 분석 ①: 타이타닉에는 어떤 사람이 승선하고 있었는가?
__3.10.2 추가 분석 ②: 특정 클러스터에 주목

4장 캐글 경진대회 도전 ②: 주택 가격 예측
4.1 더 상세하게 알아보는 데이터 분석
4.2 주택 가격 예측하기 경진대회란
4.3 데이터 내려받기
4.4 벤치마크용 베이스라인 작성
__4.4.1 LightGBM으로 예측
__4.4.2 교차 검증으로 모델 학습과 예측
__4.4.3 각 변수의 중요도 확인
4.5 목적 변수의 전처리: 목적 변수의 분포 확인
__4.5.1 SalePrice 데이터의 분포 확인
4.6 설명 변수의 전처리: 결측치 확인
__4.6.1 각 설명 변수의 결측치 확인
4.7 이상치 제외
__4.7.1 이상치란
__4.7.2 각 설명 변수의 데이터 분포 확인
4.8 설명 변수 확인: 특징 값 생성
4.9 하이퍼파라미터 최적화
__4.9.1 Optuna 구현
__4.9.2 캐글에 결과 제출
4.10 여러 가지 머신 러닝 방법을 이용한 앙상블
__4.10.1 랜덤 포레스트로 학습
__4.10.2 LotFrontage의 결측치 삭제
__4.10.3 XGBoost로 학습
__4.10.4 XGBoost와 LightGBM 결과 조합
4.11 추가 분석 ①: 통계 기법을 이용한 클러스터 분석
__4.11.1 통계 기법을 써서 주택 분류
__4.11.2 주성분 분석
4.12 추가 분석 ②: 고급 주택의 조건을 분석하고 시각화
__4.12.1 결정 트리로 시각화

5장 새로운 데이터 과학 능력 향상을 위한 팁
5.1 캐글 마스터와 특별 인터뷰
5.2 캐글에서 권장하는 스타터 노트북
__5.2.1 판매량 예측하기 경진대회
__5.2.2 PUBG 최종 순위 예측하기(커널만 해당) 경진대회
__5.2.3 IEEE- CIS 부정 거래 탐지하기 경진대회
5.3 GCP의 AI 플랫폼 분석 절차
__5.3.1 GCP의 AI 플랫폼에 관하여
__5.3.2 GCP 이용
__5.3.3 GCP에 데이터 업로드
__5.3.4 GCP의 AI 플랫폼 이용
__5.3.5 GCP의 AI 플랫폼에서 Storage 데이터 사용
__5.3.6 새로운 라이브러리 추가
__5.3.7 인스턴스 이용 중지

부록 A 캐글 마스터가 되다: 전업 캐글러로서 삶과 지진 예측 3위 솔루션
A.1 자기 소개
A.2 전업 캐글러로서 1년 반
__A.2.1 전업 캐글러가 된 이유
__A.2.2 전업 캐글러가 되고 난 후 1년간
__A.2.3 캐글 그랜드마스터를 목표로 한 반년
__A.2.4 전업 캐글러로서 1년 반을 회고하며
A.3 LANL 지진 예측 3위 솔루션
__A.3.1 경진대회의 개요
__A.3.2 학습 데이터
__A.3.3 테스트 데이터
__A.3.4 학습 방법
__A.3.5 상위 입상 열쇠
__A.3.6 리더보드 프로빙
__A.3.7 점수 변화
__A.3.8 공개 리더보드의 베스트 모델
__A.3.9 개최자 논문
__A.3.10 논문에 사용한 데이터와 대회 데이터는 동일한가?
__A.3.11 개최자의 논문 정보와 리더보드 프로빙 정보를 조합하다

부록 B 국내 캐글 그랜드마스터 인터뷰: 이유한
B.1 인터뷰 소개
B.2 인터뷰 내용

본문중에서

데이터 분석의 기초 지식을 배우고 나면 그동안 활용 사례 등을 보며 ‘와 대단하네’라고 막연히 생각하던 수준에서, ‘지금 기술로 할 수 있는 것이 무엇인지, 혁신적인 부분이 무엇인지’를 어느 정도 구체적으로 알고 고민하는 수준으로 나아가게 될 것입니다. 그리고 자신이 아직 모르고 배우지 못한 것이 무엇인지를 명확하게 알면 향후 데이터 분석을 공부하는 방향을 세우기 쉬울 것입니다.
이 책은 실제 데이터와 코드를 사용하여 데이터 분석의 단계를 차근차근 설명합니다. 데이터 분석을 이제 막 시작하려고 할 때 이 책으로 조금이라도 데이터 분석을 가깝게 느끼거나 ‘나도 한번 해볼까’라는 생각을 하게 된다면 감사할 것 같습니다.
- 〈시작하며〉 중에서

관련이미지

저자소개

시노다 히로유키 [저] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 0종
판매수 0권

주식회사 하쿠호도 DY미디어 파트너즈 소속으로, 데이터 분석을 바탕으로 한 미디어 전략 기획, 상품 개발, 콘텐츠 제작을 한다. 데이터 분석 및 데이터 시각화에 관한 세미나에 참석하였고, 다수의 책을 집필하였다.

생년월일 -
출생지 -
출간도서 0종
판매수 0권

저자 조태호는 대학에서 영문학을 전공했지만, 컴퓨터 대회에서 입상한 것을 계기로 매크로미디어 코리아(현 어도비 코리아)에 입사했다. 그곳에서 엔지니어로 일하며 컴퓨터 교육 TV 프로그램의 진행자로 활동했다. 일본 도쿄의과치과대학교에서 생명정보학 전공으로 보건학 박사학위를 받았으며, 미국 미주리대학교와 미시간대학교에서 박사후과정을 지냈다. 지금은 인디애나대학교 영상의학과 연구 조교수로, 딥러닝을 이용해 치매 질환을 예측하는 연구를 하고 있다. 2017년 딥러닝 입문서 《모두의 딥러닝》을 출간했다. 2019년 1월부터 글쓰기 플랫폼 브런치에 자신

펼쳐보기

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    10.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    0.0

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    판매자

    (주)교보문고

    상호

    (주)교보문고

    사업자 종류

    법인사업자

    사업자번호

    102-81-11670

    연락처

    1544-1900

    이메일

    callcenter@kyobobook.co.kr

    통신판매 신고 번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시, 1만 원 이상 무료, 1만원 미만 2천 원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용