간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (27,360원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (20,160원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (23,040원)
(최대할인 4만원 / 2만원 이상 결제)
Close

Plotly로 시작하는 인터랙티브 데이터 시각화 in R & 파이썬

소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 288
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
  • 저 : 이기준
  • 출판사 : 제이펍
  • 발행 : 2023년 12월 05일
  • 쪽수 : 480
  • ISBN : 9791192987378
정가

32,000원

  • 28,800 (10%할인)

    1,600P (5%적립)

할인혜택
적립혜택
  • S-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
배송정보
  • 4/22(월) 이내 발송 예정  (서울시 강남구 삼성로 512)
  • 무료배송
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서

  • 상품권

AD

책소개

복잡하고 어려운 데이터를 한눈에 들어오는 그래프와 차트로 만들기

이 책은 인터랙티브 시각화 패키지인 Plotly로 시각화하는 방법을 취업률 및 코로나 데이터로 예를 들면서 R과 파이썬으로 구현한다. 1부에서는 데이터 시각화의 개념과 중요성을 소개하고, 2부에서는 Plotly의 기초 개념과 레이아웃, 서브플롯 등 필수 기능을 설명한다. 3부에서는 산점도, 폭포수 차트 등 목적에 따른 Plotly 시각화 방법과 특수 기능을 안내한다. 4부에서는 효과적으로 Plotly 시각화를 활용하기 위한 버튼, 슬라이더 등 컨트롤의 생성 및 구현 방법, 결과물을 공유하기 위한 온/오프라인 배포 방법을 알아본다. 마지막으로 부록에서는 Plotly의 기능을 극대화할 수 있는 Dash와 Shiny 패키지로 대시보드를 설계하고 구현하는 과정을 다룬다.

출판사 서평

효과적인 인터랙티브 시각화 툴 Plotly 사용법 & 데이터 시각화 실무 노하우
보고서, 신문 기사 등에서 흔히 접하는 데이터 시각화는 데이터나 정보가 가지는 의미를 상대에게 명확하고 효과적으로 전달해 상대방을 설득하는 것이 목표다. 특히 R과 파이썬을 활용한 데이터 처리와 분석이 대중화되면서 관심이 더욱 높아졌다.

데이터 시각화 패키지로 R에서는 ggplot2를, 파이썬에서는 Matplotlib을 주로 사용했지만 웹에서 실행되는 대시보드에는 적합하지 않아 최근에는 사용자가 자유자재로 활용할 수 있는 Plotly 패키지가 많이 활용되는 편이다. 자바스크립트를 기반으로 만들어진 Plotly는 R과 파이썬뿐만 아니라 줄리아, 매트랩 등에서도 지원된다. 또한, ggplot2로 만든 시각화도 동적으로 간단히 변환할 수 있는 강력한 기능이 있는 것은 물론, R과 파이썬을 지원하는 dash 패키지를 통해 사용자 반응형 대시보드 설계에도 효율적으로 사용되고 있다.

이 책은 데이터 시각화의 이론과 원리보다는 Plotly를 활용한 인터랙티브 데이트 시각화와 구현에 필요한 코드 위주로 구성했다. 총 4부로 구성되었으며, 취업률 및 코로나 데이터를 예로 들면서 R과 파이썬 코드 및 결과를 수록해 어떤 언어에 익숙하든 데이터 시각화 방법을 습득할 수 있다. 또한, 데이터 시각화를 구축할 때 고려해야 할 사항이나 Plotly로 대시보드를 만드는 플랫폼인 Dash와 Shiny의 사용법을 배울 수 있다.

1부에서는 데이터 시각화란 개념과 중요성을 설명하고 역사적으로 중요한 의미를 지닌 데이터 시각화 사례를 소개한다. 2부에서는 Plotly의 기본 개념과 다양한 속성을 설명한다. Plotly 시각화에 필수인 트레이스와 레이아웃, 서브플롯의 개념 및 공통적으로 사용하는 속성을 알아본다. 3부에서는 실무에서의 데이터 시각화 목적에 따른 Plotly 시각화 방법들을 소개한다. 버블 차트, 바이올린 플롯, 롤리팝 그래프, 덤벨 차트, 산키 다이어그램, 인디케이터 시각화 등을 예로 든다. 4부에서는 효과적으로 Plotly 시각화를 활용하기 위한 버튼, 슬라이더 등 컨트롤 생성 및 구현 방법, 결과물을 공유하기 위한 온오프라인 배포 방법을 알아본다. 마지막으로 부록에서는 Plotly 기능을 극대화하기 위해 Dash 및 Shiny 패키지, plotly.express로 대시보드를 설계해본다.

데이터 시각화의 기초부터 다양한 시각화 방법을 실습함으로써 데이터가 가지는 의미를 명확하고 효과적으로 전달해보자.

추천사

정성원((주)데이타솔루션 상무이사, 빅데이터 러닝센터 센터장)
인터랙티브 데이터 시각화를 처음 접하는 모든 사람에게 필독서로 추천합니다.

이삭(유튜브 ‘슬기로운 통계생활’ 운영자)
입문자에게는 차근차근 따라 해보며 공부할 수 있는 자습서 역할을, 전문가에게는 각 옵션의 내용이 체계적으로 정리된 귀중한 참고 자료가 될 것입니다.

박찬엽(팟캐스트 및 유튜브 ‘데이터홀릭’ 운영자(박박사), (주)커널로그 CTO)
이 책을 완독하고 나면, 단순한 데이터 시각화를 넘어 효과적인 의사소통과 인사이트 도출을 위한 강력한 도구를 손에 넣을 것입니다.

김경신((주)천명시스템 대표이사)
데이터 분석가가 되고자 하는 분들과 더욱 수준 높은 데이터 분석가로 발돋움하고자 하는 분들에게 필독서로 추천합니다.

목차

추천의 글 x
베타리더 후기 xiii
시작하며 xvi
이 책에 대하여 xix


PART I 데이터 시각화의 기초
CHAPTER 1 데이터 시각화란? 3
1.1 데이터 시각화의 필요성 5
1.2 왜 데이터 시각화를 해야 하는가? 6
1.3 데이터 시각화로 무엇을 표현하는가? 10
1.4 유명한 데이터 시각화 사례 11
1.5 차트, 플롯, 그래프 15

PART II Plotly 시각화의 기초
CHAPTER 2 Plotly로 시각화하기 19
2.1 Plotly란? 20
2.2 예제 데이터 Import와 전처리 22
2.3 Plotly 시작하기 28

CHAPTER 3 트레이스 41
3.1 트레이스의 생성 41
3.2 트레이스의 공통 속성 45

CHAPTER 4 layout 속성 65
4.1 layout 속성 설정 65
4.2 layout 공통 주요 속성 66

CHAPTER 5 서브플롯 89
5.1 서브플롯 생성과 제목 설정 89
5.2 서브플롯 범례 설정 97
5.3 서브플롯 배치와 편집 98
5.4 축 공유 106

CHAPTER 6 색상 설정 109
6.1 연속형 색상 110
6.2 이산형 색상 115

PART III Plotly 시각화의 실전
CHAPTER 7 관계와 분포의 시각화 123
7.1 산점도 123
7.2 히스토그램 136
7.3 박스 플롯 146
7.4 바이올린 플롯 155

CHAPTER 8 비교와 구성의 시각화 162
8.1 막대그래프 163
8.2 비율 막대그래프 180
8.3 롤리팝 그래프 186
8.4 레이더 차트 190
8.5 덤벨 차트 198
8.6 파이 차트 200
8.7 선버스트 차트 209
8.8 트리맵 217

CHAPTER 9 시간과 흐름의 시각화 221
9.1 선 그래프 221
9.2 캔들스틱 차트 245
9.3 폭포수 차트 264
9.4 퍼널 차트 267
9.5 산키 다이어그램 275

CHAPTER 10 지수와 지도의 시각화 282
10.1 인디케이터 282
10.2 지도의 시각화 302

PART IV Plotly 시각화의 활용
CHAPTER 11 시각화 컨트롤 329
11.1 컨트롤 위치 설정 331
11.2 버튼 컨트롤 332
11.3 드롭다운 컨트롤 346
11.4 슬라이더 컨트롤 349

CHAPTER 12 Plotly 시각화 사용하기 355
12.1 모드바의 사용 355
12.2 마우스 사용 358
12.3 범례 사용 360

CHAPTER 13 Plotly 배포 361
13.1 오프라인 배포 361
13.2 온라인 배포 364

CHAPTER 14 효과적인 시각화 만들기 369
14.1 청중은 누구인가? 370
14.2 적절한 시각화 타입의 선정 371
14.3 시각화의 매체 373
14.4 간결한 시각화 374
14.5 읽기 쉬운 라벨링 376
14.6 왜곡의 방지 378
14.7 적절한 색상 사용 381

마치며 383

APPENDIX A R과 파이썬을 사용한 대시보드 만들기 384
A.1 Plotly와 파이썬을 사용한 Dash 앱 시작하기 384
A.2 Plotly와 R을 사용한 Shiny 앱 시작하기 402

APPENDIX B plotly.express 420
B.1 plotly.express 420
B.2 함수 설명, 주요 매개변수와 사용 예 424

찾아보기 446

본문중에서

데이터 시각화는 수많은 데이터의 특성을 한눈에 볼 수 있도록 만드는 과정이다. 그렇다면 데이터 시각화는 데이터의 무엇을 표현하고 어떤 특성들을 나타낼 수 있는가? 우리는 초등학교 시절부터 데이터 시각화를 배워왔다. 지금도 초등학교 4학년 학생은 1학기 수학 교과서에서 막대그래프를 사용하여 데이터를 표현하는 방법을 배운다. 그래서인지 데이터 시각화에서 많이 쓰는 방법은 막대그래프이며, 때에 따라서 선 그래프, 파이 차트(원그래프) 등도 흔히 사용되고 있다. 데이터 시각화를 하기 전에 먼저 데이터 시각화로 무엇을 표현하고 어떤 데이터 시각화 방법을 쓸 것인지를 결정해야 한다. 일반적으로 데이터의 분포, 비교, 추세, 구성, 상관, 지리를 표현하는 데 데이터 시각화가 효과적으로 활용된다. (10쪽)

Plotly 패키지는 R, 파이썬, 줄리아, 자바스크립트, F#, 매트랩 등의 다양한 언어에서 사용이 가능하도록 각각의 언어에 바인딩되는 패키지를 개발하여 제공하고 있다. Plotly에서 제공하는 데이터 시각화는 산점도, 선 그래프와 같은 기본 차트(basic chart), 박스 플롯, 히스토그램과 같은 통계 차트(statistical chart), 히트맵, 삼각 플롯(ternary plot)과 같은 과학 차트(scientific chart), 시계열 차트(time series chart), 캔들스틱 차트와 같은 재무 차트(financial chart) 등의 다양한 차트와 플롯을 제공한다. (20쪽)

보통 히스토그램은 bin의 크기에 따라 설정된 범위에 속한 데이터의 사례수, 즉 데이터 카운트를 표현한다. Plotly에서도 기본적인 히스토그램은 데이터 사례수를 표현하는 방법으로 히스토그램을 그리지만, 이 값을 특정한 함수 값으로 대체하는 방법도 제공한다. Plotly에서 히스토그램 함수로 제공하는 것은 사례수를 표시하는 count, bin에 속한 값의 합을 표시하는 sum, 평균을 표시하는 avg, 가장 작은 값을 표시하는 min, 가장 큰 값을 표시하는 max 등과 같은 5개이다. 히스토그램 함수는 histogram 트레이스의 histfunc 속성에 함수명을 설정함으로써 사용할 수 있다. 만약 count 이외의 함수를 사용한다면 각각의 함수에 적용되어야 하는 변수를 y 속성에 설정해주어야 한다. (143쪽)

Plotly는 동적 데이터 시각화이기 때문에 온라인에서 사용자의 반응에 따라 작동하는 다양한 기능을 제공한다. 여기에는 여러 가지 기능이 있지만, 데이터값과 해당 값의 변량 등 시각화된 데이터의 해석이 원활하도록 제공하는 기능이 호버이다. 호버는 Plotly에서만 제공하는 기능은 아니고 과거 ‘tooltip’이라는 이름으로 많이 사용된 기능이다. 즉, 사용자의 마우스나 디지털 포인팅 장비와 상호 반응해 그 기기가 포인팅하는 곳의 정보를 조그마한 박스를 통해 사용자에게 알려주는 기능이다. 이 호버는 흔히 ‘mouse over’, ‘mouse hover’, ‘hover box’라고도 불리며, CSS를 사용하여 웹 브라우저에서 사용할 수 있다. (234쪽)

R의 ggplot2나 파이썬의 Matplotlib, seaborn으로 만든 정적 시각화는 그래프를 만들 때 시각화한 데이터 외에 시각화 자체에서 추가적으로 데이터를 얻기는 어렵다. 따라서 시각화에 추가적인 데이터를 제공하기 위해서는 다시 코딩해서 만들어야 하는 불편함이 따른다. 특히 특정 위치의 데이터값을 확인하거나 특정 구간 데이터를 줌인하기 위해서도 다시 코딩해야 하는데 사용자의 사용 패턴을 예상하여 수없이 많은 시각화를 만들어 놓을 수는 없다. 반면 Plotly와 같은 동적 시각화에서는 특징적 데이터값의 확인, 줌인, 줌아웃, 특정 데이터만의 표기 등 데이터 분석시 활용할 수 있는 다양한 기능을 제공한다. Plotly에서는 이와 같은 기능들을 모아둔 아이콘 집합을 모드바라고 한다. (355쪽)

파이썬에서 Plotly를 만드는 데에는 Plotly 라이브러리 plotly.graph_objects 모듈을 사용하는 방법과 plotly.express 모듈을 사용하는 두 가지 방법이 있다. Plotly 제작사에서도 Plotly의 생성 원리를 파악하고 상세한 기능을 사용하기 위해서는 graph_objects를 사용할 것을 권고하고 있다. 하지만 graph_objects 모듈을 사용하여 Plotly를 만들다 보면 코드도 매우 길어지고 어디 한 군데 괄호가 빠지는 경우나 잘못 표시되는 경우 매우 혼란스러워진다. 그래서 Plotly를 보다 쉽게 만들 수 있는 express 모듈을 제공한다. (420쪽)

관련이미지

저자소개

이기준 [저] 신작알림 SMS신청
생년월일 -

한국항공대학교 컴퓨터공학과(공학박사). 한국교육개발원 국가교육통계연구본부장, 교육통계센터 소장, 과학기술정보통신부 인공지능윤리 포럼 위원, 교육부 청년취업정책 자문위원, 통계청 통계분류자문위원을 지냈으며, 현재 한국교육개발원 정보화실장이다.

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    100자평

    작성시 유의사항

    평점
    0/100자
    등록하기

    100자평

    10.0
    (총 0건)

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    상호

    (주)교보문고

    대표자명

    안병현

    사업자등록번호

    102-81-11670

    연락처

    1544-1900

    전자우편주소

    callcenter@kyobobook.co.kr

    통신판매업신고번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    (주)KG이니시스 구매안전서비스서비스 가입사실 확인

    (주)인터파크커머스는 회원님들의 안전거래를 위해 구매금액, 결제수단에 상관없이 (주)인터파크커머스를 통한 모든 거래에 대하여
    (주)KG이니시스가 제공하는 구매안전서비스를 적용하고 있습니다.

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시 15,000원 이상 무료배송, 15,000원 미만 2,500원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용