간편결제, 신용카드 청구할인
인터파크 롯데카드 5% (47,030원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (34,650원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (39,600원)
(최대할인 4만원 / 2만원 이상 결제)
Close

The R Book(한국어판) : R로 배우는 데이터 분석 기술

원제 : The R Book
소득공제

2013년 9월 9일 이후 누적수치입니다.

공유하기
정가

55,000원

  • 49,500 (10%할인)

    2,750P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 마이페이지에서 직접 구매확정하신 경우만 적립 됩니다.
추가혜택
배송정보
  • 7/8(금) 이내 발송 예정  (서울시 강남구 삼성로 512)
  • 무료배송
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(71)

  • 상품권

AD

책소개

빅데이터 시대에 가장 범용적으로 사용되는 통계 언어인 R의 기초부터 활용까지 전반적인 내용과 상세한 예제를 다룬 책이다. 이 책에서는 R을 이용하여 데이터 처리에 필요한 기초문법과 그래픽부터 가설 검정, 회귀분석, 분산 분석, 다변량 분석, 시계열 분석, 생존 분석, 베이지안 통계 등의 고급 분석까지 폭 넓게 다루고 있다.

출판사 서평

★ 요약 ★

빅데이터 시대에 가장 범용적으로 사용되는 통계 언어인 R의 기초부터 활용까지 전반적인 내용과 상세한 예제를 다룬 책이다. 이 책에서는 R을 이용하여 데이터 처리에 필요한 기초문법과 그래픽부터 가설 검정, 회귀분석, 분산 분석, 다변량 분석, 시계열 분석, 생존 분석, 베이지안 통계 등의 고급 분석까지 폭 넓게 다루고 있다. 이 책 한 권으로 R언어 초보자부터 전문가까지 누구나 필요로 하는 데이터 처리와 분석에 대한 다양한 정보를 습득할 수 있다. 특히 각 주제에 대한 분석방법을 상세한 예제코드와 함께 소개하고 있어 데이터 분석 기술과 R 프로그래밍 기술을 쉽게 익히고 실행하여 볼 수 있다.

★ 이 책에서 다루는 내용 ★

■ 필요한 정보를 효율적으로 찾을 수 있도록 명확한 구조로 설명
■ 지난 5년 동안 R의 변화 과정 한눈에 살펴보기
■ 베이지안 분석과 메타 분석에 대한 설명
■ 참고문헌과 참고자료 부록 수정과 업데이트
■ 책 내용에 있는 예제를 사용자가 실행해볼 수 있는 예제 코드 제공

★ 이 책의 대상 독자 ★

■ 컴퓨터와 통계 초보자
■ 프로젝트 작업에 도움이 필요한 학생
■ R과 통계 작업을 수행한 경험이 있으나 두 분야에 대해 배우고 싶은 사람
■ 회귀 분석과 분산 분석 경험이 있으나 고급 통계 모델링을 배우고 싶은 사람
■ 통계 경험이 있는 R 초보자
■ 컴퓨터 경험이 있는 R 초보자
■ 통계와 컴퓨터에 익숙하지만 참고서가 필요한 사람

★ 추천의 글 ★

“여러분이 R 사용자이거나 사용자가 되고 싶다면, 이 책은 항상 여러분 곁에 두고 참고해야 하는 책이다. R 언어로 데이터를 분석하는 방법에 대한 수많은 도서 중에서 단연 돋보이는 책이다.”
- 미국 통계학자

“높은 수준의 소프트웨어인 R 언어는 정량 분석의 표준을 만들어 가고 있다. 이 책 덕분에 누구든지 R 언어에 대해 이해할 수 있게 되었다.”
- 연금기관 데이터 분석전문가

“이 책은 R 환경에 대한 도서에서 중요한 위치를 차지하고 있으며, R을 사용한 통계 분석 방법에 대한 전문지식을 다룬다. 과학에서 경제학, 그리고 의학에서 공학에 이르기까지 다양한 분야에서 R을 활용한 통계 분석 기술을 배우려고 하는 초보 및 중급 사용자를 대상으로 한다.”
-컴퓨팅 리뷰

“완벽하게 개정되고 업데이트된 참고문헌과 참고자료 섹션을 제공한다. 또한 사용자가 실행해 볼 수 있도록 본문에 실린 예제를 웹 사이트에서 지원한다.”
-Zentralbalt Math

“전반적으로 이 책은 막강하고 지속적으로 진화하고 있는 R 언어에 대한 좋은 가이드다. 완전한 레퍼런스에 가깝고, 다루는 내용은 매우 다양하며 우수하다. R에 대한 가이드인 이 책을 통해 좀 더 쉽게 R을 사용할 수 있을 것이다.”
-Nekkidblogger.com

“이 책은 학기 중에 학생들에게 판매하는 교재보다 훨씬 더 큰 매력을 갖고 있는 고전이다. 이 책은 출간되면 베스트셀러가 될 것이다.”
-북셀러

목차

1장 시작
___1.1 이 책의 사용법
______1.1.1 컴퓨터와 통계 초보자
______1.1.2 프로젝트 작업에 도움이 필요한 학생
______1.1.3 R과 통계 작업을 수행한 경험이 있으나 좀 더 배우고 싶은 사람
______1.1.4 회귀 분석과 분산 분석 경험이 있으나 고급 통계 모델링을 배우고 싶은 사람
______1.1.5 통계 경험이 있는 R 초보자
______1.1.6 컴퓨터 경험이 있는 R 초보자
______1.1.7 통계와 컴퓨터에 익숙하지만 참고서가 필요한 사람
___1.2 R 설치
___1.3 R 실행
___1.4 포괄적 R 아카이브 네트워크
______1.4.1 매뉴얼
______1.4.2 자주 묻는 질문
______1.4.3 기증 문서
___1.5 R에서 도움말 사용
______1.5.1 함수 예제
______1.5.2 R 함수에 대한 데모
___1.6 R 패키지
______1.6.1 패키지의 내용
______1.6.2 패키지 설치
___1.7 명령 행 vs. 스크립트
___1.8 데이터 편집기
___1.9 R 화면의 모양 변경
___1.10 실행 후 정리
___1.11 다른 컴퓨터 언어와 연계

2장 R 언어의 기초
___2.1 계산
______2.1.1 복소수
______2.1.2 반올림
______2.1.3 산술
______2.1.4 나머지와 몫
______2.1.5 변수명과 할당
______2.1.6 연산자
______2.1.7 정수
______2.1.8 요인
___2.2 논리연산자
______2.2.1 TRUE와 T, FALSE와 F
______2.2.2 실수값에 대한 동등 여부 테스트
______2.2.3 all.equal을 사용한 부동 소수점 숫자의 동등 여부 확인
______2.2.4 all.equal 함수를 사용한 개체 간 차이 요약
______2.2.5 참과 거짓의 조합에 대한 연산
______2.2.6 논리연산
___2.3 수열 생성
______2.3.1 반복 생성
______2.3.2 요인 수준 생성
___2.4 멤버십: R에서 테스팅과 강제 형변환
___2.5 결측값, 무한대, 숫자가 아닌 값
______2.5.1 결측값: NA
___2.6 벡터와 첨자
______2.6.1 첨자를 사용해 벡터 요소 추출
______2.6.2 벡터 클래스
______2.6.3 벡터에서 요소 명명
______2.6.4 논리 첨자로 분석
___2.7 벡터 함수
______2.7.1 tapply 함수로 평균 테이블 계산
______2.7.2 그룹 요약 통계를 위한 집계 함수
______2.7.3 P병렬 최솟값과 최댓값: pmin과 pmax
______2.7.4 그룹별 벡터 요약 정보
______2.7.5 벡터 내에서 주소
______2.7.6 가장 가까운 값 검색
______2.7.7 정렬, 순위, 순서
______2.7.8 unique와 duplicated의 차이 이해
______2.7.9 벡터에서 실행 횟수 산출
______2.7.10 집합: union, intersect, setdiff
___2.8 행렬과 배열
______2.8.1 행렬
______2.8.2 행렬의 행과 열에 이름 지정
______2.8.3 행렬의 행 또는 열 계산
______2.8.4 행렬에 행과 열 추가
______2.8.5 sweep 함수
______2.8.6 apply, sapply, lapply로 함수 적용
______2.8.7 max.col 함수 사용
______2.8.8 aperm을 이용한 다차원 배열의 구조 조정
___2.9 임의의 숫자, 샘플링과 셔플링
______2.9.1 샘플링 함수
___2.10 루프와 반복
______2.10.1 이진 변환
______2.10.2 루프 방지
______2.10.3 루프 속도 저하
______2.10.4 연결 또는 재귀 함수를 호출해 데이터 집합을 증가시키지 말 것
______2.10.5 시계열 생성을 위한 루프
___2.11 리스트
______2.11.1 리스트와 lapply
______2.11.2 리스트 조정과 저장
___2.12 텍스트와 문자열, 패턴 일치
______2.12.1 문자열 연결
______2.12.2 부분 문자열 추출
______2.12.3 문자열 내에 대상 문자의 개수 계산
______2.12.4 대문자와 소문자
______2.12.5 match 함수와 관계형 데이터 베이스
______2.12.6 패턴 매칭
______2.12.7 모든 것이라는 의미의 점 문자
______2.12.8 문자열 내에서 텍스트 교체
______2.12.9 regexpr을 사용해 벡터 내에서 패턴 위치 검색
______2.12.10 %in%와 which 사용
______2.12.11 패턴 일치 심화
______2.12.12 Perl 정규표현식
______2.12.13 복잡한 문자열에서 패턴화된 텍스트 제거
___2.13 R에서 날짜와 시간
______2.13.1 파일에서 시간 데이터 인식
______2.13.2 strptime 함수
______2.13.3 difftime 함수
______2.13.4 날짜와 시간 계산
______2.13.5 difftime과 as.difftime 함수
______2.13.6 날짜 배열 생성
______2.13.7 데이터 프레임의 행 간 시간 차이 계산
______2.13.8 날짜와 시간을 이용한 회귀분석
______2.13.9 R에서 날짜와 시간 요약
___2.14 환경
______2.14.1 attach보다 with 사용
______2.14.2 attach 사용
___2.15 R 함수 작성
______2.15.1 단일표본의 산술평균
______2.15.2 단일표본의 중위수
______2.15.3 기하평균
______2.15.4 조화평균
______2.15.5 분산
______2.15.6 자유도
______2.15.7 분산비 검정
______2.15.8 분산 사용
______2.15.9 디파싱: 오차 막대에 대한 그래픽 함수
______2.15.10 switch 함수
______2.15.11 함수의 연산 환경
______2.15.12 범위
______2.15.13 선택 인자
______2.15.14 3개 점 인자의 변수 개수
______2.15.15 함수에서 값 반환
______2.15.16 무기명 함수
______2.15.17 함수에 대한 인자의 유연한 처리
______2.15.18 개체의 구조: str
___2.16 R에서 파일 작성
______2.16.1 작업 내용 저장
______2.16.2 이력 저장
______2.16.3 그래픽 저장
______2.16.4 R에서 생성한 데이터를 디스크에 저장
______2.16.5 엑셀 스프레드시트에 붙여넣기
______2.16.6 R에서 엑셀이 읽을 수 있는 파일 작성
___2.17 프로그래밍 팁

3장 데이터 입력
___3.1 키보드에서 데이터 입력
___3.2 파일에서 데이터 입력
______3.2.1 작업 디렉터리
______3.2.2 read.table로 데이터 입력
______3.2.3 read.table을 사용하는 경우 일반 오류
______3.2.4 구분 기호와 소수점
______3.2.5 웹에서 직접 데이터 입력
___3.3 scan 함수를 이용해 파일로부터 입력
______3.3.1 scan 함수로 데이터 프레임 읽어오기
______3.3.2 복잡한 파일 구조에서 scan을 사용해 데이터 입력
___3.4 rea dLine s를 사용해 파일에서 데이터 읽어오기
______3.4.1 readLines를 사용해 데이터 프레임 입력
______3.4.2 readLines를 사용해 비표준 파일 읽기
___3.5 데이터 프레임을 atta ch할 때 주의사항
___3.6 마스킹
___3.7 입출력 포맷
___3.8 명령 행에서 파일 확인
___3.9 파일에서 날짜와 시간 읽어오기
___3.10 내장 데이터 파일
___3.11 파일 경로
___3.12 연결
___3.13 외부 DB에서 데이터 읽어오기
______3.13.1 컴퓨터에 적합한 DS N 생성
______3.13.2 DB 데이터를 읽기 위한 R 설정

4장 데이터 프레임
___4.1 첨자와 지표
___4.2 임의로 데이터 프레임에서 행 선택
___4.3 데이터 프레임 정렬
___4.4 데이터 프레임에서 논리조건으로 행 선택
___4.5 누락값 NA를 포함하는 행 생략
______4.5.1 NA를 0으로 대체
___4.6 인위적 반복을 제거하기 위해 order 와 !dupl icate d 사용
___4.7 혼합 순서의 복잡한 정렬
___4.8 행 번호 대신 행 이름을 갖는 데이터 프레임
___4.9 다른 종류의 개체에서 데이터 프레임 생성
___4.10 데이터 프레임에서 중복된 행 제거
___4.11 데이터 프레임에서 날짜
___4.12 mdatafra mes에서 mat ch 함수 사용
___4.13 두 개의 데이터 프레임 병합
___4.14 데이터 프레임에 마진 추가
___4.15 데이터 프레임의 내용 요약

5장 그래픽스
___5.1 이변량 그래프
___5.2 2개의 연속형 설명 변수 그래프: 산점도
______5.2.1 그래프 기호: pch
______5.2.2 그래프의 기호 색상
______5.2.3 산점도에 텍스트 추가
______5.2.4 산점도에서 개별값 식별
______5.2.5 세 번째 변수를 사용해 산점도 라벨링
______5.2.6 점 연결
______5.2.7 계단식 선 그래프
___5.3 그래프에 다른 모양 추가
______5.3.1 locator 함수를 사용해 커서로 그래프상에 항목 배치
______5.3.2 polygon으로 복잡한 형상 그리기
___5.4 수학 함수 그리기
______5.4.1 산점도에 부드러운 모수 곡선 추가
______5.4.2 산점도를 이용하여 비모수 곡선 적합
___5.5 그래픽 창의 모양과 크기
___5.6 범주형 설명 변수를 그래프로 표시
______5.6.1 유의한 차이를 노치로 표현한 상자그래프
______5.6.2 오차막대를 갖는 막대그래프
______5.6.3 다양한 비교를 위한 그래프
______5.6.4 범주형 설명 변수에 색상 팔레트 사용
___5.7 단일 변수 표본 그래프
______5.7.1 히스토그램과 막대차트
______5.7.2 히스토그램
______5.7.3 정수의 히스토그램
______5.7.4 히스토그램에 밀도함수 그리기
______5.7.5 연속형 변수의 확률밀도 추정
______5.7.6 인덱스 그래프
______5.7.7 시계열 그래프
______5.7.8 파이차트
______5.7.9 stripchart 함수
______5.7.10 정규성 검증 그래프
___5.8 다중 변수를 갖는 그래프
______5.8.1 pairs 함수
______5.8.2 coplot 함수
______5.8.3 교호작용 그래프
___5.9 특별한 그래프
______5.9.1 설계 그래프
______5.9.2 버블 그래프
______5.9.3 많은 동일 값을 갖는 그래프
___5.10 그래픽을 파일로 저장
___5.11 요약

6장 테이블
___6.1 데이터 개수 테이블
___6.2 요약 테이블
___6.3 테이블을 데이터 프레임으로 확장
___6.4 데이터 프레임을 테이블로 변환
___6.5 prop.table 로 비율 테이블 계산
___6.6 scale 함수
___6.7 expand.grid 함수
___6.8 model.matrix 함수
___6.9 table과 tabulate 비교

7장 수학 연산
___7.1 수학 함수
______7.1.1 로그 함수
______7.1.2 3차 곡선 함수
______7.1.3 멱함수
______7.1.4 다항 함수
______7.1.5 감마 함수
______7.1.6 비대칭 함수
______7.1.7 비대칭 함수의 모수 추정
______7.1.8 시그모이드 함수
______7.1.9 이항지수 분포 모델
______7.1.10 반응 변수와 설명 변수의 변환
___7.2 확률 함수
___7.3 연속확률 분포
______7.3.1 정규 분포
______7.3.2 중심극한 이론
______7.3.3 정규 분포의 최대우도
______7.3.4 평균과 표준편차로 임의의 숫자 생성
______7.3.5 데이터의 정규성 비교
______7.3.6 가설 검정에 사용된 기타 분포
______7.3.7 카이제곱 분포
______7.3.8 피셔의 F 분포
______7.3.9 스튜던트 t 분포
______7.3.10 감마 분포
______7.3.11 지수 분포
______7.3.12 베타 분포
______7.3.13 코시 분포
______7.3.14 로그정규 분포
______7.3.15 로지스틱 분포
______7.3.16 로그로지스틱 분포
______7.3.17 와이블 분포
______7.3.18 다변량 정규 분포
______7.3.19 일양 분포
______7.3.20 경험적 누적분포 함수를 그래프로 표시
___7.4 이산확률 분포
______7.4.1 베르누이 분포
______7.4.2 이항 분포
______7.4.3 기하 분포
______7.4.4 초기하 분포
______7.4.5 다항 분포
______7.4.6 포아송 분포
______7.4.7 음이항 분포
______7.4.8 윌콕슨 순위 합 통계
___7.5 행렬 대수
______7.5.1 행렬곱
______7.5.2 대각 행렬
______7.5.3 행렬식
______7.5.4 역행렬
______7.5.5 고유값과 고유벡터
______7.5.6 통계 모델에서 행렬
______7.5.7 행렬로 통계 모델 표현
___7.6 행렬을 사용해 선형 방정식 시스템 문제 해결
___7.7 미적분
______7.7.1 미분
______7.7.2 적분
______7.7.3 미분방정식

8장 고전 검사
___8.1 단일 표본
______8.1.1 데이터 요약
______8.1.2 정규성 검정 그래프
______8.1.3 정규성 검정
______8.1.4 단일 표본 데이터의 사례
___8.2 가설 검정에서 부트스트랩
___8.3 왜도와 첨도
___8.3.1 왜도
______8.3.2 첨도
___8.4 2개의 표본 검정
______8.4.1 2개의 분산비교
______8.4.2 두 평균 비교
______8.4.3 스튜던트 t 검정
______8.4.4 윌콕슨 순위합 검정
___8.5 대응표본 검정
___8.6 사인 검정
___8.7 두 비율을 비교하기 위한 이항 분포 검정
___8.8 카이제곱 분할표
______8.8.1 피어슨 카이제곱
______8.8.2 우발성에 대한 G 검정
______8.8.3 귀무가설에서 불균등 확률
______8.8.4 테이블 개체에 근거한 카이제곱 검정
______8.8.5 작은 기대 빈도를 갖는 분할표: 피셔의 정확 검정
___8.9 상관 관계와 공분산
______8.9.1 데이터 채취
______8.9.2 부분 상관 관계
______8.9.3 변수 간 차이에 대한 상관 관계와 분산
______8.9.4 척도를 고려한 상관 관계
___8.10 콜모고로프 스미르노프 검정
___8.11 파워 분석
___8.12 부트스트랩

9장 통계 모델링
___9.1 선착순
___9.2 최대우도
___9.3 간결함의 원칙: 오캄의 면도날
___9.4 통계 모형 유형
___9.5 모형 단순화 단계
______9.5.1 주의사항
______9.5.2 제거 순서
___9.6 R에서 모형 식
______9.6.1 설명 변수 사이의 상호작용
______9.6.2 수식 개체 생성
___9.7 복수 개의 오차 조건
___9.8 매개변수 1을 이용한 y 절편
___9.9 모형 단순화를 위한 up date 함수
___9.10 회귀 분석을 위한 모형 공식
___9.11 박스 콕스 변환
___9.12 모형 평가
___9.13 모형 확인
______9.13.1 이분산성
______9.13.2 잔차의 비정규성
___9.14 영향도
___9.15 R에서 통계 모델링의 요약
___9.16 모형 적합 함수의 선택인자
______9.16.1 부분 집합
______9.16.2 중요도
______9.16.3 결측값
______9.16.4 옵셋
______9.16.5 같은 변수명을 포함한 데이터 프레임
___9.17 아카이케 정보 기준
______9.17.1 모형 적합에 대한 측정값으로서 AIC
___9.18 영향력
___9.19 오지정 모형
___9.20 R에서 모형 체크
___9.21 모형 개체에서 정보 추출
______9.21.1 이름으로 정보 추출
______9.21.2 리스트 첨자로 정보 추출
______9.21.3 $를 사용해 모형 성분 추출
______9.21.4 모형과 함께 리스트 사용
___9.22 연속형과 범주형 설명 변수에 대한 summary 테이블
___9.23 대비
______9.23.1 대비계수
______9.23.2 R에서 대비 분석
______9.23.3 사전 대비
___9.24 단계 제거에 의한 모형 단순화
___9.25 3가지 유형의 대비 비교
______9.25.1 실험 조건 대비
______9.25.2 헬머트 대비
______9.25.3 합 대비
___9.26 별칭
___9.27 직교 다항 대비: contr .poly
___9.28 통계 모델링의 개요


10장 회귀 분석
___10.1 선형 회귀
______10.1.1 R에서 유명한 값 5개
______10.1.2 수정 제곱합과 곱의 합
______10.1.3 산점도
______10.1.4 분산 분석: SS Y = SS R + SS E
______10.1.5 모수에 대한 불신뢰도 추정
______10.1.6 적합 모형을 사용해 예측
______10.1.7 모형 검사
___10.2 기본 함수에 대한 다항 적합
___10.3 다항 회귀
___10.4 역학 모형을 데이터에 적합
___10.5 변환 후 선형 회귀
___10.6 회귀식에 의한 예측
___10.7 회귀 분석에서 적합도 부족 검정
___10.8 회귀식을 이용한 부트스트랩
___10.9 회귀식을 이용한 잭나이프
___10.10 부트스트랩 후 잭나이프
___10.11 잔차에서 시리얼한 상관 관계
___10.12 조각별 회귀
___10.13 다중 회귀
______10.13.1 다중 회귀 모형
______10.13.2 다중 회귀 분석에서 발생되는 일반적인 문제

11장 분산 분석
___11.1 일원분산 분석
______11.1.1 일원 분산 분석 계산
______11.1.2 분산 분석의 가정
______11.1.3 일원 분산 분석의 예제
______11.1.4 효과 크기
______11.1.5 일원분산 분석 결과를 해석하기 위한 그래프
___11.2 요인 실험
___11.3 인위적 반복: 중첩 설계와 분할구
______11.3.1 분할구 실험 설계
______11.3.2 혼합효과 모형
______11.3.3 고정 효과나 랜덤 효과
______11.3.4 인위적 반복 제거
______11.3.5 파생 변수 분석
___11.4 분산성분 분석
___11.5 ANOV A에서 효과 크기: aov 또는 lm
___11.6 다중 비교
___11.7 다변량 분산 분석

12장 공분산 분석
___12.1 R에서 공분산 분석
___12.2 ANCOV A와 실험 계획
___12.3 2개 요인과 1개 연속 공변량을 갖는 ANCOV A
___12.4 ANCOV A 모형의 대비와 모수
___12.5 summary.aov에서 순서 문제

13장 일반화 선형 모형
___13.1 오차 구조
___13.2 선형예측 모형
___13.3 연결 함수
______13.3.1 정준 연결 함수
___13.4 비율 데이터와 이항오차
___13.5 카운트 데이터와 포아송 오차
___13.6 편차: GLM의 적합도 측정
___13.7 쿼시우도
___13.8 쿼시 모형 부류
___13.9 일반화 가법 모형
___13.10 옵셋
___13.11 잔차
______13.11.1 잘못 설정된 오차 구조
______13.11.2 잘못 설정된 연결 함수
___13.12 과대산포
___13.13 GLM을 부트스트랩
___13.14 정렬된 범주형 변수를 이용한 이항 GLM


14장 카운트 데이터
___14.1 포아송 오차를 갖는 회귀 분석
___14.2 카운트 데이터의 편차 분석
___14.3 카운트 데이터에 대한 공분산 분석
___14.4 빈도 분포
___14.5 로그 선형 모형에서 과대 산포
___14.6 음이항 오류

15장 테이블 형태의 카운트 데이터
___15.1 카운트에 대한 두 클래스 테이블
___15.2 카운트 데이터에 대한 표본 크기
___15.3 4개 클래스의 카운트 테이블
___15.4 2X2 분할표
___15.5 단순 분할표를 위한 로그선형 모형 사용
___15.6 분할표의 위험
___15.7 쿼시포아송과 음이항 모형 비교
___15.8 중간 복잡도의 비상 테이블
___15.9 S choener 의 도마뱀: 복잡한 분할표
___15.10 분할표에 대한 그래프 분석
___15.11 카운트 데이터에 대한 그래프: Spin plot과 spinograms

16장 비율 데이터
___16.1 한 두 가지의 비율 데이터 분석
___16.2 비율에 근거한 카운트 데이터
___16.3 배당률
___16.4 과대 산포와 가설 검정
___16.5 응용
______16.5.1 이항 오차를 갖는 로지스틱 회귀 분석
______16.5.2 생물학 검정 데이터를 사용해 LD50과 LD90 추정
______16.5.3. 범주형 설명 변수에 대한 비율 데이터
___16.6 평균 비율
___16.7 비율 카운트 데이터를 사용한 모델링 요약
___16.8 이항 데이터의 공분산 분석
___16.9 복잡한 분할표를 비율 형태로 변환


17장 바이너리 반응 변수
___17.1 발생률 함수
___17.2 로지스틱 적합의 시각적 검정
___17.3 바이너리 반응 변수를 사용한 ANCOV A
___17.4 인위적 반복를 갖는 바이너리 반응 변수

18장 일반화 가법 모형
___18.1 비모수 평활기
___18.2 일반화 가법 모형
______18.2.1 기술적 측면
___18.3 매우 볼록한 형태의 데이터 예제
___18.4 바이너리 데이터를 사용한 일반화 가법 모형
___18.5 ga m을 사용해 3차원 그래프 그리기

19장 혼합 모형
___19.1 복제와 인위적 반복
___19.2 lme 와 lmer 함수
______19.2.1 lme
______19.2.2 lmer
______19.3 최량 선형 불편 예측기
___19.4 다른 공간 척도를 사용하도록 설계된 실험: 분할구
___19.5 계층적 샘플링 및 분산 요소 분석
___19.6 시계열 인위적 반복을 사용한 혼합 모형
___19.7 혼합 모형에서 시계열 분석
___19.8 설계된 실험에서 랜덤 효과
___19.9 혼합 모형에서의 회귀 분석
___19.10 일반화 선형 혼합 모형
______19.10.1 계층적 구조화된 카운트 데이터

20장 비선형 회귀 분석
___20.1 미카엘리스멘텐 방식과 점근지수법 비교
___20.2 일반화 가법 모형
___20.3 비선형 추정을 위한 그룹화 데이터
___20.4 비선형 시계열 모형: 시계열 인위적인 반복
___20.5 자동 시작 함수
______20.5.1 자동 시작 미카엘리스멘텐 모형
______20.5.2 자동 시작 점근지수 모형
______20.5.3 자동 시작 로지스틱 모형
______20.5.4. 자동 시작하는 4모수 로지스틱 모형
______20.5.5 자동 시작 와이블 성장 함수
______20.5.6 자동 시작 일차 구획 함수
___20.6 비선형 회귀 분석 군의 부트스트랩

21장 메타 분석
___21.1 효과 크기
___21.2 가중치
___21.3 고정 효과와 랜덤 효과
______21.3.1 스케일 차에 대한 고정 효과 메타 분석
___21.3.2 크기가 조정된 평균차를 이용한 랜덤 효과
___21.4 바이너리 데이터의 랜덤 효과 메타 분석

22장 베이지안 통계
___22.1 배경
___22.2 연속형 반응 변수
___22.3 표준 사전 분포와 표준 우도
___22.4 사전 확률
______22.4.1 공액 사전 분포
___22.5 실제로 복잡한 모형을 위한 베이지안 통계
___22.6 실제 고려사항
___22.7 BUGS 모형 작성
___22.8 베이지안 통계를 위한 R 패키지
___22.9 JAGS 설치
___22.10. R에서 JAGS 실행
___22.11 단순 선형 회귀에서 MCMC 사용
___22.12 시계열 인위적 반복(pseu dorepl icat ion) 모형에서 MCMC 사용
___22.13 이항 오차 모형에서 MCMC 사용

23장 나무 모형
___23.1 배경
___23.2 회귀 나무
___23.3 나무 모형 적합에 rpart 사용
___23.4 나무 모형을 회귀 분석으로 사용
___23.5 모형 단순화
___23.6 범주 설명 변수를 사용한 분류 나무
___23.7 복제 데이터를 사용한 분류 나무
___23.8 볼록 여부 테스트

24장 시계열 분포
___24.1 니콜슨의 검정파리
___24.2 이동평균
___24.3 계절 데이터
______24.3.1 월 평균 내 패턴
___24.4 내장 시계열 함수
___24.5 분해
___24.6 시계열 트렌드 테스트
___24.7 스펙트럼 분석
___24.8 다중 시계열 분석
___24.9 시계열 데이터 시뮬레이션
___24.10 시계열 모형

25장 다변량 통계
___25.1 주성분 분석
___25.2 요인 분석
___25.3 군집 분석
______25.3.1 분할 방법
______25.3.2 kmeans의 분류 사용
___25.4 계층적 군집 분석
___25.5 판별 분석
___25.6 신경망 분석

26장 공간 통계
___26.1 점 프로세스
______26.1.1 원 안의 임의의 점
___26.2 최근접 이웃
______26.2.1 테셀레이션
___26.3 공간 임의성 검정
______26.3.1 리플리의 K
______26.3.2 사분면 기반 방법
______26.3.3 집합 패턴과 사분면 내 개체수 데이터
______26.3.4. 지도에서 카운팅 방법
___26.4 공간 통계 패키지
______26.4.1 spatstat 패키지
______26.4.2 spdep 패키지
______26.4.3 다각형 리스트
___26.5. 지리통계 데이터
___26.6 공간적 수정 오차를 이용한 회귀 모형: 일반화 최소 자승법
___26.7 관계형 데이터베이스로부터 점 분포 지도 제작

27장 생존 분석
___27.1 몬테 카를로 실험
___27.2 배경
___27.3 생존 함수
___27.4 밀도 함수
___27.5. 위험 함수
___27.6 지수 분포
______27.6.1 밀도 함수
______27.6.2 생존 함수
______27.6.3 위험 함수
___27.7 카플란메이어 생존 분포
___27.8 연령별 위험도 모형
___27.9 R에서의 생존 분석
______27.9.1 모수 모형
______27.9.2 콕스 비율 위험도 모형
______27.9.3 콕스 비율 위험 모형과 모수 중 더 나은 것
___27.10 모수 분석
___27.11 콕스 비율 위험도
___27.12 중도 절단 모형
______27.12.1 모수 모형
______27.12.2 coxph와 survreg 생존 분석 비교

28장 시뮬레이션 모형
___28.1 시간적 역학 관계: 개체군의 무질서에 대한 역학 관계
______28.1.1 무질서 상태가 되는 경로 조사
___28.2 시 및 공간 역학 관계: 2차원에서의 랜덤 워크 시뮬레이션
___28.3 공간 시뮬레이션 모형
______28.3.1 메타 개체군 역학 관계
______28.3.2 공간적으로 확실한 (국소) 밀도 의존성에서 발생한 공존 결과
___28.4 역학적 교호작용으로 인한 패턴 생성

29장 그래픽 스타일 변경
___29.1 출판용 그래프
___29.2. 색
______29.2.1 색 그룹 팔레트
______29.2.2 RColorBrewer 패키지
______29.2.3 경계선으로 구분된 기호에 색 설정
______29.2.4 범례 색상
______29.2.5 배경 색
______29.2.6 전면 색
______29.2.7 그래프의 부분별로 다른 색과 폰트 사용
______29.2.8 그래프의 모든 색 조정
___29.3 크로스 해치
___29.4 그레이스케일
___29.5 다각형에 색 설정
___29.6 로그 축
___29.7 다양한 텍스트 폰트
___29.8 그래프에 수식 및 기호 사용
___29.9 위상평면
___29.10 굵은 화살표
___29.11 3차원 그래프
___29.12 wireframe 을 사용한 복잡한 3D 그래프
___29.13 알파벳 순서별 그래픽 매개변수 정리
______29.13.1 텍스트 자리맞춤, adj
______29.13.2 그래프 주석, ann
______29.13.3 여러 그래프를 그릴 때 다음 그래프로 넘어가는 것을 늦추는 기능, ask
______29.13.4 축 조정, axis
______29.13.5 그래프 배경 색, bg
______29.13.6 그래프 상자, box
______29.13.7 그래프에서 글자 확대 함수를 사용한 기호 크기 조정, cex
______29.13.8 그래프 영역 모양 변화, plt
______29.13.9 fig를 사용해 불규칙적 레이아웃에 여러 그래프 배치
______29.13.10 fig를 사용해 공통 x축 척도에 서로 다른 y축 비율을 사용한 두 그래프 작성
______29.13.11 layout 함수
______29.13.12 단일 장치에서 여러 화면 생성하고 조정
______29.13.13 눈금의 숫자 방향 조정, las
______29.13.14 선의 끝 모양 조정과 선 연결하기, lend와 ljoin
______29.13.15 선 모양, lty
______29.13.16 선 두께, lwd
______29.13.17 동일한 화면에 여러 그래프 그리기, mfrow와 mfcol
______29.13.18 그래프 주변에 여백 넣기, mar
______29.13.19 같은 축에 1개 이상의 그래프 그리기, new
______29.13.20 동일한 그래프 화면에 서로 다른 y축을 갖는 두 그래프 작성
______29.13.21 외부 여백, oma
______29.13.22 그래프 모아 보기
______29.13.23 정사각형 그래프 영역, pty
______29.13.24 글자 회전, srt
______29.13.25 축 라벨 회전
______29.13.26 축의 눈금 표시
______29.13.27 축 유형
___29.14 트렐리스 그래픽
______29.14.1 상자수염 그래프 패널
______29.14.2 산점도 패널
______29.14.3 막대 그래프 패널
___29.14.4 조건 그래프 패널
___29.14.5 히스토그램 패널
___29.14.6 효과 크기
___29.14.7 기타 패널 함수

본문중에서

★ 저자 서문 ★

R은 데이터 분석과 그래픽을 위한 고급 프로그래밍 언어이자 환경이다. R은 베커(Becker), 챔버(Chambers), 윌크스(Wilks)의 S 언어와 수스만(Sussman)의 스킴(Scheme) 언어에 영향을 받았다. R 언어는 S 언어와 매우 비슷하지만 기본 구현과 의미는 스킴 언어에서 파생되었다. 이 책은 과학에서 경제학, 그리고 의학에서 공학에 이르기까지 다양한 분야의 초보와 중급 사용자를 대상으로 R 환경을 소개하는 것을 목적으로 한다. 이 책이 R에 대한 교과서뿐만 아니라 참고서로도 사용될 수 있기를 바란다.
책의 전반부는 통계나 컴퓨터에 대한 배경 지식이 없는 독자들을 대상으로 설명했지만, 후반부는 전반부에 대한 지식이 있다는 가정하에 설명했다. 이 책은 데이터 처리, 그래픽, 수학 함수, 광범위한 통계 분석 방법을 다룬다. 통계 분석 방법으로는 회귀 분석, 분산 분석, 일반화 선형모델링과 같은 기초 분석에서 시작하여 베이지안 분석, 공간 통계, 다변량 분석, 의사결정나무 모델, 혼합효과 모델, 시계열 분석 등과 같은 전문적인 주제를 다룬다. 검정 분석 이면에 깔린 가정을 설명하고, 통계 모델링에 중요한 접근 방법을 설명하지만, 통계 이론을 거의 포함하지 않았고 수학이나 통계 관련 배경 지식이 없어도 이해할 수 있게 했다.
여러분은 이미 적합한 통계 패키지를 숙달했을 텐데, 굳이 R 언어로 전환하려고 하는가? 이미 능숙한 통계 패키지가 있고, 매우 제한된 범위의 통계 검정을 수행하고 향후에 많거나 다양한 분석 작업을 수행하지 않는다면 굳이 전환할 필요가 없다. R 언어로 전환해야 하는 주요 이유는 첫째, 타의 추종을 불허하는 다양한 분야의 분석 사례와 둘째, 혼합효과 모델링이나 일반화 가법 모델링과 같은 새로운 최첨단 애플리케이션을 사용할 수 있기 때문이다. R을 학습해야 하는 두 번째 이유는 논문을 포함한 통계 관련 문서를 이해하기 위해서다. 더 많은 사람들이 R의 맥락에서 분석 결과 보고서를 작성하고 있으며, 보고서 작성자가 무엇에 대해 말하고 있는지에 대해 아는 것이 중요하다.
R을 사용하는 다른 분석가를 알아보기 위해 주위를 둘러보자. 많은 사람이 이미 R로 전환했다. 세계 최고의 통계학자들 또한 대부분 R을 사용하고 있으며 이러한 사실은 많은 사람들이 R에 기여하고 있다는 것을 말해준다. R로 변경해야 하는 세 번째 이유는 고품질의 유용한 후원과 지원이 있기 때문이다. 웹상에는 R에 대한 질문에 답해줄 수 있는 전용 R 마법사라는 훌륭한 네트워크가 있다. 통계 계산을 잘하기 위해 노력하려 한다면, R의 구조와 이를 이용해 함수를 작성할 수 있다는 점은 큰 도움이 된다. 마지막으로, 이 제품은 무료라는 점이다. R은 세상에서 가장 훌륭한 통합 소프트웨어이며, 무료로 제공되기까지 한다.

대부분의 명령 코드는 S-PLUS에서도 똑같이 사용되지만, 일부분은 상당한 차이가 있다. 따라서 혼동하지 않도록 주로 R을 설명하는 데 집중했다. 어느 부분에서 S-PLUS가 R과 다른지는 설명하지는 않았다. 그러므로 S-PLUS에서 작업해야 한다면, 실제로 문제없이 실행되는지 확인해보는 것이 좋다

마이클 크롤리 (Michael Crawley)
영국 런던 임페리얼 칼리지 실우드파크 캠퍼스에서 강의하고 계신 교수다. 영국왕립학회 회원(Fellow of the Royal Society)이며 R과 통계학 관련 베스트셀러인 『Statistics: An Introduction using R』과 『Statistical Computing: An Introduction to Data Analysis Using S-Plus』의 저자이기도 하다.

★ 옮긴이의 말 ★

흔히들 빅 데이터를 디지털 원유라고 부르며 이를 분석하면 막강한 정보력을 갖출 수 있다고들 합니다. 최근 몇 년 동안 빅 데이터는 IT 분야에서 큰 이슈로 떠올랐으며 이러한 움직임은 한국에서도 화두가 되고 있습니다. 이러한 현상은 다양한 컨퍼런스와 세미나, 학회, 온/오프라인 모임이 생기는 것만 봐도 알 수 있습니다. 정부와 기업에서는 빅 데이터 관련 R&D, 인력 양성, 관련 조직을 구성하고 있으며 일부 프로젝트에서는 의미 있는 결과물을 만들어내는 중입니다. 이로 인해 최근 들어 서비스나 제조업 관련 기업에서 관심을 갖기 시작하는 분야라고 할 수 있습니다.

유럽과 미국을 위주로 10여 년 전부터 데이터 분석 영역은 다양한 학회와 연구 활동이 있었고, 이를 기반으로 데이터 분석 전문 인력 양성을 위한 다양한 과정이 운영되어 왔습니다. 최근 들어 국내에도 데이터 분석 전문 인력을 양성하기 위해 대학에서도 다양한 과정이 생기고 있는데, 이는 상당히 고무적인 일입니다. 또한 온/오프라인 형태로 현업 종사자들이 모여서 R 언어를 포함한 빅 데이터 정보를 공유하고 있습니다.

데이터를 분석하는 데 반드시 필요한 것은 해당 영역에 대한 지식, 분석 툴, 분석 방법이라고 할 수 있습니다. 3가지 요소

저자소개

마이클 크롤리 [저] 신작알림 SMS신청
생년월일 -

해당작가에 대한 소개가 없습니다.

정사범, 권정민 [역] 신작알림 SMS신청
생년월일 -

해당작가에 대한 소개가 없습니다.

이 상품의 시리즈

(총 77권 / 현재구매 가능도서 72권)

선택한 상품 북카트담기
펼쳐보기

전공도서/대학교재 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    8.3

    판매자정보

    • 인터파크도서에 등록된 오픈마켓 상품은 그 내용과 책임이 모두 판매자에게 있으며, 인터파크도서는 해당 상품과 내용에 대해 책임지지 않습니다.

    상호

    (주)교보문고

    대표자명

    안병현

    사업자등록번호

    102-81-11670

    연락처

    1544-1900

    전자우편주소

    callcenter@kyobobook.co.kr

    통신판매업신고번호

    01-0653

    영업소재지

    서울특별시 종로구 종로 1(종로1가,교보빌딩)

    교환/환불

    반품/교환 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청 또는 1:1 문의 게시판 및 고객센터(1577-2555)에서 신청 가능

    반품/교환가능 기간

    변심 반품의 경우 출고완료 후 6일(영업일 기준) 이내까지만 가능
    단, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

    반품/교환 비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
    상품이나 서비스 자체의 하자로 인한 교환/반품은 반송료 판매자 부담

    반품/교환 불가 사유

    ·소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)

    ·소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등

    ·복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

    ·시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

    ·전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

    상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있음

    소비자 피해보상
    환불지연에 따른 배상

    ·상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

    ·대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

    (주) 인터파크 안전결제시스템 (에스크로) 안내

    (주)인터파크의 모든 상품은 판매자 및 결제 수단의 구분없이 회원님들의 구매안전을 위해 안전결제 시스템을 도입하여 서비스하고 있습니다.
    결제대금 예치업 등록 : 02-006-00064 서비스 가입사실 확인

    배송안내

    • 교보문고 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다.

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능합니다.

    • 배송비는 업체 배송비 정책에 따릅니다.

    • - 도서 구매 시, 1만 원 이상 무료, 1만원 미만 2천 원 - 상품별 배송비가 있는 경우, 상품별 배송비 정책 적용