[eBook]단단한 강화학습 : 강화학습 기본 개념을 제대로 정리한 인공지능 교과서

원제 : Reinforcement Learning: An Introduction

저 : 리처드 서튼, 앤드류 바르토역 : 김성우출판사 : 제이펍발행일 : 2020년 09월08일 | 종이책 발행일 : 2020년 03월31일

  • 크게보기
  • 미리보기
공유하기
판매가
24,500원 쿠폰받기

적립혜택

1,220P(5%)  

5만원이상 주문시 2천P+등급별 최대 1.5%적립

I-Point 적립은 출고완료 후 14일 이내 마이페이지에서 적립받기한 경우만 적립됩니다.

추가혜택
5만원이상 최대 24개월 무이자 더보기

파일포맷/용량

pdf / 29.1 MB

이용환경

아이폰/아이패드/안드로이드폰·태블릿/PC

다운로드기간

제한없음

다운로드방법

유/무선 모두 지원

수량

소중한 분들에게eBook선물하세요! [자세히보기]
북카트담기 바로구매

쿠폰/사은품/적립포인트는 적용 조건이 맞을 시 제공됩니다.

쿠폰 금액할인 적립P Total 최대혜택 무이자 사은품
- - 1,588P 3,588원 - -

이상품의 다른 구매방식

전체

상품상세정보

저자소개

배송/교환/환불

글씨크게 글씨작게 글씨크기

전체

상품상세정보

저자소개

리뷰

배송/교환/환불

글씨크게 글씨작게 글씨크기

이상품의분류 TOP

이상품의 eBook 파일 정보 TOP

구성 파일 갯수 : 0
구성 파일 명 : 단단한 강화학습
  • 이 상품을 구매후 마이북쇼핑 > 나의 eBook에서 각각의 eBook 파일을 확인할 수 있습니다.
  • Window 10 에서는 PC viewer 작동이 원활하지 않을 수 있습니다.

북마스터소개글 TOP

내용을 대폭 보강하여 20년 만에 개정된 강화학습 분야의 절대 바이블!

인공지능 분야에서 가장 활발하게 연구되고 있는 분야 중 하나인 강화학습은 복잡하고 불확실한 환경과 상호작용하는 학습자에게 주어지는 보상을 최대화하는 수치 계산적 학습 방법이다. 리처드 서튼과 앤드류 바르토는 이 책 [단단한 강화학습]을 통해 강화학습의 핵심적인 개념과 알고리즘을 분명하고 이해하기 쉽게 설명한다. 1판이 출간된 이후 새롭게 부각된 주제들을 추가하였고, 이미 다루었던 주제들도 최신 내용으로 업데이트하였다.

출판사서평 TOP

내용을 대폭 보강하여 20년 만에 개정된 강화학습 분야의 절대 바이블!
강화학습의 핵심 개념과 최신 알고리즘을 쉽고 명료하게 이해한다!


인공지능 분야에서 가장 활발하게 연구되고 있는 분야 중 하나인 강화학습은 복잡하고 불확실한 환경과 상호작용하는 학습자에게 주어지는 보상을 최대화하는 수치 계산적 학습 방법이다. 리처드 서튼과 앤드류 바르토는 이 책 [단단한 강화학습]을 통해 강화학습의 핵심적인 개념과 알고리즘을 분명하고 이해하기 쉽게 설명한다. 1판이 출간된 이후 새롭게 부각된 주제들을 추가하였고, 이미 다루었던 주제들도 최신 내용으로 업데이트하였다.

1판과 마찬가지로 2판에서도 핵심적인 온라인 학습 알고리즘을 집중적으로 다루었는데, 보다 많은 수학적 내용을 별도의 글 상자 안에 추가하였다. 이 책은 크게 다음과 같은 세 부분으로 나누어진다.

■ 첫 번째 부분에서는 정확한 해법을 찾을 수 있는 표 기반 방법만을 적용하여 가능한 한 많은 강화학습 방법을 다루었다. 첫 번째 부분에 제시되는 많은 알고리즘은 2판에서 새롭게 추가된 것인데, 여기에는 UCB, 기댓값 살사, 이중 학습이 포함된다.
■ 두 번째 부분에서는 인공 신경망이나 푸리에 기반과 같은 주제를 다루는 절이 새롭게 추가되면서 첫 번째 부분에서 제시된 방법들이 함수 근사 기반의 방법으로 확장되었고, 비활성 정책 학습과 정책 경사도 방법에 대한 내용이 더욱 풍부해졌다.
■ 세 번째 부분에서는 강화학습이 심리학 및 신경 과학과 어떤 관계인지를 다루는 새로운 장들이 추가되었고, 알파고와 알파고 제로, 아타리 게임, IBM 왓슨의 내기 전략과 같은 사례 연구를 다루는 장이 업데이트되었다. 마지막 장에서는 강화학습이 미래 사회에 미칠 영향에 대해 논의하였다.

목차 TOP

CHAPTER 01 소개 1
1.1 강화학습 2
1.2 예제 5
1.3 강화학습의 구성 요소 7
1.4 한계와 범위 9
1.5 확장된 예제: 틱택토 10
1.6 요약 16
1.7 강화학습의 초기 역사 17
참고문헌 27

PART I 표 형태의 해법
CHAPTER 02 다중 선택 31

2.1 다중 선택 문제 32
2.2 행동 가치 방법 34
2.3 10중 선택 테스트 35
2.4 점증적 구현 38
2.5 비정상 문제의 흔적 40
2.6 긍정적 초깃값 42
2.7 신뢰 상한 행동 선택 44
2.8 경사도 다중 선택 알고리즘 46
2.9 연관 탐색(맥락적 다중 선택) 50
2.10 요약 51
참고문헌 및 역사적 사실 54

CHAPTER 03 유한 마르코프 ...

본문중에서 TOP

이 책이 처음 출간된 1998년 이후로 20년 동안 인공지능 기술은 엄청나게 발전했다. 강화학습을 비롯한 기계학습 기술의 발전은 인공지능의 발전에 큰 동력을 제공해 주었다. 기계학습 기술의 발전에는 컴퓨터의 계산 능력이 눈부시게 향상된 것이 한몫을 했지만, 새로운 이론과 알고리즘의 개발 또한 중요한 역할을 했다. 이러한 변화가 있었음에도 이 책의 2판 작업이 오랜 시간 지체되어 2012년이 되어서야 작업을 시작할 수 있었다. 2판의 목적은 이 책을 처음 출간했을 때와 다르지 않다. 즉, 관련된 모든 분야의 독자들이 강화학습의 핵심 개념과 알고리즘을 쉽고 명료하게 이해할 수 있도록 하는 것이다.
( '머리말' 중에서/ p.xviii)

다음과 같은 학습 문제를 생각해 보자. k개의 서로 다른 옵션이나 행동 중 하나를 반복적으로 선택해야 한다. 매 선택 후에는 숫자로 된 보상이 주어진다. 이때 보상을 나타내는 값은 선택된 행동에 따라 결정되는 정상 확률 분포(stationary probability distribution, 시간에 따라 변하지 않는 확률 분포_옮긴이)로부터 얻어진다. 선택의 목적은 일정 기간, 예를 들면 행동을 1,000번 선택하는 기간 또는 1,000개의 시간 간격(tim ...

저자소개 TOP

리처드 서튼 [저]

앨버타 대학교의 컴퓨터 과학과 교수이자 같은 대학에서 강화학습 및 인공지능 분과의 AITF(Alberta Innovates Technology Future) 의장을 맡고 있다. 또한, 딥마인드의 우수 과학자(Distinguished Research Scientist)이기도 하다.
31,500 (10%)

전체선택

앤드류 바르토 [저]

매사추세츠 대학교 애머스트 캠퍼스의 컴퓨터 및 정보과학 대학에서 명예 교수로 재직 중이다.
31,500 (10%)

전체선택

김성우 [역]

인공위성 제어에 지도학습을 적용한 연구로 박사학위를 받았다. 지금은 인공위성 개발 업체에서 위성 충돌 회피 및 위성 영상 분석을 위한 기계학습 방법을 연구하고 있다.

전체선택

평점주기 starstarstarstarstar

공유
  • 기대지수

  • 내용

  • 재미

  • 편집/디자인

등록
* 연락처 등 개인정보 입력 시 개인정보도용 등의 불이익이 따를 수 있으니 주의해 주시기 바랍니다. [0 / 200자]

배송/교환/환불 TOP

eBook 구매 안내

  • 인터파크도서 > eBook 메뉴로 접속 후 구매 가능합니다.
  • 스마트폰/패드 biscuit 무료 어플리케이션에서 [스토어]로 접속 후 구매 가능합니다.
  • 비스킷탭에서 [스토어]로 접속 후 구매 가능합니다.
  • 모바일웹 (http://m.book.interpark.com) 에서 eBook 페이지로 접속 후 구매 가능합니다.

eBook 다운로드 안내

  • eBook 상품은 결제완료 즉시 다운로드하여 읽을 수 있습니다.
  • 구매하신 eBook 상품은 총 5대의 기기에 다운로드 하실 수 있습니다.
  • 대여 상품일 경우 eBook 파일의 대여기간이 만료되면 더 이상 eBook 파일을 읽을 수 없습니다.

eBook 다운로드 방법

  • 1. 스마트폰/패드에서 다운로드 받기
    스마트폰/패드 biscuit 어플리케이션 > [다운]에서 구매 상품 다운로드시 [내책장]에서 확인 가능합니다.
    비스킷탭 > [다운로드 대기 eBook]에서 구매 상품 다운로드 시 [서재List]에서 확인 가능 합니다.
  • 2. PC뷰어에서 다운로드 받기
    무료로 제공하는 PC뷰어를 PC에 설치>[다운로드 대기]에서 다운로드 후 이용 가능 합니다.
    Window 10에서는 PC viewer 작동이 원활하지 않을 수 있습니다.

eBook 환불 안내

  • 1. 상품 구매 후 다운로드 받은 경우
    주문 취소가 불가능 합니다.
  • 2. 다운로드 받지 않은 경우
    상품 구입 후 7일 이내 주문 취소 가능합니다. (7일 경과시 취소 불가)

고객센터 안내

  • 1. eBook 콘텐츠 문의 : eBook 고객센터 1588-2547 (평일 - 오전 09:00 ~ 오후 06:00 / 토요일 - 오전 09:00 ~ 오후 01:00 / 일요일, 공휴일 휴무)

전체

상품상세정보

저자소개

배송/교환/환불

TOP