간편결제, 신용카드 청구할인
카카오페이 3,000원
(카카오페이 5만원 이상 결제시, 5/1~5/31 기간 중 1회)
우리카드 3천원/7천원/1만 5천원 즉시할인
3만원/5만원/10만원 이상 결제시
삼성카드 6% (22,850원)
(삼성카드 6% 청구할인)
인터파크 롯데카드 5% (23,090원)
(최대할인 10만원 / 전월실적 40만원)
북피니언 롯데카드 30% (17,010원)
(최대할인 3만원 / 3만원 이상 결제)
NH쇼핑&인터파크카드 20% (19,440원)
(최대할인 4만원 / 2만원 이상 결제)
Close

기초부터 시작하는 강화학습/신경망 알고리즘 : AI는 어떻게 게임을 할까

소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 70
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
  • 저 : 손민규
  • 출판사 : 위키북스
  • 발행 : 2019년 11월 21일
  • 쪽수 : 312
  • 제품구성 : 전1권
  • ISBN : 9791158391768
정가

27,000원

  • 24,300 (10%할인)

    1,350P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 출고완료 후 14일 이내 마이페이지에서 적립받기한 경우만 적립됩니다.
추가혜택
배송정보
  •  당일배송을 원하실 경우 주문시 당일배송을 선택해주세요.
  • 서울시 강남구 삼성로 512변경
  • 배송지연보상 안내
  • 무료배송
  • 해외배송가능
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(52)

  • 사은품(3)

출판사 서평

강화학습을 어떻게 시작해야 할지 모르는 분들을 위해서 준비했습니다!

강화학습은 인간이 학습하는 과정과 비슷한 인공지능 분야 중 하나입니다. 로봇의 행동학습, 자율주행 자동차의 행동학습에 대표적으로 사용되며, 알파고의 핵심 알고리즘으로 유명해졌습니다.

이 책은 강화학습에 관심이 있지만 어디서 어떻게 시작해야 할지 모르는 분들을 위해 가장 기초적인 상태가치함수/행동가치함수의 정의부터 시작해서 신경망을 이용한 DQN까지 강화학습의 기본 알고리즘을 충분히 이해할 수 있게 구성했습니다.

실습 예제로 고전게임 틱택토(Tic Tac Toe)를 플레이하는 알파고 제로(AlphaGo Zero)와 같은 인공지능 플레이어를 만들어 봄으로써 인공지능이 어떻게 게임을 플레이하는가를 알아봅니다.

이 책으로 차근차근 실습을 진행한다면 강화학습의 기본 알고리즘을 충분히 이해할 수 있을 것이며, 이를 바탕으로 여러 가지 인공지능 시스템을 만들 수 있으리라 생각합니다.

목차

▣ 01장- 인공지능이란?
머신러닝의 종류
-지도학습
-비지도학습
-강화학습
강화학습과 신경망
이 책의 구성

▣ 02장- 강화학습
강화학습의 기본 요소
-환경
-상태 (S)
-에이전트
-행동 (A)
-상태전이확률 (P)
-보상 (R)
-수익 (G)
-정책 (r)
-에피소드
-마르코프 의사결정과정 (MDP)
환경과 에이전트 준비
가치함수 - 상태/행동의 가치 계산
-상태가치함수 - Vr
-행동가치함수 - Qr
동적계획법 - 최적 정책 선택
-정책 평가
-반복 정책 평가
-정책 개선
-정책 반복
-가치 반복
몬테카를로 방법
-몬테카를로 방법의 Prediction
-몬테카를로 방법의 Control
시간차 학습
-시간차 학습의 Prediction
-시간차 학습의 Control - SARSA(On-policy)
-시간차 학습의 Control - Q-learning(Off-policy)
-Double Q-learning
-정책 그레이디언트 - 액터-크리틱
함수 근사
함수 근사 - TD(0) Prediction
함수 근사 - Q-learning

▣ 03장- 인공신경망
퍼셉트론
손실함수
-평균제곱오차
-교차엔트로피오차
경사하강법
퍼셉트론의 학습
-숫자 외우기
-선형 함수 근사
-비선형 함수 근사
다층 퍼셉트론
활성화 함수
-시그모이드 함수
-하이퍼볼릭탄젠트 함수
-ReLU 함수
-소프트맥스 함수
오차역전파법
-오차역전파법이란?
-중간층과 출력층 사이의 가중치와 편향 학습
-입력층과 중간층 사이의 가중치와 편향 학습
-비선형 함수 근사
학습 최적화
-일정 비율 감소
-모멘텀
-AdaGrad
-RMSProp
-Adam
-드롭아웃
-배치 정규화
-그 밖의 방법
배치 경사하강법, 확률적 경사하강법, 미니배치 경사하강법
-배치 경사하강법
-확률적 경사하강법
-미니 배치 경사하강법
-에폭
케라스를 이용한 신경망 구현
합성곱신경망
-합성곱신경망이란?
-합성곱층
-채널
-스트라이드
-패딩
-풀링층
-플래튼층
케라스를 이용한 합성곱신경망 구현
-손글씨 데이터
-손글씨 데이터 전처리
-합성곱신경망 구축
-학습과 결과 확인

▣ 04장- 인공지능 만들기- 틱택토 게임
틱택토 준비
인간 플레이어
랜덤 플레이어
게임 진행 함수
몬테카를로 플레이어
Q-learning 플레이어
DQN 플레이어

▣ 부록A- 참고 자료
A.1 미분
A.2 편미분
A.3 연쇄법칙

관련이미지

저자소개

생년월일 -
출생지 -
출간도서 0종
판매수 0권

소니 반도체에서 데이터 분석을 활용한 알고리즘 및 시스템 개발 업무를 했다. 현재 삼성전자에서 관련 데이터 분석 업무를 하고 있으며 사원을 대상으로 통계 알고리즘 강의를 진행했다. 일본 규슈대학교에서 인공지능의 한 분야인 Reinforcement Learning 알고리즘 개발로 박사학위를 받았으며 관심 분야는 Reinforcement Learning, Neural Network, Genetic Algorithm 등 Machine Learning Algorithm을 활용한 시스템 개발이다.

이 상품의 시리즈

(총 69권 / 현재구매 가능도서 53권)

펼쳐보기

컴퓨터/인터넷 분야에서 많은 회원이 구매한 책

    리뷰

    0.0 (총 0건)

    구매 후 리뷰 작성 시, 북피니언 지수 최대 600점

    리뷰쓰기

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    0.0

    교환/환불

    교환/환불 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

    교환/환불 가능 기간

    고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

    교환/환불 비용

    고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

    교환/환불 불가사유

    반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
    배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

    소비자 피해보상

    소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
    교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

    기타

    도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

    배송안내

    • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

    • 배송비

    도서(중고도서 포함) 구매

    2,000원 (1만원이상 구매 시 무료배송)

    음반/DVD/잡지/만화 구매

    2,000원 (2만원이상 구매 시 무료배송)

    도서와 음반/DVD/잡지/만화/
    중고직배송상품을 함께 구매

    2,000원 (1만원이상 구매 시 무료배송)

    업체직접배송상품 구매

    업체별 상이한 배송비 적용