간편결제, 신용카드 청구할인
카카오페이 3,000원
(카카오페이 결제 시 최대할인 3천원 / 5만원 이상 결제, 기간 중 1회)
PAYCO(페이코) 최대 5,000원 할인
(페이코 신규 회원 및 90일 휴면 회원 한정)
북피니언 롯데카드 30% (18,900원)
(최대할인 3만원 / 3만원 이상 결제)
EBS 롯데카드 20% (21,600원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 NEW 우리V카드 10% (24,300원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 현대카드 7% (25,110원)
(최대할인 3만원 / 3만원 이상 결제)
Close

자연어 처리 쿡북 with 파이썬 : 파이썬으로 NLP를 구현하는 60여 가지 레시피

원제 : Natural Language Processing with Python Cookbook: Over 60 recipes to implement text analytics solutions using deep learning principles
소득공제

2013년 9월 9일 이후 누적수치입니다.

판매지수 1,432
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

30,000원

  • 27,000 (10%할인)

    1,500P (5%적립)

할인혜택
적립혜택
  • I-Point 적립은 출고완료 후 14일 이내 마이페이지에서 적립받기한 경우만 적립됩니다.
  • 추가혜택
    배송정보
    주문수량
    감소 증가
    • 이벤트/기획전

    • 연관도서(28)

    • 사은품(3)

    책소개

    최고의 플랫폼인 파이썬과 자연어 툴킷(NLTK)을 이용해 자연어 처리(NLP)를 수행하는 다양한 방법을 알려주는 독창적인 레시피가 담긴 책이다. 자연어 이해(NLU), 자연어 처리, 구문 분석 등 다양한 주제를 포함해 자연어를 다루는 데 사용할 수 있는 60여 개의 레시피를 접할 수 있다. 자연어 처리에 입문하면서 궁금한 부분이 생기면 레시피를 찾아보듯이 필요한 부분을 꺼내볼 수 있게 구성했다. 실용적인 감정 분석부터 최신 딥러닝 기술의 적용 방법까지 배울 수 있다. 이 책을 마치면 파이썬으로 NLP를 구현하는 데 필요한 모든 지식을 얻게 될 것이다.

    출판사 서평

    ★ 이 책에서 다루는 내용 ★

    ■ NLTK에서 사용할 수 있는 다양한 말뭉치 탐색과 워드넷 말뭉치 사용법
    ■ HTML, RSS, PDF, 워드 문서 등과 같은 원시 텍스트 관리와 처리
    ■ 토큰화, 형태소 분석, 철자 검사기 등과 같은 기술을 사용해 원시 텍스트를 전처리하는 방법과 정규표현식을 사용한 구현
    ■ 정규표현식을 사용한 텍스트 분석의 패턴 일치 기본 사항
    ■ 품사 태거와 문법을 사용해 직접 만드는 방법
    ■ 개체명(NE) 추출 방법과 RD, 시프트 감소, 차트 파서 등의 파서
    ■ LSTM을 사용한 셰익스피어 소설에서의 텍스트 생성
    ■ BABI 데이터셋과 LSTM을 사용한 에피소드 모델링
    ■ 딥러닝을 통해 생성(generative) 방식으로 개발하는 챗봇

    ★ 이 책의 대상 독자 ★

    NLP를 사용해 고급 텍스트 분석을 구현하고자 기존 기술을 업그레이드하려는 데이터 과학자, 데이터 분석가를 대상으로 한다. 자연어 처리에 대한 몇 가지 기본 지식이 있으면 좋다.

    ★ 이 책의 구성 ★

    1장, '말뭉치와 워드넷'에서는 NLTK에서 기본 제공하는 말뭉치와 빈도 분포에 접근하는 방법을 소개한다. 워드넷이 무엇인지 알아보고 그 기능과 사용법을 탐구할 것이다.
    2장, '원시 텍스트, 소싱, 정규화'에서는 다양한 형식의 데이터 소스에서 텍스트를 추출하는 방법을 보여준다. 웹상에서 원시 텍스트를 추출하는 방법도 배우게 된다. 이러한 이질적인 소스로부터 원시 텍스트를 정규화하고, 텍스트를 말뭉치로 조직화할 것이다.
    3장, '전처리'에서는 토큰화, 스테밍, 원형 복원, 편집 거리와 같이 몇 가지 중요한 사전 처리 단계를 소개한다.
    4장, '정규표현식'에서는 가장 기본적이고 간단하지만 가장 중요하면서 강력한 도구 중 하나를 다룬다. 텍스트 분석을 수행하는 방법으로 패턴 매칭의 개념을 배우게 되며, 이를 위해 정규표현식보다 더 좋은 도구는 없다.
    5장, '품사 태깅과 문법'에서는 품사 태깅은 구문 분석의 기초를 형성하며 문법은 품사 태그 및 청크를 사용해 형성되고 변형될 수 있다. 자체 품사 태거 및 문법을 사용하고 또 작성하는 법을 배운다.
    6장, '청킹, 문장 구문 분석, 의존성'에서는 기본 제공 청커를 사용하는 방법을 배우고 자체 청커(의존성 파서)를 학습/작성하는 데 도움을 준다. 훈련된 모델을 평가하는 방법을 배우게 된다.
    7장, '정보 추출과 텍스트 분류'에서는 개체명 인식에 대해 자세히 알려준다. 내장된 개체명을 사용하거나 딕셔너리를 사용해 개체명을 생성할 것이다. 기본 제공되는 텍스트 분류 알고리즘과 애플리케이션 주변의 간단한 레시피를 사용하는 방법을 배워보자.
    8장, '고급 NLP 레시피'에서는 지금까지 모든 수업을 결합하고 실제 응용 문제에 쉽게 적용할 수 있는 응용 가능한 레시피를 만드는 방법에 관한 것이다. 텍스트 유사도, 요약, 감정 분석, 표현 합성, 대용어 처리 등과 같은 레시피를 작성한다.
    9장, 'NLP에서의 딥러닝 적용'에서는 이메일 분류, CNN 및 LSTM의 감정 분류, 마지막으로 저차원 공간에서의 고차원 단어 시각화와 같은 NLP 문제의 애플리케이션을 사용하는 딥러닝에 필요한 다양한 기본적인 사항을 전달한다.
    10장, 'NLP 분야에서 딥러닝의 고급 응용'에서는 딥러닝을 이용한 최첨단 문제 해결 방법을 설명한다. 단편적인 사건들로 이뤄진 데이터에 대한 답변, 다음 최상의 단어를 예측하기 위한 언어 모델링 그리고 생성 기법을 사용하는 챗봇(chatbot) 개발을 포함한다.

    ★ 옮긴이의 말 ★

    이 책의 원제는 『Natural Language Processing with Python Cookbook』이다. 제목에서 알 수 있듯이 파이썬보다는 자연어 처리에 초점 맞춰져, 파이썬은 도구로 사용하는 셈이다. 파이썬은 다양한 라이브러리가 잘 갖춰져 있어 텐서플로(TensorFlow)를 비롯한 '딥러닝'용 언어로 주목받는 것은 물론, 프로그래밍 초보자나 학생들의 코딩 입문용에 이르기까지 전천후로 쓰이는 언어다. 바꿔 말해, 자연어 처리를 배우기에 적합한 언어인 것이다. 파이썬 언어의 문법을 모르더라도 책에 나오는 레시피를 차근차근 따라 해보며 동작 원리를 파악할 수 있지만, 구문(syntax)을 세세하게 설명하지 않으므로 파이썬의 기본적인 이해는 필요하다. 만약 파이썬을 처음 접한다면 입문서를 읽어보거나 간단한 강의를 먼저 경험해볼 것을 추천한다.
    이 책은 짤막한 레시피 형태의 구성으로 언제든 필요한 부분을 펼쳐볼 수 있게 돼 있다. 다만 이전 레시피가 다음 레시피에 활용되는 경우가 많으니 처음 한 번은 순서대로 읽어보고, 이후 코드 실습과 함께 원하는 부분을 다시 찾아볼 것을 권한다. 이 책에서는 자연어 처리와 관련된 전반적인 영역에 걸쳐 부품이자 재료들을 제공하고 있으니, 두 가지 혹은 그 이상의 레시피를 다양한 방식으로 조합한다면 다채로운 애플리케이션을 만들어볼 수 있을 것이다.
    번역과 관련해 한마디 덧붙인다면 항상 용어의 선택이 가장 어렵다. 실무 현장에서는 갈수록 대부분의 IT 용어와 프로그래밍 용어가 원어(영어) 그대로 쓰이는 듯하다. 딥러닝을 심층 학습이라고 부르지 않는 것이 한 예다. 그렇지만 NLP는 '자연 언어 처리'라는 고유 영역이 있어 이 분야에서 통용되는 우리말이 있는 경우는 우리말로 옮겼다. 가령 'POSpart of speech'는 품사로 통일했고 'corpus', 'copora'는 '코퍼스'가 아니라 '말뭉치'로 적었다. 단, '브라운 코퍼스'와 같이 고유명사처럼 쓰이는 단어만 일부 예외를 뒀음을 참고하길 바란다.

    목차

    1장. 말뭉치와 워드넷
    __소개
    __내장 말뭉치 액세스
    __외부 말뭉치 다운로드, 로드하고 액세스하기
    __브라운 코퍼스에서 세 가지 장르의 wh 단어 모두 세기
    __웹 및 채팅 텍스트 자료 파일 중 하나에서 빈도 분포 작업 탐색
    __모호한 단어를 가지고 워드넷을 사용해 모든 의미 탐구
    __두 개의 구별되는 동의어 집합을 선택하고 워드넷을 사용해 상위어와 하위어 개념 탐색
    __워드넷으로 명사, 동사, 형용사, 부사의 다의어 평균 계산

    2장. 처리 전 텍스트, 소싱, 정규화

    __소개
    __문자열 연산의 중요성
    __문자열 연산 심화
    __파이썬에서 PDF 파일 읽기
    __파이썬에서 워드 문서 읽기
    __PDF, DOCX, 일반 텍스트 파일을 가져와 사용자 정의 말뭉치 생성
    __RSS 피드에서 내용 읽기
    __BeautifulSoup를 사용한 HTML 파싱

    3장. 전처리

    __소개
    __토큰화-NLTK 내장 토크나이저 사용법
    __스테밍-NLTK 내장 스테머 사용법
    __원형 복원-NLTK WordnetLemmatizer 사용법
    __불용어-불용어 말뭉치 사용법과 불용어가 만들어내는 차이점 확인
    __편집 거리-두 문자열 간의 편집 거리를 찾기 위한 알고리즘 작성
    __두 단문 처리와 둘 사이의 공통 어휘 추출

    4장. 정규표현식

    __소개
    __정규표현식-*, +, ? 사용법
    __정규표현식-$와 ^, 단어의 시작과 끝이 아닌 단어를 사용하는 방법
    __여러 개의 리터럴 문자열과 하위 문자열 검색
    __날짜 정규표현식과 문자 집합 또는 문자 범위 집합 만들기
    __문장에서 모든 다섯 글자 단어를 찾고 약어 만들기
    __자체 정규식 토크나이저 작성법
    __자체 정규식 스테머 작성법

    5장. 품사 태깅과 문법

    __소개
    __내장 태거 탐구
    __자체 태거 작성
    __자체 태거 학습
    __자체 문법 작성 학습
    __확률적 문맥 무관 문법-CFG 작성
    __재귀 CFG 작성

    6장. 청킹, 문장 구문 분석, 의존성

    __소개
    __내장 청커 사용
    __간단한 청커 작성
    __청커 학습
    __재귀 하향 구문 분석
    __시프트 변환 구문 분석
    __의존 문법과 투사 의존성 구문 분석
    __차트 구문 분석

    7장. 정보 추출과 텍스트 분류

    __소개
    __내장 개체명 인식 기능 사용
    __딕셔너리 생성, 반전, 사용
    __피처셋 선택
    __분류기를 사용한 문장 분할
    __문서 분류
    __문맥 기반 품사 태거 작성

    8장. 고급 NLP 레시피

    __소개
    __NLP 파이프라인 생성
    __텍스트 유사도 문제 해결
    __주제 식별
    __텍스트 요약
    __대용어 해결
    __단어 의미 명확화
    __감정 분석 수행
    __고급 감정 분석 탐색
    __대화형 비서 또는 챗봇 만들기

    9장. NLP의 딥러닝 적용

    __소개
    __TF-IDF 생성 후 심층 신경망을 이용한 이메일 분류
    __합성곱망 CNN 1D를 이용한 IMDB 감정 분류
    __양방향 LSTM을 이용한 IMDB 감정 분류
    __신경 단어 벡터 시각화를 사용해 고차원의 단어를 2차원으로 시각화

    10장. NLP 분야에서 딥러닝의 고급 응용

    __소개
    __LSTM을 사용해 셰익스피어의 저서에서 고급 자동 텍스트 생성
    __메모리 네트워크를 사용해 에피소드 데이터에 대한 질의 응답
    __순환 신경망을 사용해 다음 단어를 예측하는 언어 모델링-LSTM
    __딥러닝 순환망을 사용하는 생성 챗봇 개발-LSTM

    본문중에서

    자연어 처리에 관심을 가지고 이 책을 선택해 주신 독자분들께 감사 인사를 전한다. 이 책은 NLP 솔루션을 기초부터 이해하고 구현하기 위한 실용적인 관점을 제공한다.
    자연어 툴킷(NLTK)에 내장된 데이터 소스에 접근하고 자신의 소스를 만드는 것으로 시작하는 여정을 도와줄 것이다. 그런 다음 텍스트 정규화(normalization), 전처리(preprocessing), 품사 태깅(POS tagging), 구문 분석(parsing) 등 복잡한 NLP 솔루션을 작성하게 된다.
    이 책에서는 자연어 처리에서의 딥러닝 적용에 필요한 다양한 기본 사항이자, 최첨단 기술을 다룬다. 케라스(Keras) 소프트웨어를 사용해 딥러닝의 응용에 대해 설명할 것이다.
    이 책은 다음과 같은 목표로 썼다.
    1. 다양한 기본 지식을 자세하게 설명해 초보자가 작업 속도를 높일 수 있도록 설계했다. 그리고 선택한 데이터에 알고리즘을 적용할 때, 좀 더 명확하게 이해할 수 있도록 다양한 개념을 새롭고 쉽게 설명할 것이다.
    2. NLP의 딥러닝 애플리케이션에 대한 새로운 트렌드를 소개한다.
    (/ '지은이의 말' 중에서)

    이 책의 원제는 『Natural Language Processing with Python Cookbook』이다. 제목에서 알 수 있듯이 파이썬보다는 자연어 처리에 초점 맞춰져, 파이썬은 도구로 사용하는 셈이다. 파이썬은 다양한 라이브러리가 잘 갖춰져 있어 텐서플로(TensorFlow)를 비롯한 '딥러닝'용 언어로 주목받는 것은 물론, 프로그래밍 초보자나 학생들의 코딩 입문용에 이르기까지 전천후로 쓰이는 언어다. 바꿔 말해, 자연어 처리를 배우기에 적합한 언어인 것이다. 파이썬 언어의 문법을 모르더라도 책에 나오는 레시피를 차근차근 따라 해보며 동작 원리를 파악할 수 있지만, 구문(syntax)을 세세하게 설명하지 않으므로 파이썬의 기본적인 이해는 필요하다. 만약 파이썬을 처음 접한다면 입문서를 읽어보거나 간단한 강의를 먼저 경험해볼 것을 추천한다.
    이 책은 짤막한 레시피 형태의 구성으로 언제든 필요한 부분을 펼쳐볼 수 있게 돼 있다. 다만 이전 레시피가 다음 레시피에 활용되는 경우가 많으니 처음 한 번은 순서대로 읽어보고, 이후 코드 실습과 함께 원하는 부분을 다시 찾아볼 것을 권한다. 이 책에서는 자연어 처리와 관련된 전반적인 영역에 걸쳐 부품이자 재료들을 제공하고 있으니, 두 가지 혹은 그 이상의 레시피를 다양한 방식으로 조합한다면 다채로운 애플리케이션을 만들어볼 수 있을 것이다.
    번역과 관련해 한마디 덧붙인다면 항상 용어의 선택이 가장 어렵다. 실무 현장에서는 갈수록 대부분의 IT 용어와 프로그래밍 용어가 원어(영어) 그대로 쓰이는 듯하다. 딥러닝을 심층 학습이라고 부르지 않는 것이 한 예다. 그렇지만 NLP는 '자연 언어 처리'라는 고유 영역이 있어 이 분야에서 통용되는 우리말이 있는 경우는 우리말로 옮겼다. 가령 'POSpart of speech'는 품사로 통일했고 'corpus', 'copora'는 '코퍼스'가 아니라 '말뭉치'로 적었다. 단, '브라운 코퍼스'와 같이 고유명사처럼 쓰이는 단어만 일부 예외를 뒀다.
    예제 코드는 모두 파이썬 노트북으로 만들어 일일이 타이핑하지 않아도 실습하고 결과를 확인해볼 수 있도록 했다. 책과 코드에 관한 문의나 의견은 옮긴이의 홈페이지(http://llun.com)를 통해 주길 바란다
    (/ '옮긴이의 말' 중에서)

    저자소개

    크리슈나 바브사 [저] 신작알림 SMS신청 작가DB보기
    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    서비스업, 은행업, 헬스케어 등과 같은 다양한 산업 영역에서 10년간 근무하며 자연어 처리, 소셜미디어 분석, 텍스트 마이닝 작업을 했다. Stanford CoreNLP, IBM의 SystemText와 BigInsights, GATE, NLTK와 같은 다양한 NLP 라이브러리에서 텍스트 분석과 관련된 산업 문제를 해결하기 위해 연구했다. 또한 유명 TV 프로그램과 인기 있는 리테일 브랜드와 제품에 대한 소셜미디어 반응을 분석하는 일을 하고 있다. 2010년 NAACL에서 감정 분석 기술에 관한 논문을 발표했다. 최근에 NLP 파이프라인/툴 세트를 만들어 대중에게 오픈소스로 공개했다. 학문과 기술 외에도

    펼쳐보기
    나레쉬 쿠마르(Naresh Kumar) [저] 신작알림 SMS신청 작가DB보기
    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    「포춘(Fortune)」이 선정한 5백대 기업에서 대규모 인터넷 애플리케이션을 설계, 구현하고 운용하는 데 수십 년 이상의 전문 경험을 보유하고 있다. 전자상거래, 웹 호스팅, 의료, 빅데이터 및 분석, 데이터 스트리밍, 광고, 데이터베이스 등의 분야에서 실무 경험을 쌓은 풀스택 아키텍트다. 오픈소스를 신봉하며 적극적으로 기여한다. 리눅스 시스템 내부에서부터 프론트엔드에 이르기까지 최신식의 기술을 알고자 노력한다. 인도 라자스탄주(Rajasthan)에 있는 비츠 필라니(BITS-Pilani)대학에서 컴퓨터과학과 경제학을 복수 전공했다.

    프라탑 단게티(Pratap Dangeti) [저] 신작알림 SMS신청 작가DB보기
    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    인도 방갈로르의 리서치 및 혁신 연구소인 TCS에서 구조화, 이미지, 텍스트 데이터를 위한 머신 러닝과 딥러닝 솔루션을 개발한다. 해석학 및 데이터 과학 분야 양쪽에서 많은 경험을 쌓았다. 산업공학과 운영 연구 프로그램으로 IIT 봄베이에서 석사 학위를 받았다. 인공지능 애호가이자 여가에는 미래의 기술과 혁신적인 방법론에 관해 읽기를 좋아한다. 또 『머신 러닝과 통계』(에이콘, 2018)를 저술하기도 했다.

    생년월일 -
    출생지 -
    출간도서 0종
    판매수 0권

    인포메이션 아키텍처, 데이터 시각화, 콘텐츠 큐레이션 등 다방면에 관심이 많다. 장르를 불문하고, 글을 짓는 작가들 그리고 어떤 언어로 된 글을 다른 언어의 글로 옮기는 데 힘을 쏟고 있는 모든 이에게 경의를 표한다.

    이 상품의 시리즈

    데이터 과학 시리즈(총 29권 / 현재구매 가능도서 29권)

    펼쳐보기

    이 책과 내용이 비슷한 책 ? 내용 유사도란? 이 도서가 가진 내용을 분석하여 기준 도서와 얼마나 많이 유사한 콘텐츠를 많이 가지고 있는가에 대한 비율입니다.

      리뷰

      0.0 (총 0건)

      기대평

      작성시 유의사항

      평점
      0/200자
      등록하기

      기대평

      10.0

      교환/환불

      교환/환불 방법

      ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

      교환/환불 가능 기간

      고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

      교환/환불 비용

      고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

      교환/환불 불가사유

      반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
      배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

      소비자 피해보상

      소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
      교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

      기타

      도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

      배송안내

      • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

      • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

      • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

      • 배송비

      도서(중고도서 포함) 구매

      2,000원 (1만원이상 구매 시 무료배송)

      음반/DVD/잡지/만화 구매

      2,000원 (2만원이상 구매 시 무료배송)

      도서와 음반/DVD/잡지/만화/
      중고직배송상품을 함께 구매

      2,000원 (1만원이상 구매 시 무료배송)

      업체직접배송상품 구매

      업체별 상이한 배송비 적용