간편결제, 신용카드 청구할인
네이버페이 1%
(네이버페이 결제 시 적립)
NH(올원페이)카드 12% (27,720원)
(3만원 이상 결제/최대 1만원 할인)
북피니언 롯데카드 30% (22,050원)
(최대할인 3만원 / 3만원 이상 결제)
하나SK 북&카드 30% (22,050원)
(최대할인 3만원 / 3만원 이상 결제)
EBS 롯데카드 20% (25,200원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 NEW 우리V카드 10% (28,350원)
(최대할인 3만원 / 3만원 이상 결제)
인터파크 현대카드 7% (29,300원)
(최대할인 3만원 / 3만원 이상 결제)
Close

파이썬 자연어 처리의 이론과 실제 : 효율적인 자연어 처리를 위한 머신 러닝과 딥러닝 구현하기

원제 : Python Natural Language Processing: Advanced machine learning and deep learning techniques for natural language processing

2013년 9월 9일 이후 누적수치입니다.

판매지수 989
?
판매지수란?
사이트의 판매량에 기반하여 판매량 추이를 반영한 인터파크 도서에서의 독립적인 판매 지수입니다. 현재 가장 잘 팔리는 상품에 가중치를 두었기 때문에 실제 누적 판매량과는 다소 차이가 있을 수 있습니다. 판매량 외에도 다양한 가중치로 구성되어 최근의 이슈도서 확인시 유용할 수 있습니다. 해당 지수는 매일 갱신됩니다.
Close
공유하기
정가

35,000원

  • 31,500 (10%할인)

    1,750P (5%적립)

배송정보
주문수량
감소 증가
  • 이벤트/기획전

  • 연관도서(38)

  • 사은품(2)

책소개

자연어 처리는 복잡한 영역이라 아주 많은 자료가 존재한다. 학습자가 자연어 처리를 익히려면 여기저기 발품을 팔아야 하는 실정이다. 저자는 이와 같은 현실을 깨닫고 한 권의 책으로 파이썬 자연어 처리의 전반을 이해할 수 있게 집필했다. 이 책은 자연어 처리 기초부터 머신 러닝, 딥러닝에 이르기까지 안내서이자 참고서의 역할을 톡톡히 해낼 것이다.

출판사 서평

[이 책에서 다루는 내용]

- NLP 애플리케이션을 개발하는데 사용되는 파이썬 프로그래밍 패러다임
- 코퍼스 분석과 다양한 타입의 데이터 속성 이해
- NLTK, Polyglot, SpaCy, 스탠포드 CoreNLP 등의 파이썬 라이브러리를 사용한 NLP 학습
- 피처 엔지니어링의 일부로 피처 추출과 피처 선택
- 딥러닝에서 벡터화의 장점
- 규칙 기반 시스템의 아키텍처
- NLP 문제에 대한 지도 및 비지도 머신 러닝 알고리즘 최적화와 튜닝
- 자연어 처리와 자연어 생성 문제에 대한 심층 학습 기술

[이 책의 대상 독자]

NLP를 구현해서 더 스마트한 애플리케이션을 만들려는 파이썬 개발자를 위한 책이다.

[이 책의 구성]

1장, '소개'에서는 NLP와 NLP 분야에 관련된 여러 갈래를 소개한다. NLP 애플리케이션 빌드와 NLTK 설치를 논의하는 다양한 단계를 알아본다.
2장, '코퍼스와 데이터세트의 실제 이해'에서는 코퍼스 분석의 모든 측면을 보여준다. 코퍼스에 존재하는 다양한 타입의 코퍼스와 데이터 속성을 볼 수 있다. CSV, JSON, XML, LibSVM 등과 같은 각 코퍼스 형식을 다루며, 웹 스크레이핑 예제도 살펴본다.
3장, '문장 구조의 이해'에서는 언어학인 자연어의 가장 기본적인 측면을 이해해본다. 어휘 분석, 구문 분석, 의미 분석, 모호성 처리 등의 개념을 설명한다. 모든 개념을 실질적으로 이해하는 데는 NLTK를 사용한다.
4장, '전처리'에서는 다양한 타입의 전처리 기술과 이를 사용자 정의할 수 있는 방법을 알아본다. 데이터 준비, 데이터 처리, 데이터 변환 같은 전처리 단계를 살펴본다. 이외에도 전처리의 실제적인 측면을 이해한다.
5장, '피처 엔지니어링과 NLP 알고리즘'에서는 NLP 애플리케이션의 핵심 부분을 본다. NLP 애플리케이션을 개발할 때 사용하는 머신 러닝 알고리즘에 대한 입력 생성을 위해 서로 다른 알고리즘과 도구가 어떻게 사용되는지 살펴본다. 피처 엔지니어링에서 사용되는 통계적 개념을 이해하게 되며, 도구와 알고리즘의 사용자 정의로 넘어갈 것이다.
6장, '고급 피처 엔지니어링과 NLP 알고리즘'에서는 의미론적 문제를 다루는데 사용되는 NLP의 최신 개념을 이해한다. [왕좌의 게임(Game of Thrones)] 데이터 세트에서 벡터를 생성해 word2vec, doc2vec, GloVe 등을 알아볼 수 있을 뿐 아니라 word2vec의 실제 구현도 볼 수 있다.
7장, 'NLP를 위한 규칙 기반 시스템'에서는 규칙 기반 시스템을 구축하는 방법과 NLP용으로 동일한 시스템을 개발하는 동안 명심해야 할 모든 측면을 자세히 설명한다. 규칙 제작 과정을 보며 규칙도 직접 코딩해본다. 또한 템플릿 기반의 챗봇(chatbot)을 어떻게 개발하는지 살펴본다.
8장, 'NLP 문제에 대한 머신 러닝'에서는 머신 러닝 기술의 새로운 면을 알아본다. NLP 애플리케이션을 개발하는데 사용되는 다양한 알고리즘을 볼 수 있다. 또한 머신 러닝을 사용해 멋진 NLP 애플리케이션도 구현해본다.
9장, 'NLU와 NLG 문제에 대한 딥러닝'에서는 인공 지능의 다양한 측면을 소개한다. 인공 신경망(ANN)의 기본 개념과 자신만의 ANN을 만드는 방법을 살펴본다. 하드코어 딥러닝을 이해하고 딥러닝의 수학적 측면을 개발하며, 자연어 이해(NLU)와 자연어 생성(NLG)에 딥러닝이 얼마나 사용되는지 확인한다. 여기서도 멋진 실전 예제를 기대할 수 있다.
부록 A, '고급 도구'에서는 아파치 하둡, 아파치 스파크, 아파치 플링크 같은 다양한 프레임워크를 간략하게 소개한다.
부록 B, 'NLP 기술을 향상시키는 방법'에서는 NLP 기술을 최신 상태로 유지하는 방법을 설명하며, 지속적인 학습이 새로운 NLP 기술을 습득하는데 얼마나 도움이 되는지 의견을 제시한다.
부록 C, '설치 안내'에서는 필요한 설치에 대한 지시사항을 볼 수 있다.

목차

1장. 소개
-자연어 처리에 대한 이해
-기본 애플리케이션 이해
-공생의 이점: NLP와 파이썬
-NLTK 환경 설정
-독자를 위한 팁

2장. 코퍼스와 데이터세트의 실제 이해
-코퍼스란 무엇인가?
-왜 코퍼스가 필요한가?
-코퍼스 분석 이해
-데이터 속성 타입 이해
-코포라의 여러 파일 형식 알아보기
-무료 코포라 접근용 자원
-NLP 애플리케이션용 데이터세트 준비
-웹 스크레이핑
-요약

3장. 문장 구조의 이해
-NLP의 컴포넌트 이해
-자연어 이해
-문맥 자유 문법 정의
-형태학적 분석
-구문 분석
-의미 분석
-모호성 처리
-담화 통합
-화용 분석
-요약

4장. 전처리
-코퍼스-원시 텍스트 처리
-코퍼스-원시 문장 처리
-기본 전처리
-실제적이고 사용자 정의된 전처리
-요약

5장. 피처 엔지니어링과 NLP 알고리즘
-피처 엔지니어링 이해
-NLP의 기본 피처
-NLP에 대한 기본 통계 피처
-피처 엔지니어링의 이점
-피처 엔지니어링의 과제
-요약

6장. 고급 피처 엔지니어링과 NLP 알고리즘
-워드 임베딩에 대한 기억
-word2vec의 기본 사항 이해
-word2vec 모델을 블랙박스에서 화이트박스로 변환하기
-word2vec 모델의 컴포넌트 이해하기
-word2vec 모델의 로직 이해하기
-word2vec 모델의 알고리즘 기술과 수학 이해하기
-word2vec에 관련된 사실
-word2vec 애플리케이션
-간단한 예제 구현
-word2vec의 이점
-word2vec의 문제
-실제 애플리케이션에서 word2vec은 어떻게 사용되는가?
-word2vec는 언제 사용해야 하는가?
-흥미로운 모델 개발하기
-word2vec 개념의 확장
-딥러닝에서 벡터화의 중요성
-요약

7장. NLP를 위한 규칙 기반 시스템
-규칙 기반 시스템에 대한 이해
-규칙 기반 시스템 장착의 목적
-RB 시스템의 아키텍처
-RB 시스템 개발 라이프 사이클에 대한 이해
-애플리케이션
-RB 시스템을 사용해 NLP 애플리케이션 개발
-규칙 기반 접근법과 다른 접근법 비교
-규칙 기반 시스템의 장점
-규칙 기반 시스템의 단점
-규칙 기반 시스템에 대한 과제
-단어 의미의 모호성 기본에 대한 이해
-규칙 기반 시스템의 최근 동향에 대한 논의
-요약

8장. NLP 문제에 대한 머신 러닝
-머신 러닝의 기본에 대한 이해
-NLP 애플리케이션 개발 단계
-ML 알고리즘과 기타 개념 이해
-NLP 애플리케이션을 위한 하이브리드 접근법
-요약

9장. NLU과 NLG 문제에 대한 딥러닝
-인공지능 개요
-NLU와 NLG 비교
-딥러닝에 대한 간략한 개요
-신경망의 기본 지식
-ANN 구현
-딥러닝과 심층 신경망
-딥러닝 기술과 NLG
-경사 하강법 기반의 최적화
-인공지능 대 인간지능
-요약

부록 A. 고급 도구
-저장소 프레임워크로서의 아파치 하둡
-프로세싱 프레임워크로서의 아파치 스파크
-실시간 프로세싱 프레임워크로서의 아파치 플링크
-파이썬의 시각화 라이브러리
-요약

부록 B. NLP 기술을 향상시키는 방법
-NLP로 새로운 경력 쌓기
-치트 시트
-자신의 영역 선택
-성공을 달성하기 위한 일의 민첩한 방식
-NLP와 데이터 과학에 대해 유용한 블로그
-공개 데이터세트 얻기
-데이터 과학에 필요한 수학
-요약

부록 C. 설치 안내
-파이썬, pip, NLTK 설치
-PyCharm IDE 설치하기
-종속성 설치
-프레임 설치 가이드
-질문
-요약

본문중에서

제목인 [Python Natural Language Processing]은 이 책에 대해 여러 가지를 생각하게 만든다. 여러분은 독자로서 자연어 처리(NLP: natural language processing)의 모든 측면을 처음부터 배울 수 있는 기회를 얻게 된다. 나는 이 책에서 NLP 개념을 매우 간단한 언어로 설명했으며 이 분야를 잘 이해할 수 있게 실용 예제를 소개한다. 예제를 구현하다 보면 NLP 기술을 향상시킬 수 있다. 재미있을 것 같지 않은가?
이제 NLP 분야에 대해 내가 친구나 동료로부터 받은 가장 일반적인 질문에 답해보겠다. 이 질문들은 내가 이 책을 쓰는 데 정말로 큰 영감을 주었다. 내게 있어서는 모든 독자에게 이 책의 집필 이유를 알리는 것이 아주 중요하다. 그렇다면 시작해보자!
일단 독자에게 중요한 질문에 답하고 싶다. 몇 가지 질문부터 답하겠다. 내가 보통 묻는 첫 번째 질문은 "NLP란 무엇인가?"이다. 두 번째 질문은 "파이썬이 주로 NLP 애플리케이션을 개발하는데 사용되는 이유는 무엇인가?"이다. 마지막으로 가장 중요한 질문은 "NLP를 배우기 위해 사용할 수 있는 자원은 무엇인가?"이다. 이제 답변을 알아보자.
첫 번째 질문에 대한 대답으로, NLP는 인간처럼 말하고 쓰고 읽거나 이해하는 언어다. 따라서 자연어는 의사 소통 수단이다. 전산과학 알고리즘, 수학 개념, 통계 기법을 사용해 우리는 머신도 인간이 하듯이 언어를 이해할 수 있게 언어를 처리하려고 한다. 이를 NLP라고 한다.
이제 두 번째 질문, "사람들이 주로 NLP 애플리케이션을 개발하는데 파이썬을 사용하는 이유는 무엇일까?"에 대한 대답을 해보겠다. 여러분과 나누고 싶은 사실이기도 한데, 매우 간단하고 직설적으로 말하면 파이썬에는 NLP 애플리케이션을 개발할 때 쉽게 사용할 수 있는 라이브러리가 많다. 또한 여러분이 C, 또는 C ++ 코딩 경험이 있다면 메모리 누수를 걱정할 필요가 없다. 파이썬 인터프리터가 이를 처리하기 때문에 주요 코딩 부분에만 집중할 수 있다. 게다가 파이썬은 코더 친화적(coder-friendly)인 언어다. 다른 객체 지향 언어에 비해 몇 행의 코드만 작성하면 훨씬 많은 작업을 수행할 수 있다. 따라서 이러한 모든 사실로 인해 사람들은 파이썬을 사용해 신속한 프로토타입 제작을 위한 NLP 및 기타 데이터 과학 관련 애플리케이션을 개발할 수 있다.
마지막 질문은 내게 중요한데 그 이유는 내 친구에게 위의 답변을 설명하곤 했고, 그들은 여러 사항을 들은 후에 NLP를 배우고 싶다면서 이용할 수 있는 자원은 무엇인지 물었기 때문이다. 예전에는 책, 블로그, 유튜브 동영상, Udacity, Coursera 같은 교육 플랫폼 등을 추천했지만 며칠 후 도서, 블로그, 그 외 형태의 하나로 된 자원이 있는지 물었다. 불행히도 내 대답은 "아니오."였다. 나는 그때 모든 자원을 일일이 이용하는 것이 어렵다고 느꼈으며, 결국 이 책을 집필하게 된 것이다.
그래서 나는 이 책에서 모든 사람에게 유용한 NLP의 필수 부분을 모두 다루려고 노력했다. 좋은 소식은 파이썬을 사용한 실용적인 예제를 담았기 때문에 독자는 이론적으로나 실제적으로 모든 개념을 이해할 수 있다는 것이다. 나는 독자가 쉽게 알 수 있게 읽기, 이해, 코딩이라는 3개의 주요 과정에 따라 이 책을 썼다.
('지은이의 말' 중에서)

로봇의 경우에는 인간과 의사소통을 하기 위해 자연어 처리가 필수다. 이제 컴퓨터 관련 분야에 종사하거나 관심 있는 사람들이 자연어 처리를 알아야만 하는 상황이 된 것이다.
하지만 자연어 처리는 복잡한 영역이라 아주 많은 자료가 존재하며, 학습자가 자연어 처리를 익히려면 여기저기 발품을 팔아야 하는 실정이다. 저자는 그런 현실을 깨닫고 한 권의 책으로 파이썬 자연어 처리의 전반을 이해할 수 있도록 집필했다.
한정된 지면에 많은 지식을 넣기 위해 저자는 링크를 활용했다. 안내서로의 역할도 충분해서 독자가 해당 링크를 방문해 학습한다면 이 책 한 권으로 여러 권 분량의 지식을 쌓는 성과를 얻을 수 있다. 생소하게 느낄 수도 있는 전문용어에는 주석을 달아 손쉽게 관련 용어를 이해할 수 있게 했다. 이 책에서 익힌 지식을 한국어 자연어 처리에 잘 응용할 수 있기를 바란다.
('옮긴이의 말' 중에서)

저자소개

잘라지 트하나키(Jalaj Thanaki) [저] 신작알림 SMS신청 작가DB보기
생년월일 -
출생지 -
출간도서 1종
판매수 56권

데이터 과학자다. 구체적으로 말하면 데이터 과학 연구자다. 데이터 과학 관련 문제를 다루는 것을 좋아한다. 또한 데이터 과학과 인공 지능 관련 기술을 사용해 세계를 더 나은 곳으로 만들고 싶어한다. 연구 관심사는 자연어 처리, 머신 러닝, 딥러닝 및 대용량 데이터 분석이다. 사회 활동가, 여행자, 자연 애호가이기도 하다.

생년월일 -
출생지 -
출간도서 0종
판매수 0권

한아시스템에서 소프트웨어 엔지니어로 근무했으며, 현재 프리랜서로 일하고 있다. 삼각형프레스에서 출간한 [Boogazine JFC PROGRAMMING](1997), [Java Workshop 2.0 21일 완성](1997), [Boogazine Visual J++ 6.0](1998), [XML 기본+활용 마스터하기](2002)를 집필했고, [JAVA 서블릿 & JSP 프로그래밍 한꺼번에 끝내기](2002)를 번역했다. 또한 에이콘출판사에서 출간한 [(개정판) C & C++ 시큐어 코딩](2015), [닷넷 개발자를 위한 AngularJS](2016), [파이썬 분산 컴퓨팅](2016), [앵귤러2 컴포넌트 마스터](2016), [유니티 게임 개발을 위한 절차적 콘텐트 생성](2

펼쳐보기

이 상품의 시리즈

에이콘 데이터 과학 시리즈(총 43권 / 현재구매 가능도서 39권)

펼쳐보기

이 책과 내용이 비슷한 책 ? 내용 유사도란? 이 도서가 가진 내용을 분석하여 기준 도서와 얼마나 많이 유사한 콘텐츠를 많이 가지고 있는가에 대한 비율입니다.

    리뷰

    0.0 (총 0건)

    기대평

    작성시 유의사항

    평점
    0/200자
    등록하기

    기대평

    8.0

    교환/환불

    교환/환불 방법

    ‘마이페이지 > 취소/반품/교환/환불’ 에서 신청함, 1:1 문의 게시판 또는 고객센터(1577-2555) 이용 가능

    교환/환불 가능 기간

    고객변심은 출고완료 다음날부터 14일 까지만 교환/환불이 가능함

    교환/환불 비용

    고객변심 또는 구매착오의 경우에만 2,500원 택배비를 고객님이 부담함

    교환/환불 불가사유

    반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가할 수 있음
    배송된 상품의 분실, 상품포장이 훼손된 경우, 비닐랩핑된 상품의 비닐 개봉시 교환/반품이 불가능함

    소비자 피해보상

    소비자 피해보상의 분쟁처리 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 따라 비해 보상 받을 수 있음
    교환/반품/보증조건 및 품질보증 기준은 소비자기본법에 따른 소비자 분쟁 해결 기준에 따라 피해를 보상 받을 수 있음

    기타

    도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 주문이 취소될 수 있음(이 경우 인터파크도서에서 고객님께 별도로 연락하여 고지함)

    배송안내

    • 인터파크 도서 상품은 택배로 배송되며, 출고완료 1~2일내 상품을 받아 보실 수 있습니다

    • 출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 상품을 기준으로 배송됩니다.

    • 군부대, 교도소 등 특정기관은 우체국 택배만 배송가능하여, 인터파크 외 타업체 배송상품인 경우 발송되지 않을 수 있습니다.

    • 배송비

    도서(중고도서 포함) 구매

    2,000원 (1만원이상 구매 시 무료배송)

    음반/DVD/잡지/만화 구매

    2,000원 (2만원이상 구매 시 무료배송)

    도서와 음반/DVD/잡지/만화/
    중고직배송상품을 함께 구매

    2,000원 (1만원이상 구매 시 무료배송)

    업체직접배송상품 구매

    업체별 상이한 배송비 적용