´ë·®±¸¸ÅȨ >
ÄÄÇ»ÅÍ/ÀÎÅͳÝ
>
IT Àü¹®¼­
>
ÄÄÇ»ÅÍ°øÇÐ
>
¼ÒÇÁÆ®¿þ¾î°øÇÐ

ÆîÃ帱â
ÀÚ¿¬¾î 󸮸¦ À§ÇÑ Æ®·£½ºÆ÷¸Ó (¿øÁ¦:Transformers for Natural Language Processing)
Á¤°¡ 26,000¿ø
ÆǸŰ¡ 26,000¿ø (0% , 0¿ø)
I-Æ÷ÀÎÆ® 260P Àû¸³(1%)
ÆǸŻóÅ ÆǸÅÁß
ºÐ·ù ¼ÒÇÁÆ®¿þ¾î°øÇÐ
ÀúÀÚ Denis Rothman ( ¿ªÀÚ : À¯ÇöÁß )
ÃâÆÇ»ç/¹ßÇàÀÏ DK·ÎµåºÏ½º / 2022.01.10
ÆäÀÌÁö ¼ö 432 page
ISBN 9791196965679
»óÇ°ÄÚµå 354452367
°¡¿ëÀç°í Àç°íºÎÁ·À¸·Î ÃâÆÇ»ç ¹ßÁÖ ¿¹Á¤ÀÔ´Ï´Ù.
 
ÁÖ¹®¼ö·® :
´ë·®±¸¸Å Àü¹® ÀÎÅÍÆÄÅ© ´ë·®ÁÖ¹® ½Ã½ºÅÛÀ» ÀÌ¿ëÇÏ½Ã¸é °ßÀû¿¡¼­ºÎÅÍ ÇàÁ¤¼­·ù±îÁö Æí¸®ÇÏ°Ô ¼­ºñ½º¸¦ ¹ÞÀ¸½Ç ¼ö ÀÖ½À´Ï´Ù.
µµ¼­¸¦ °ßÀûÇÔ¿¡ ´ãÀ¸½Ã°í ½Ç½Ã°£ °ßÀûÀ» ¹ÞÀ¸½Ã¸é ±â´Ù¸®½Ç ÇÊ¿ä¾øÀÌ ÇÒÀιÞÀ¸½Ç ¼ö ÀÖ´Â °¡°ÝÀ» È®ÀÎÇÏ½Ç ¼ö ÀÖ½À´Ï´Ù.
¸ÅÁÖ ¹ß¼ÛÇØ µå¸®´Â ÀÎÅÍÆÄÅ©ÀÇ ½Å°£¾È³» Á¤º¸¸¦ ¹Þ¾Æº¸½Ã¸é »óÇ°ÀÇ ¼±Á¤À» ´õ¿í Æí¸®ÇÏ°Ô ÇÏ½Ç ¼ö ÀÖ½À´Ï´Ù.

 ´ë·®±¸¸ÅȨ  > ÄÄÇ»ÅÍ/ÀÎÅÍ³Ý  > IT Àü¹®¼­  > ÄÄÇ»ÅÍ°øÇÐ  > ¼ÒÇÁÆ®¿þ¾î°øÇÐ

 
Ã¥³»¿ë
¾ð¾î´Â Àΰ£ Ä¿¹Â´ÏÄÉÀ̼ÇÀÇ ÇÙ½ÉÀÌ´Ù. ¹®¸íÀº ¾ð¾î¸¦ Çü¼ºÇÏ´Â ´Ü¾î ½ÃÄö½º ¾øÀ̴ žÁö ¾Ê¾ÒÀ» °ÍÀÌ´Ù. ÀÌÁ¦ ¿ì¸®´Â µðÁöÅÐ ¾ð¾î Ç¥Çö ¼¼°è¿¡ »ì°í ÀÖ´Ù. Àϻ󿡼­ À¥ °Ë»ö ¿£Áø, À̸ÞÀÏ, ¼Ò¼È ³×Æ®¿öÅ©, °Ô½Ã¹°, Æ®À­, ½º¸¶Æ® Æù ¹®ÀÚ ¸Þ½ÃÁö, ¹ø¿ª, À¥ ÆäÀÌÁö, ±â·ÏÀ» À§ÇÑ ½ºÆ®¸®¹Ö »çÀÌÆ®ÀÇ À½¼º-ÅؽºÆ® º¯È¯, ÅؽºÆ®-ÇÖ¶óÀÎ º¯È¯ ¼­ºñ½º, ±×¸®°í ±× ¿ÜÀÇ ¼ö ¸¹Àº ÀÏ»óÀÇ NLP(Natural Language Processing. ÀÚ¿¬¾î ó¸®) µðÁöÅÐ ¾ð¾î ±â´É¿¡ ÀÇÁ¸ÇÑ´Ù. 2017³â 12¿ù, Vaswani µîÀÇ Google Brain ¸â¹ö¿Í Google Research°¡ ¾´ Attention Is AIl You Need ³í¹®ÀÌ ¹ßÇ¥µÇ¾ú´Ù. Æ®·£½ºÆ÷¸Ó°¡ ź»ýÇÑ °ÍÀÌ´Ù. Æ®·£½ºÆ÷¸Ó°¡ ±âÁ¸ÀÇ ÃÖ÷´Ü NLP ¸ðµ¨À» ´É°¡Çß´Ù. Æ®·£½ºÆ÷¸Ó´Â ÀÌÀü ¾ÆÅ°ÅØ󺸴٠ºü¸£°Ô ÈƷõǾúÀ¸¸ç, ´õ ³ôÀº Æò°¡ °á°ú¸¦ ¾ò¾ú´Ù. Æ®·£½ºÆ÷¸Ó´Â NLPÀÇ ÇÙ½É ±¸¼º ¿ä¼Ò°¡ µÇ¾ú´Ù. Áö±ÝÀÇ µðÁöÅÐ ¼¼°è´Â NLP ¾øÀÌ´Â Á¸ÀçÇÏÁö ¾Ê¾ÒÀ» °ÍÀÌ´Ù. NLP´Â Àΰø Áö´ÉÀÌ ¾ø¾ú´Ù¸é ¿ø½ÃÀûÀÌ°í ºñÈ¿À²ÀûÀ¸·Î ³²¾Æ ÀÖ¾úÀ» °ÍÀÌ´Ù. ±×·¸Áö¸¸ RNN(Recurrent Neural Network)°ú CNN(Convolutional Neural Network)ÀÇ »ç¿ëÀº °è»ê ¹× ±â°è ¼º´É Ãø¸é¿¡¼­ ¾öû³­ ºñ¿ëÀ» ¹ß»ý½ÃŲ´Ù. ÀÌ Àå¿¡¼­´Â ¸ÕÀú Æ®·£½ºÆ÷¸ÓÀÇ ºÎ»óÀ» °¡Á®¿Â NLPÀÇ ¹è°æºÎÅÍ ½ÃÀÛÇÏ°Ú´Ù. Ãʱâ NLP¿¡¼­ RNN°ú CNNÀ¸·Î »¡¸® ÁøÇàÇÒ °ÍÀÌ´Ù. ±×·± ´ÙÀ½ ½ÃÄö½º ºÐ¼®À» ¼ö½Ê ³â µ¿¾È Áö¹èÇØ¿Ô´ø RNN°ú CNNÀÇ ½Ã´ë¸¦ Æ®·£½ºÆ÷¸Ó°¡ ¾î¶»°Ô ¹«³Ê¶ß·È´ÂÁö »ìÆ캼 °ÍÀÌ´Ù. ±×·± ´ÙÀ½ Vaswani µî(2017)ÀÌ ¼³¸íÇÑ Æ®·£½ºÆ÷¸Ó ¸ðµ¨À» °³ºÀÇÏ°í, ±× ¾ÆÅ°ÅØóÀÇ ÁÖ¿ä ±¸¼º ¿ä¼Ò¸¦ »ìÆ캼 °ÍÀÌ´Ù. ¸ÅȤÀûÀÎ ¾îÅÙ¼Ç ¼¼°è¸¦ Ž±¸ÇÏ°í, Æ®·£½ºÆ÷¸ÓÀÇ ÁÖ¿ä ±¸¼º ¿ä¼Ò¸¦ ¼³¸íÇÒ °ÍÀÌ´Ù. | ¡á ÀÌ Ã¥ÀÌ ´Ù·ç´Â ³»¿ë | IºÎ: Æ®·£½ºÆ÷¸Ó ¾ÆÅ°ÅØó ¼Ò°³ 1Àå. ¡®Æ®·£½ºÆ÷¸ÓÀÇ ¸ðµ¨ ¾ÆÅ°ÅØó ½ÃÀÛÇϱ⡯¿¡¼­´Â NLPÀÇ ¹è°æÀ» »ìÆ캸°í, RNN, LSTM ¹× CNN ¾ÆÅ°ÅØó°¡ ¾î¶»°Ô ¹ö·ÁÁö°í, Æ®·£½ºÆ÷¸Ó ¾ÆÅ°ÅØó°¡ ¾î¶»°Ô »õ·Î¿î ½Ã´ë ¸¦ ¿­¾ú´ÂÁö ÀÌÇØÇÑ´Ù. Google Research ¹× Google Brain ÀúÀÚµéÀÌ ¹ß¸íÇÑ µ¶Æ¯ÇÑ ¡°Attention Is All You Need¡± Á¢±Ù ¹æ½ÄÀ» ÅëÇØ Æ®·£½ºÆ÷¸ÓÀÇ ¾ÆÅ°ÅØó¸¦ »ìÆ캸°Ú´Ù. Æ®·£½ºÆ÷¸Ó ÀÌ·ÐÀ» ¼³¸íÇÒ °ÍÀÌ´Ù. ¸ÖƼ-¾îÅÙ¼Ç Çìµå ¼­ºê·¹À̾ ¾î¶»°Ô ÀÛµ¿ÇÏ´Â Áö º¸±â À§ÇØ, PythonÀ¸·Î Á÷Á¢ ÀÛ¾÷ÇÒ °ÍÀÌ´Ù. ÀÌ ÀåÀÌ ³¡³¯ ¹«·Æ ¿©·¯ºÐÀº Æ®·£½ºÆ÷ ¸ÓÀÇ ¿ø·¡ ¾ÆÅ°ÅØó¸¦ ÀÌÇØÇÏ°Ô µÉ °ÍÀÌ´Ù. ´ÙÀ½ Àåµé¿¡¼­ Æ®·£½ºÆ÷¸ÓÀÇ ´Ù¾çÇÑ º¯Çü °ú »ç¿ë¹ýÀ» Ž±¸ÇÒ Áغñ°¡ µÇ¾î ÀÖÀ» °ÍÀÌ´Ù. 2Àå. ¡®BERT ¸ðµ¨ ¹Ì¼¼ Á¶Á¤¡¯¿¡¼­´Â ¿ø·¡ Æ®·£½ºÆ÷¸ÓÀÇ ¾ÆÅ°ÅØó¸¦ ±â¹ÝÀ¸·Î ÇÑ´Ù. BERT(Bidirectional Encoder Representations from Transformers)´Â NLPÀÇ ¼¼°è¸¦ ÀνÄÇÏ´Â ±¤´ëÇÏ°í »õ·Î¿î ¹æ½ÄÀ¸·Î Æ®·£½ºÆ÷¸Ó¸¦ ¿Å±æ °ÍÀÌ´Ù. BERT´Â ¹Ì·¡ ½ÃÄö½º¸¦ ¿¹ÃøÇϱâ À§ÇØ °ú°Å ½ÃÄö½º¸¦ ºÐ¼®ÇÏ´Â ´ë½Å, Àüü ½ÃÄö½º¿¡ ÁÖÀǸ¦ ±â¿ïÀδÙ! ¸ÕÀú BERT ¾ÆÅ°ÅØóÀÇ ÁÖ¿ä Çõ½ÅÀ» »ìÆ캻 ´ÙÀ½, Google Colaboratory ³ëÆ®ºÏ¿¡¼­ °¢ ´Ü°è¸¦ °ÅÄ¡¸é¼­ BERT ¸ðµ¨À» ¹Ì¼¼ Á¶Á¤ÇÏ°Ú´Ù. Àΰ£°ú ¸¶Âù°¡Áö·Î BERT´Â ÁÖÁ¦¸¦ ¹éÁö »óÅ¿¡¼­ ¹è¿ï ÇÊ¿ä ¾øÀÌ, ÀÛ¾÷À» ¹è¿ì°í ´Ù¸¥ »õ·Î¿î ÀÛ¾÷À» ¼öÇàÇÒ ¼ö ÀÖ´Ù. 3Àå. ¡®¹éÁö »óÅ¿¡¼­ RoBERTa ¸ðµ¨ »çÀü ÈÆ·Ã ½ÃÅ°±â¡¯¿¡¼­´Â Hugging Face PyTorch ¸ðµâÀ» »ç¿ëÇÏ¿© RoBERTa Æ®·£½ºÆ÷¸Ó ¸ðµ¨À» ¹éÁö »óÅ¿¡¼­ ±¸ÃàÇÑ´Ù. ÀÌ Æ®·£½ºÆ÷¸Ó´Â BERT¹× DistilBERT¿Í À¯»çÇÏ´Ù. ¸ÕÀú ¸ÂÃãÇü µ¥ÀÌÅͼ¿¡ ´ëÇØ ¹éÁö »óÅ¿¡¼­ ÅäÅ©³ª ÀÌÀú¸¦ ÈƷýÃŲ´Ù. ±×·± ÈÄ ÈÆ·ÃµÈ Æ®·£½ºÆ÷¸Ó°¡ ´Ù¿î½ºÆ®¸², ¸¶½ºÅ·µÈ ¾ð¾î ¸ðµ¨¸µ ÀÛ¾÷¿¡ ´ëÇØ ½ÇÇàµÈ´Ù. ¸Ó¸®¸» IX ¿ì¸®´Â °³³äÀû NLP Ç¥ÇöÀ» Ž±¸Çϱâ À§ÇØ Immanuel Kant µ¥ÀÌÅͼ¿¡ ´ëÇØ ¸¶½ºÅ·µÈ ¾ð ¾î ¸ðµ¨¸µÀ» ½ÇÇèÇÒ °ÍÀÌ´Ù. IIºÎ: ÀÚ¿¬¾î ÀÌÇØ ¹× »ý¼ºÀ» À§ÇÑ Æ®·£½ºÆ÷¸Ó Àû¿ë 4Àå. ¡®Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÑ ´Ù¿î½ºÆ®¸² NLP ÀÛ¾÷¡¯¿¡¼­´Â ´Ù¿î½ºÆ®¸² NLP ÀÛ¾÷¿¡ ÀÇÇØ Æ® ·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ ¸¶¹ýÀ» º¸¿©ÁØ´Ù. »çÀü ÈÆ·ÃµÈ Æ®·£½ºÆ÷¸Ó ¸ðµ¨À» ¹Ì¼¼ Á¶Á¤ÇÏ¿© BoolQ, CB, MultiRC, RTE, WiC µî°ú °°Àº ´Ù¾çÇÑ NLP ÀÛ¾÷À» ÇØ°áÇÏ¿©, GLUE ¹× SuperGLUE ¸®´õº¸µå¸¦ Áö¹èÇÒ ¼ö ÀÖ´Ù. ÀÛ¾÷, µ¥ÀÌÅͼ ¹× ¸ÞÆ®¸¯ÀÇ Æ®·£½ºÆ÷¸Ó Æò°¡ ÇÁ·Î¼¼½º¸¦ »ìÆ캸°Ú´Ù. ±×·± ´ÙÀ½ Hugging FaceÀÇ Æ®·£½ºÆ÷¸Ó ÆÄÀÌÇÁ¶óÀÎÀ» »ç ¿ëÇÏ¿© ÀϺΠ´Ù¿î½ºÆ®¸² ÀÛ¾÷À» ½ÇÇàÇÒ °ÍÀÌ´Ù. 5Àå. ¡®Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÑ ±â°è ¹ø¿ª¡¯¿¡¼­´Â Àΰ£ÀÇ º£À̽º¶óÀο¡¼­ ±â°è º¯È¯(transduction)¹æ¹ýÀ¸·Î À̵¿ÇÏ´Â ¹æ¹ýÀ» ÀÌÇØÇϱâ À§ÇØ ±â°è ¹ø¿ªÀ» Á¤ÀÇÇÑ´Ù. ±×·± ´ÙÀ½ À¯·´ ÀÇȸÀÇ WMT ÇÁ¶û½º¾î-¿µ¾î µ¥ÀÌÅͼÂÀ» »çÀü ó¸®ÇÑ´Ù. ±â°è ¹ø¿ªÀº Á¤È®ÇÑ Æò°¡ ¹æ¹ýÀÌ ÇÊ¿äÇϸç, ÀÌ Àå¿¡¼­´Â BLEU äÁ¡ ¹æ¹ý¿¡ ´ëÇØ »ìÆ캻´Ù. ¸¶Áö¸·À¸·Î Trax¸¦ »ç¿ëÇÏ¿© Æ®·£½ºÆ÷¸Ó ±â°è ¹ø¿ª ¸ðµ¨À» ±¸ÇöÇÑ´Ù. 6Àå. ¡®OpenAI GPT-2 ¹× GPT-3 ¸ðµ¨À» »ç¿ëÇÑ ÅؽºÆ® »ý¼º¡¯¿¡¼­´Â OpenAI GPT-2 Æ®·£ ½ºÆ÷¸ÓÀÇ ¿©·¯ Ãø¸éÀ» Ž±¸ÇÑ´Ù. ¸ÕÀú ¸®Æ÷¸Ó ¹× PET¿Í °°Àº ´ë¾È ¼Ö·ç¼ÇÀ» »ìÆ캽À¸ ·Î½á ÇÁ·ÎÁ§Æ® °ü¸® °üÁ¡¿¡¼­ GPT-2 ¹× GPT-3À» °ËÅäÇÑ´Ù. ±×·± ´ÙÀ½ OpenAIÀÇ GPT-2 ¹× GPT-3 Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ »õ·Î¿î ¾ÆÅ°ÅØó¸¦ Ž±¸ÇÏ°í GPT-2 345M ÆÄ ¶ó¹ÌÅÍ ¸ðµ¨À» ½ÇÇàÇÏ°í, »óÈ£ÀÛ¿ëÇÏ¿© ÅؽºÆ®¸¦ »ý¼ºÇÑ´Ù. ±×·± ´ÙÀ½ »ç¿ëÀÚ ÁöÁ¤ µ¥ ÀÌÅͼ¿¡ ´ëÇØ GPT-2 117M ÆĶó¹ÌÅÍ ¸ðµ¨À» ÈÆ·ÃÇÏ°í »ç¿ëÀÚ ÁöÁ¤ ÅؽºÆ® ¿Ï¼ºÀ» »ý¼ºÇÑ´Ù. 7Àå. ¡®AI ÅؽºÆ® ¿ä¾àÀ» À§ÇÑ ¹ý·ü ¹× À繫 ¹®¼­¿¡ Æ®·£½ºÆ÷¸Ó Àû¿ëÇϱ⡯¿¡¼­´Â T5 Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ °³³ä°ú ¾ÆÅ°ÅØó¸¦ »ìÆ캻´Ù. ¹®¼­¸¦ ¿ä¾àÇϱâ À§ÇØ Hugging FaceÀÇ T5 ¸ðµ¨À» ÃʱâÈ­ÇÑ´Ù. ¸¶Áö¸·À¸·Î T5 ¸ðµ¨¿¡ ±Ç¸®ÀåÀüÀÇ »ùÇÃÀ» Æ÷ÇÔÇÑ ´Ù¾çÇÑ ¹®¼­ÀÇ ¿ä¾à ÀÛ¾÷À» ½ÃÅ°°í, Æ®·£½ºÆ÷¸Ó¿¡ Àû¿ëµÈ ÀüÀÌ ÇнÀ(transfer learning) Á¢±Ù ¹æ½ÄÀÇ ¼º°ø°ú ÇѰ踦 Ž±¸ÇÑ´Ù. ¸Ó¸®¸» X 8Àå. ¡®ÅäÅ«³ªÀÌÀú¿Í µ¥ÀÌÅͼ ¸ÅĪ¡¯¿¡¼­´Â ÅäÅ©³ªÀÌÀúÀÇ ÇѰ踦 ºÐ¼®ÇÏ°í, µ¥ÀÌÅÍ ÀÎÄÚ µù ÇÁ·Î¼¼½ºÀÇ Ç°ÁúÀ» °³¼±Çϱâ À§ÇØ Àû¿ëµÈ ¸î °¡Áö ¹æ¹ýÀ» »ìÆ캻´Ù. ¿ì¸®´Â ¸ÕÀú word2vector ÅäÅ©³ªÀÌÀú°¡ ÀϺΠ´Ü¾î¸¦ »ý·«Çϰųª À߸ø Çؼ®ÇÏ´Â ÀÌÀ¯¸¦ Á¶»çÇϱâ À§ÇØ Python ÇÁ·Î±×·¥À» ºôµåÇÒ °ÍÀÌ´Ù. ±×¸®°í, ¿ì¸®´Â ÅäÅ©³ªÀÌÀú¿¡ ºñƯÁ¤ÀûÀÎ ¹æ ¹ýÀ¸·Î, »çÀü ÈÆ·ÃµÈ ÅäÅ©³ªÀÌÀúÀÇ ÇѰ踦 ã¾Æ³½´Ù. ¸¶Áö¸·À¸·Î ÅäÅ«È­ ÇÁ·Î¼¼½ºÀÇ ¹æ¹ý·ÐÀ» °³¼±ÇÒ ¿©Áö°¡ ¾ÆÁ÷ ¸¹ÀÌ ³²¾Æ ÀÖÀ½À» º¸¿©ÁÖ´Â ¸î °¡Áö ¾ÆÀ̵ð¾î¸¦ Àû¿ëÇÏ ¿© T5 ¿ä¾àÀ» °³¼±ÇÒ °ÍÀÌ´Ù. 9Àå. ¡®BERT ±â¹Ý Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÑ ½Ã¸Çƽ ·Ñ ·¹ÀÌºí¸µ¡¯¿¡¼­´Â Æ®·£½ºÆ÷¸Ó°¡ ÅؽºÆ® ³» ¿ëÀ» ÀÌÇØÇÏ´Â ¹æ¹ýÀ» Ž±¸ÇÑ´Ù. SRL(Semantic Role Labeling)Àº Àΰ£¿¡°Ô ¾î·Á¿î ÀÛ¾÷ÀÌ´Ù. Æ®·£½ºÆ÷¸Ó´Â ³î¶ó¿î °á°ú¸¦ »ý¼ºÇÒ ¼ö ÀÖ´Ù. ¿ì¸®´Â Allen Institute for AI¿¡¼­ ¼³°èÇÑ BERT ±â¹Ý Æ®·£½ºÆ÷¸Ó ¸ðµ¨À» Google Colab ³ëÆ®ºÏ¿¡¼­ ±¸ÇöÇÒ °ÍÀÌ´Ù. ¶ÇÇÑ ¿Â¶óÀÎ ¸®¼Ò½º¸¦ »ç¿ëÇÏ¿© SRL Ãâ·ÂÀ» ½Ã°¢È­ÇÑ´Ù. IIIºÎ: °í±Þ ¾ð¾î ÀÌÇØ ±â¼ú 10Àå. ¡®µ¥ÀÌÅÍ°¡ ¸»ÇÏ°Ô Ç϶ó: À̾߱â, Áú¹®, ´ë´ä¡¯¿¡¼­´Â Æ®·£½ºÆ÷¸Ó°¡ Ãß·ÐÇÏ´Â ¹æ¹ýÀ» ¹è ¿ï ¼ö ÀÖ´ÂÁö¸¦ º¸¿©ÁØ´Ù. Æ®·£½ºÆ÷¸Ó´Â ÅؽºÆ®, À̾߱⸦ ÀÌÇØÇÒ ¼ö ÀÖ¾î¾ß Çϸç Ãß ·Ð ´É·Âµµ º¸¿©ÁÙ ¼ö ÀÖ¾î¾ß ÇÑ´Ù. NER ¹× SRLÀ» ÇÁ·Î¼¼½º¿¡ Ãß°¡ÇÏ¿© Áú¹® ´äº¯À» Çâ»ó½ÃÅ°´Â ¹æ¹ýÀ» »ìÆ캸°Ú´Ù. Æ®·£½ºÆ÷¸Ó¸¦ ±³À°Çϰųª µ¶¸³ ½ÇÇàÇü ¼Ö·ç¼ÇÀ¸·Î »ç ¿ëÇÒ ¼ö ÀÖ´Â Áú¹® »ý¼º±â¿¡ ´ëÇÑ Ã»»çÁøÀ» ±¸ÃàÇÒ °ÍÀÌ´Ù. 11Àå. ¡®¿¹ÃøÀ» À§ÇÑ °í°´ °¨Á¤ °¨Áö¡¯¿¡¼­´Â Æ®·£½ºÆ÷¸Ó°¡ ¾î¶»°Ô ¼¾Æ¼¸ÕÆ®(°¨¼º) ºÐ¼®À» °³¼±Çß´ÂÁö¸¦ º¸¿©ÁØ´Ù. Stanford Sentiment Treebank¸¦ »ç¿ëÇÏ¿© º¹ÀâÇÑ ¹®ÀåÀ» ºÐ¼®ÇÏ¿©, ½ÃÄö½ºÀÇ ±¸Á¶»Ó¸¸ ¾Æ´Ï¶ó ³í¸®Àû Çüŵµ ÀÌÇØÇϴµ¥ ¿©·¯ Æ®·£½ºÆ÷¸Ó ¸ðµ¨À» µµ Àü½ÃŲ´Ù. ¼¾Æ¼¸ÕÆ® ºÐ¼® Ãâ·Â¿¡ µû¶ó ´Ù¸¥ ÀÛ¾÷À» Æ®¸®°ÅÇÏ´Â ¿¹ÃøÀ» ¸¸µé±â À§ÇØ Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÏ´Â ¹æ¹ýÀ» »ìÆ캸°Ú´Ù. 12Àå. ¡®Æ®·£½ºÆ÷¸Ó¿¡ ÀÇÇÑ °¡Â¥ ´º½º ºÐ¼®¡¯¿¡¼­´Â ¶ß°Å¿î ÁÖÁ¦ÀÎ °¡Â¥ ´º½º¿Í, ¿ì¸®°¡ ¸ÅÀÏ º¸´Â ¿Â¶óÀÎ ÄÜÅÙÃ÷ÀÇ ´Ù¾çÇÑ °üÁ¡À» ÀÌÇØÇÏ´Â µ¥ Æ®·£½ºÆ÷¸Ó°¡ ¾î¶»°Ô µµ¿òÀÌ µÇ´Â Áö Ž±¸ÇÑ´Ù. ¸ÅÀÏ ¼ö½Ê¾ï °³ÀÇ ¸Þ½ÃÁö, °Ô½Ã¹° ¹× ±â»ç°¡ ¼Ò¼È ¹Ìµð¾î, À¥ »çÀÌÆ® ¹× »ç¿ë °¡´ÉÇÑ ¸ðµç ÇüÅÂÀÇ ½Ç½Ã°£ Åë½ÅÀ» ÅëÇØ À¥¿¡ °Ô½ÃµÈ´Ù. ÀÌÀü ÀåµéÀÇ ¸î °¡Áö ±â ¼úÀ» »ç¿ëÇÏ¿© ±âÈÄ º¯È­ ¹× Ãѱ⠱ÔÁ¦¿¡ ´ëÇÑ Åä·Ð°ú ÀüÁ÷ ´ëÅë·ÉÀÇ Æ®À­À» ºÐ¼®ÇÑ ´Ù. ÇÕ¸®ÀûÀÎ ÀǽÉÀ» ³Ñ¾î °¡Â¥ ´º½º·Î °£ÁÖµÉ ¼ö ÀÖ´Â ´º½º¿Í ÁÖ°üÀûÀÎ ´º½º¸¦ °áÁ¤ ÇÏ´Â µµ´öÀû, À±¸®Àû ¹®Á¦¸¦ °ÞÀ» °ÍÀÌ´Ù.
¸ñÂ÷
¸Ó¸®¸» ¥´ 1Àå Æ®·£½ºÆ÷¸Ó ¸ðµ¨ ¾ÆÅ°ÅØó 1.1 Æ®·£½ºÆ÷¸ÓÀÇ ¹è°æ 4 1.2 Æ®·£½ºÆ÷¸ÓÀÇ ºÎ»ó: Attention Is All You Need 7 1.2.1 ÀÎÄÚ´õ ½ºÅà 10 1.2.2 µðÄÚ´õ ½ºÅà 46 1.3 ÈƷðú ¼º´É 49 1.3.1 ÀÌ ÀåÀ» ¸¶Ä¡±â Àü¿¡ 50 1.4 ¿ä¾à 51 1.5 Áú¹® 52 2Àå BERT ¸ðµ¨ ¹Ì¼¼ Á¶Á¤ 2.1 BERT ¾ÆÅ°ÅØó 58 2.1.1 ÀÎÄÚ´õ ½ºÅà 59 2.1.2 BERTÀÇ »çÀüÈÆ·Ã ¹× ¹Ì¼¼ Á¶Á¤ 66 2.2 BERT ¹Ì¼¼ Á¶Á¤ 68 2.2.1 GPU È°¼ºÈ­ 69 2.2.2 BERT¿ë Hugging Face PyTorch ÀÎÅÍÆäÀ̽º ¼³Ä¡ 71 2.2.3 ¸ðµâ ºÒ·¯¿À±â 71 2.2.4 CUDA¸¦ Torch¿ë µð¹ÙÀ̽º·Î ÁöÁ¤Çϱâ 72 2.2.5 µ¥ÀÌÅͼ ºÒ·¯¿À±â 72 2.2.6 ¹®Àå ¹× ·¹ÀÌºí ¸ñ·Ï »ý¼º, BERT ÅäÅ« Ãß°¡ 76 2.2.7 BERT ÅäÅ©³ªÀÌÀú È°¼ºÈ­ 76 2.2.8 µ¥ÀÌÅÍ Ã³¸® 77 2.2.9 ¾îÅÙ¼Ç ¸¶½ºÅ© »ý¼º 77 2.2.10 ÈÆ·Ã ¹× °ËÁõ µ¥ÀÌÅÍ ºÐ¸® 78 2.2.11 Torch ÅÙ¼­·Î µ¥ÀÌÅÍ º¯È¯ 79 2.2.12 ¹îÄ¡ Å©±â ¼±Åà ¹× iterator »ý¼º 79 2.2.13 BERT ¸ðµ¨ ¼³Á¤ 80 2.2.14 Hugging Face BERT uncased º£À̽º ¸ðµ¨ ºÒ·¯¿À±â 82 2.2.15 Optimizer ±×·ì ÆĶó¹ÌÅÍ 84 2.2.16 ÈÆ·Ã ·çÇÁ¿ë ÇÏÀÌÆÛÆĶó¹ÌÅÍ 85 2.2.17 ÈÆ·Ã ·çÇÁ 86 2.2.18 ÈÆ·Ã Æò°¡ 87 2.2.19 ¹Ì»ç¿ë µ¥ÀÌÅͼ¿¡ ÀÇÇÑ ¿¹Ãø ¹× Æò°¡ 88 2.2.20 Matthews »ó°ü °è¼ö¿¡ ÀÇÇÑ Æò°¡ 90 2.2.21 °³º° ¹îÄ¡ Á¡¼ö 91 2.2.22 Àüü µ¥ÀÌÅͼ¿¡ ´ëÇÑ Matthews Æò°¡ 92 2.3 ¿ä¾à 92 2.4 Áú¹® 93 3Àå ¹éÁö »óÅ¿¡¼­ RoBERTa ¸ðµ¨ »çÀüÈƷýÃÅ°±â 3.1 ÅäÅ©³ªÀÌÀú ÈÆ·Ã ¹× Æ®·£½ºÆ÷¸Ó »çÀüÈÆ·Ã 98 3.2 ¹éÁö »óÅ¿¡¼­ KantaiBERT ±¸ÃàÇϱâ 100 3.3 ´ÙÀ½ ´Ü°è 122 3.4 ¿ä¾à 122 3.5 Áú¹® 123 4Àå Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÑ ´Ù¿î½ºÆ®¸² NLP ÀÛ¾÷ 4.1 Æ®·£½ºÆ÷¸ÓÀÇ º¯È¯ ¹× ±Í³³ »ó¼Ó 128 4.1.1 Àΰ£ Áö´É ½ºÅà 129 4.1.2 ±â°è Áö´É ½ºÅà 130 4.2 Æ®·£½ºÆ÷¸Ó ¼º´É ´ë Àΰ£ º£À̽º¶óÀÎ 132 4.2.1 ¸ÞÆ®¸¯¿¡ ÀÇÇÑ ¸ðµ¨ Æò°¡ 133 4.2.2 º¥Ä¡¸¶Å© ÀÛ¾÷°ú µ¥ÀÌÅͼ 134 4.2.3 SuperGLUE º¥Ä¡¸¶Å© ÀÛ¾÷ Á¤ÀÇ 140 4.3 ´Ù¿î½ºÆ®¸² ÀÛ¾÷ ½ÇÇà 147 4.3.1 CoLA(Corpus of Linguistic Acceptability. ¾ð¾î ¼ö¿ë¼º ÄÚÆÛ½º) 147 4.3.2 SST-2 148 4.3.3 MRPC 149 4.3.4 Winograd ½ºÅ°¸¶ 151 4.4 ¿ä¾à 152 4.5 Áú¹® 153 5Àå Æ®·£½ºÆ÷¸Ó ±â°è ¹ø¿ª 5.1 ±â°è ¹ø¿ªÀÇ Á¤ÀÇ 158 5.1.1 Àΰ£ Æ®·£½º´ö¼Ç°ú ¹ø¿ª 159 5.1.2 ±â°è Æ®·£½º´ö¼Ç°ú ¹ø¿ª 160 5.2 WMT µ¥ÀÌÅͼ Àüó¸® 161 5.2.1 ¿ø½Ã µ¥ÀÌÅÍ Àüó¸® 161 5.2.2 µ¥ÀÌÅͼ Àüó¸® ¸¶¹«¸® 164 5.3 BLEU¿¡ ÀÇÇÑ ±â°è ¹ø¿ª Æò°¡ 168 5.3.1 ±âÇÏÀû Æò°¡ 169 5.3.2 ½º¹«µù ±â¹ý Àû¿ë 171 5.4 Trax¿¡ ÀÇÇÑ ¹ø¿ª 173 5.4.1 Trax ¼³Ä¡ 174 5.4.2 Æ®·£½ºÆ÷¸Ó ¸ðµ¨ »ý¼º 174 5.4.3 »çÀü ÈÆ·Ã °¡ÁßÄ¡·Î ¸ðµ¨ ÃʱâÈ­Çϱâ 175 5.4.4 ¹®Àå ÅäÅ«È­ 175 5.4.5 Æ®·£½ºÆ÷¸Ó µðÄÚµù 175 5.4.6 ¿ª ÅäÅ«È­ ¹× ¹ø¿ª Ç¥½Ã 176 5.5 ¿ä¾à 177 5.6 Áú¹® 178 6Àå OpenAI GPT-2 ¹× GPT-3 ¸ðµ¨À» »ç¿ëÇÑ ÅؽºÆ® »ý¼º 6.1 10¾ï ÆĶó¹ÌÅÍ Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ ºÎ»ó 185 6.1.1 Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ Å©±â Áõ°¡ 185 6.2 Æ®·£½ºÆ÷¸Ó, ¸®Æ÷¸Ó, PET, ¶Ç´Â GPT? 188 6.2.1 ¿øº» Æ®·£½ºÆ÷¸Ó ¾ÆÅ°ÅØóÀÇ ÇÑ°è 190 6.2.2 ¸®Æ÷¸Ó 194 6.2.3 PET(Pattern-Exploiting Training. ÆÐÅÏ È°¿ë ÈÆ·Ã) 196 6.3 °áÁ¤À» ³»·Á¾ß ÇÒ ¶§´Ù 199 6.4 OpenAI GPT ¸ðµ¨ÀÇ ¾ÆÅ°ÅØó 200 6.4.1 ¹Ì¼¼ Á¶Á¤¿¡¼­ Á¦·Î-¼¦ ¸ðµ¨±îÁö 201 6.4.2 µðÄÚ´õ ·¹ÀÌ¾î ½×±â 203 6.5 GPT-2¿¡ ÀÇÇÑ ÅؽºÆ® ¿Ï¼º 205 6.6 GPT-2 ¾ð¾î ¸ðµ¨ ÈÆ·Ã 218 6.7 ÄÁÅؽºÆ® ¹× ¿Ï¼º ¿¹Á¦ 225 6.8 Æ®·£½ºÆ÷¸Ó·Î À½¾Ç »ý¼º 229 6.9 ¿ä¾à 230 6.10 Áú¹® 231 7Àå AI ÅؽºÆ® ¿ä¾àÀ» À§ÇØ ¹ý·ü ¹× À繫 ¹®¼­¿¡ Æ®·£½ºÆ÷¸Ó Àû¿ëÇϱâ 7.1 º¸ÆíÀûÀÎ T2T ¸ðµ¨ ¼³°è 236 7.1.1 T2T Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ ºÎ»ó 237 7.1.2 ÀÛ¾÷-ƯÁ¤ Çü½Ä ´ë½Å Á¢µÎ»ç 239 7.1.3 T5 ¸ðµ¨ 241 7.2 T5¸¦ »ç¿ëÇÑ ÅؽºÆ® ¿ä¾à 243 7.2.1 Hugging Face 243 7.2.2 T5-large Æ®·£½ºÆ÷¸Ó ¸ðµ¨ ÃʱâÈ­ 246 7.2.3 T5-large¿¡ ÀÇÇÑ ¹®¼­ ¿ä¾à 252 7.3 ¿ä¾à 258 7.4 Áú¹® 259 8Àå ÅäÅ©³ªÀÌÀú¿Í µ¥ÀÌÅͼ ¸ÅĪ 8.1 ÅäÅ©³ªÀÌÀú¿Í µ¥ÀÌÅͼ ¸ÅĪ 264 8.2 ÃÖ¼± °üÇà 265 8.1.2 Word2Vec ÅäÅ«È­ 270 8.2 ƯÁ¤ ¾îÈÖ¸¦ »ç¿ëÇÑ Ç¥ÁØ NLP ÀÛ¾÷ 282 8.2.1 GPT-2¿¡ ÀÇÇÑ ºñÁ¶°ÇºÎ »ùÇà »ý¼º 282 8.2.2 ÈÆ·ÃµÈ Á¶°ÇºÎ »ùÇà »ý¼º 288 8.3 T5 ±Ç¸®ÀåÀü »ùÇà 289 8.3.1 ±Ç¸®ÀåÀü ¿ä¾à 1 289 8.3.2 ±Ç¸®ÀåÀü ¿ä¾à 2 290 8.4 ¿ä¾à 292 8.5 Áú¹® 293 9Àå BERT ±â¹Ý Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÑ ½Ã¸Çƽ ·Ñ ·¹ÀÌºí¸µ 9.1 SRL ½ÃÀÛÇϱâ 298 9.1.1 SRL Á¤ÀÇ 299 9.2.1 »çÀü ÈÆ·Ã BERT ±â¹Ý ¸ðµ¨ ½ÇÇà 301 9.2 BERT ±â¹Ý ¸ðµ¨À» »ç¿ëÇÑ SRL ½ÇÇè 304 9.3 ±âº» »ùÇà 304 9.3.1 »ùÇà 1 304 9.3.2 »ùÇà 2 306 9.3.3 »ùÇà 3 309 9.4 ¾î·Á¿î »ùÇõé 313 9.4.1 »ùÇà 4 313 9.4.2 »ùÇà 5 317 9.4.3 »ùÇà 6 319 9.5 ¿ä¾à 319 9.6 Áú¹® 320 10Àå µ¥ÀÌÅÍ°¡ ¸»ÇÏ°Ô Ç϶ó: À̾߱â, Áú¹®, ´äº¯ 10.1 ¹æ¹ý·Ð 326 10.1.1 Æ®·£½ºÆ÷¸Ó¿Í ¹æ¹ý 327 10.2 ¹æ¹ý 0: ½ÃÇàÂø¿À 329 10.3 ¹æ¹ý 1: NER first 332 10.3.1 Áú¹®À» ã±â À§ÇØ NER »ç¿ëÇϱâ 333 10.4 ¹æ¹ý 2: SRL first 340 10.4.1 ELECTRA¸¦ »ç¿ëÇÑ Áú¹®-´äº¯ 342 10.4.2 ÇÁ·ÎÁ§Æ® °ü¸® Á¦¾à 345 10.4.3 Áú¹®À» ã±â À§ÇØ SRL »ç¿ëÇϱâ 345 10.5 ´ÙÀ½ ´Ü°è 352 10.5.1 RoBERTa ¸ðµ¨·Î Haystack Ž±¸Çϱâ 354 10.6 ¿ä¾à 355 10.7 Áú¹® 356 11Àå ¿¹ÃøÀ» À§ÇÑ °í°´ °¨Á¤ °¨Áö 11.1 ½ÃÀÛÇϱâ: ¼¾Æ¼¸ÕÆ® ºÐ¼® Æ®·£½ºÆ÷¸Óµé 362 11.2 SST 362 11.2.1 RoBERTa-large¸¦ »ç¿ëÇÑ ¼¾Æ¼¸ÕÆ® ºÐ¼® 366 11.3 ¼¾Æ¼¸ÕÆ® ºÐ¼®¿¡ ÀÇÇÑ °í°´ Çൿ ¿¹Ãø 368 11.3.1 DistillBERT¸¦ »ç¿ëÇÑ ¼¾Æ¼¸ÕÆ® ºÐ¼® 368 11.3.2 Hugging Face ¸ðµ¨ ¸ñ·ÏÀ» ÀÌ¿ëÇÑ ¼¾Æ¼¸ÕÆ® ºÐ¼® 371 11.4 ¿ä¾à 378 11.5 Áú¹® 379 12Àå Æ®·£½ºÆ÷¸Ó¿¡ ÀÇÇÑ °¡Â¥ ´º½º ºÐ¼® 12.1 °¡Â¥ ´º½º¿¡ ´ëÇÑ °¨Á¤Àû ¹ÝÀÀ 384 12.1.1 ÀÎÁö ºÒÇùÈ­°¡ °¨Á¤Àû ¹ÝÀÀÀ» ÃË¹ß 385 12.2 °¡Â¥ ´º½º¿¡ ´ëÇÑ ÇÕ¸®Àû Á¢±Ù ¹æ¹ý 394 12.2.1 °¡Â¥ ´º½º ÇØ°á ·Îµå¸Ê Á¤ÀÇ 395 12.2.2 Ãѱ⠱ÔÁ¦ 396 12.2.3 COVID-19¿Í Æ®·³ÇÁ Àü ´ëÅë·É Æ®À­ 408 12.3 ³ª°¡±â Àü¿¡ 412 12.3.1 ÀºÅºÈ¯À» ã¾Æ¼­ 412 12.3.2 ½Å·ÚÇÒ ¼ö ÀÖ´Â ÈÆ·Ã ¹æ¹ýÀ» ã¾Æ¼­ 413 12.4 ¿ä¾à 414 12.5 Áú¹® 415 ºÎ·Ï: Áú¹®¿¡ ´ëÇÑ ´ä 417 ãÂ÷º¸±âs All You Need 7 1.2.1 ÀÎÄÚ´õ ½ºÅà 10 1.2.2 µðÄÚ´õ ½ºÅà 46 1.3 ÈƷðú ¼º´É 49 1.3.1 ÀÌ ÀåÀ» ¸¶Ä¡±â Àü¿¡ 50 1.4 ¿ä¾à 51 1.5 Áú¹® 52 2Àå BERT ¸ðµ¨ ¹Ì¼¼ Á¶Á¤ 2.1 BERT ¾ÆÅ°ÅØó 58 2.1.1 ÀÎÄÚ´õ ½ºÅà 59 2.1.2 BERTÀÇ »çÀüÈÆ·Ã ¹× ¹Ì¼¼ Á¶Á¤ 66 2.2 BERT ¹Ì¼¼ Á¶Á¤ 68 2.2.1 GPU È°¼ºÈ­ 69 2.2.2 BERT¿ë Hugging Face PyTorch ÀÎÅÍÆäÀ̽º ¼³Ä¡ 71 2.2.3 ¸ðµâ ºÒ·¯¿À±â 71 2.2.4 CUDA¸¦ Torch¿ë µð¹ÙÀ̽º·Î ÁöÁ¤Çϱâ 72 2.2.5 µ¥ÀÌÅͼ ºÒ·¯¿À±â 72 2.2.6 ¹®Àå ¹× ·¹ÀÌºí ¸ñ·Ï »ý¼º, BERT ÅäÅ« Ãß°¡ 76 2.2.7 BERT ÅäÅ©³ªÀÌÀú È°¼ºÈ­ 76 2.2.8 µ¥ÀÌÅÍ Ã³¸® 77 2.2.9 ¾îÅÙ¼Ç ¸¶½ºÅ© »ý¼º 77 2.2.10 ÈÆ·Ã ¹× °ËÁõ µ¥ÀÌÅÍ ºÐ¸® 78 ¸ñÂ÷ XVI 2.2.11 Torch ÅÙ¼­·Î µ¥ÀÌÅÍ º¯È¯ 79 2.2.12 ¹îÄ¡ Å©±â ¼±Åà ¹× iterator »ý¼º 79 2.2.13 BERT ¸ðµ¨ ¼³Á¤ 80 2.2.14 Hugging Face BERT uncased º£À̽º ¸ðµ¨ ºÒ·¯¿À±â 82 2.2.15 Optimizer ±×·ì ÆĶó¹ÌÅÍ 84 2.2.16 ÈÆ·Ã ·çÇÁ¿ë ÇÏÀÌÆÛÆĶó¹ÌÅÍ 85 2.2.17 ÈÆ·Ã ·çÇÁ 86 2.2.18 ÈÆ·Ã Æò°¡ 87 2.2.19 ¹Ì»ç¿ë µ¥ÀÌÅͼ¿¡ ÀÇÇÑ ¿¹Ãø ¹× Æò°¡ 88 2.2.20 Matthews »ó°ü °è¼ö¿¡ ÀÇÇÑ Æò°¡ 90 2.2.21 °³º° ¹îÄ¡ Á¡¼ö 91 2.2.22 Àüü µ¥ÀÌÅͼ¿¡ ´ëÇÑ Matthews Æò°¡ 92 2.3 ¿ä¾à 92 2.4 Áú¹® 93 3Àå ¹éÁö »óÅ¿¡¼­ RoBERTa ¸ðµ¨ »çÀüÈƷýÃÅ°±â 3.1 ÅäÅ©³ªÀÌÀú ÈÆ·Ã ¹× Æ®·£½ºÆ÷¸Ó »çÀüÈÆ·Ã 98 3.2 ¹éÁö »óÅ¿¡¼­ KantaiBERT ±¸ÃàÇϱâ 100 3.3 ´ÙÀ½ ´Ü°è 122 3.4 ¿ä¾à 122 3.5 Áú¹® 123 4Àå Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÑ ´Ù¿î½ºÆ®¸² NLP ÀÛ¾÷ 4.1 Æ®·£½ºÆ÷¸ÓÀÇ º¯È¯ ¹× ±Í³³ »ó¼Ó 128 4.1.1 Àΰ£ Áö´É ½ºÅà 129 4.1.2 ±â°è Áö´É ½ºÅà 130 4.2 Æ®·£½ºÆ÷¸Ó ¼º´É ´ë Àΰ£ º£À̽º¶óÀÎ 132 ¸ñÂ÷ XVII 4.2.1 ¸ÞÆ®¸¯¿¡ ÀÇÇÑ ¸ðµ¨ Æò°¡ 133 4.2.2 º¥Ä¡¸¶Å© ÀÛ¾÷°ú µ¥ÀÌÅͼ 134 4.2.3 SuperGLUE º¥Ä¡¸¶Å© ÀÛ¾÷ Á¤ÀÇ 140 4.3 ´Ù¿î½ºÆ®¸² ÀÛ¾÷ ½ÇÇà 147 4.3.1 CoLA(Corpus of Linguistic Acceptability. ¾ð¾î ¼ö¿ë¼º ÄÚÆÛ½º) 147 4.3.2 SST-2 148 4.3.3 MRPC 149 4.3.4 Winograd ½ºÅ°¸¶ 151 4.4 ¿ä¾à 152 4.5 Áú¹® 153 5Àå Æ®·£½ºÆ÷¸Ó ±â°è ¹ø¿ª 5.1 ±â°è ¹ø¿ªÀÇ Á¤ÀÇ 158 5.1.1 Àΰ£ Æ®·£½º´ö¼Ç°ú ¹ø¿ª 159 5.1.2 ±â°è Æ®·£½º´ö¼Ç°ú ¹ø¿ª 160 5.2 WMT µ¥ÀÌÅͼ Àüó¸® 161 5.2.1 ¿ø½Ã µ¥ÀÌÅÍ Àüó¸® 161 5.2.2 µ¥ÀÌÅͼ Àüó¸® ¸¶¹«¸® 164 5.3 BLEU¿¡ ÀÇÇÑ ±â°è ¹ø¿ª Æò°¡ 168 5.3.1 ±âÇÏÀû Æò°¡ 169 5.3.2 ½º¹«µù ±â¹ý Àû¿ë 171 5.4 Trax¿¡ ÀÇÇÑ ¹ø¿ª 173 5.4.1 Trax ¼³Ä¡ 174 5.4.2 Æ®·£½ºÆ÷¸Ó ¸ðµ¨ »ý¼º 174 5.4.3 »çÀü ÈÆ·Ã °¡ÁßÄ¡·Î ¸ðµ¨ ÃʱâÈ­Çϱâ 175 5.4.4 ¹®Àå ÅäÅ«È­ 175 5.4.5 Æ®·£½ºÆ÷¸Ó µðÄÚµù 175 5.4.6 ¿ª ÅäÅ«È­ ¹× ¹ø¿ª Ç¥½Ã 176 ¸ñÂ÷ XVIII 5.5 ¿ä¾à 177 5.6 Áú¹® 178 6Àå OpenAI GPT-2 ¹× GPT-3 ¸ðµ¨À» »ç¿ëÇÑ ÅؽºÆ® »ý¼º 6.1 10¾ï ÆĶó¹ÌÅÍ Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ ºÎ»ó 185 6.1.1 Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ Å©±â Áõ°¡ 185 6.2 Æ®·£½ºÆ÷¸Ó, ¸®Æ÷¸Ó, PET, ¶Ç´Â GPT? 188 6.2.1 ¿øº» Æ®·£½ºÆ÷¸Ó ¾ÆÅ°ÅØóÀÇ ÇÑ°è 190 6.2.2 ¸®Æ÷¸Ó 194 6.2.3 PET(Pattern-Exploiting Training. ÆÐÅÏ È°¿ë ÈÆ·Ã) 196 6.3 °áÁ¤À» ³»·Á¾ß ÇÒ ¶§´Ù 199 6.4 OpenAI GPT ¸ðµ¨ÀÇ ¾ÆÅ°ÅØó 200 6.4.1 ¹Ì¼¼ Á¶Á¤¿¡¼­ Á¦·Î-¼¦ ¸ðµ¨±îÁö 201 6.4.2 µðÄÚ´õ ·¹ÀÌ¾î ½×±â 203 6.5 GPT-2¿¡ ÀÇÇÑ ÅؽºÆ® ¿Ï¼º 205 6.6 GPT-2 ¾ð¾î ¸ðµ¨ ÈÆ·Ã 218 6.7 ÄÁÅؽºÆ® ¹× ¿Ï¼º ¿¹Á¦ 225 6.8 Æ®·£½ºÆ÷¸Ó·Î À½¾Ç »ý¼º 229 6.9 ¿ä¾à 230 6.10 Áú¹® 231 7Àå AI ÅؽºÆ® ¿ä¾àÀ» À§ÇØ ¹ý·ü ¹× À繫 ¹®¼­¿¡ Æ®·£½ºÆ÷¸Ó Àû¿ëÇϱâ 7.1 º¸ÆíÀûÀÎ T2T ¸ðµ¨ ¼³°è 236 7.1.1 T2T Æ®·£½ºÆ÷¸Ó ¸ðµ¨ÀÇ ºÎ»ó 237 7.1.2 ÀÛ¾÷-ƯÁ¤ Çü½Ä ´ë½Å Á¢µÎ»ç 239 7.1.3 T5 ¸ðµ¨ 241 7.2 T5¸¦ »ç¿ëÇÑ ÅؽºÆ® ¿ä¾à 243 ¸ñÂ÷ XIX 7.2.1 Hugging Face 243 7.2.2 T5-large Æ®·£½ºÆ÷¸Ó ¸ðµ¨ ÃʱâÈ­ 246 7.2.3 T5-large¿¡ ÀÇÇÑ ¹®¼­ ¿ä¾à 252 7.3 ¿ä¾à 258 7.4 Áú¹® 259 8Àå ÅäÅ©³ªÀÌÀú¿Í µ¥ÀÌÅͼ ¸ÅĪ 8.1 ÅäÅ©³ªÀÌÀú¿Í µ¥ÀÌÅͼ ¸ÅĪ 264 8.2 ÃÖ¼± °üÇà 265 8.1.2 Word2Vec ÅäÅ«È­ 270 8.2 ƯÁ¤ ¾îÈÖ¸¦ »ç¿ëÇÑ Ç¥ÁØ NLP ÀÛ¾÷ 282 8.2.1 GPT-2¿¡ ÀÇÇÑ ºñÁ¶°ÇºÎ »ùÇà »ý¼º 282 8.2.2 ÈÆ·ÃµÈ Á¶°ÇºÎ »ùÇà »ý¼º 288 8.3 T5 ±Ç¸®ÀåÀü »ùÇà 289 8.3.1 ±Ç¸®ÀåÀü ¿ä¾à 1 289 8.3.2 ±Ç¸®ÀåÀü ¿ä¾à 2 290 8.4 ¿ä¾à 292 8.5 Áú¹® 293 9Àå BERT ±â¹Ý Æ®·£½ºÆ÷¸Ó¸¦ »ç¿ëÇÑ ½Ã¸Çƽ ·Ñ ·¹ÀÌºí¸µ 9.1 SRL ½ÃÀÛÇϱâ 298 9.1.1 SRL Á¤ÀÇ 299 9.2.1 »çÀü ÈÆ·Ã BERT ±â¹Ý ¸ðµ¨ ½ÇÇà 301 9.2 BERT ±â¹Ý ¸ðµ¨À» »ç¿ëÇÑ SRL ½ÇÇè 304 9.3 ±âº» »ùÇà 304 9.3.1 »ùÇà 1 304 9.3.2 »ùÇà 2 306 ¸ñÂ÷ XX 9.3.3 »ùÇà 3 309 9.4 ¾î·Á¿î »ùÇõé 313 9.4.1 »ùÇà 4 313 9.4.2 »ùÇà 5 317 9.4.3 »ùÇà 6 319 9.5 ¿ä¾à 319 9.6 Áú¹® 320 10Àå µ¥ÀÌÅÍ°¡ ¸»ÇÏ°Ô Ç϶ó: À̾߱â, Áú¹®, ´äº¯ 10.1 ¹æ¹ý·Ð 326 10.1.1 Æ®·£½ºÆ÷¸Ó¿Í ¹æ¹ý 327 10.2 ¹æ¹ý 0: ½ÃÇàÂø¿À 329 10.3 ¹æ¹ý 1: NER first 332 10.3.1 Áú¹®À» ã±â À§ÇØ NER »ç¿ëÇϱâ 333 10.4 ¹æ¹ý 2: SRL first 340 10.4.1 ELECTRA¸¦ »ç¿ëÇÑ Áú¹®-´äº¯ 342 10.4.2 ÇÁ·ÎÁ§Æ® °ü¸® Á¦¾à 345 10.4.3 Áú¹®À» ã±â À§ÇØ SRL »ç¿ëÇϱâ 345 10.5 ´ÙÀ½ ´Ü°è 352 10.5.1 RoBERTa ¸ðµ¨·Î Haystack Ž±¸Çϱâ 354 10.6 ¿ä¾à 355 10.7 Áú¹® 356 11Àå ¿¹ÃøÀ» À§ÇÑ °í°´ °¨Á¤ °¨Áö 11.1 ½ÃÀÛÇϱâ: ¼¾Æ¼¸ÕÆ® ºÐ¼® Æ®·£½ºÆ÷¸Óµé 362 11.2 SST 362 11.2.1 RoBERTa-large¸¦ »ç¿ëÇÑ ¼¾Æ¼¸ÕÆ® ºÐ¼® 366 ¸ñÂ÷ XXI 11.3 ¼¾Æ¼¸ÕÆ® ºÐ¼®¿¡ ÀÇÇÑ °í°´ Çൿ ¿¹Ãø 368 11.3.1 DistillBERT¸¦ »ç¿ëÇÑ ¼¾Æ¼¸ÕÆ® ºÐ¼® 368 11.3.2 Hugging Face ¸ðµ¨ ¸ñ·ÏÀ» ÀÌ¿ëÇÑ ¼¾Æ¼¸ÕÆ® ºÐ¼® 371 11.4 ¿ä¾à 378 11.5 Áú¹® 379 12Àå Æ®·£½ºÆ÷¸Ó¿¡ ÀÇÇÑ °¡Â¥ ´º½º ºÐ¼® 12.1 °¡Â¥ ´º½º¿¡ ´ëÇÑ °¨Á¤Àû ¹ÝÀÀ 384 12.1.1 ÀÎÁö ºÒÇùÈ­°¡ °¨Á¤Àû ¹ÝÀÀÀ» ÃË¹ß 385 12.2 °¡Â¥ ´º½º¿¡ ´ëÇÑ ÇÕ¸®Àû Á¢±Ù ¹æ¹ý 394 12.2.1 °¡Â¥ ´º½º ÇØ°á ·Îµå¸Ê Á¤ÀÇ 395 12.2.2 Ãѱ⠱ÔÁ¦ 396 12.2.3 COVID-19¿Í Æ®·³ÇÁ Àü ´ëÅë·É Æ®À­ 408 12.3 ³ª°¡±â Àü¿¡ 412 12.3.1 ÀºÅºÈ¯À» ã¾Æ¼­ 412 12.3.2 ½Å·ÚÇÒ ¼ö ÀÖ´Â ÈÆ·Ã ¹æ¹ýÀ» ã¾Æ¼­ 413 12.4 ¿ä¾à 414 12.5 Áú¹® 415 ºÎ·Ï: Áú¹®¿¡ ´ëÇÑ ´ä 417 ã¾Æº¸±â

ÀúÀÚ
Denis Rothman
´ëÇ¥ÀÛÀ¸·Î ¡ºÀÚ¿¬¾î 󸮸¦ À§ÇÑ Æ®·£½ºÆ÷¸Ó¡»ÀÌ/°¡ ÀÖ´Ù.
   Artificial Intelligence By Example | Denis Rothman | Packt Publishing
   Hands-On Explainable AI (XAI) with Python | Denis Rothman | Packt Publishing
   ÇÚÁî¿Â ÆÄÀ̽ãÀ» ÀÌ¿ëÇÑ ¼³¸í°¡´ÉÇÑ AI(XAI) | Denis Rothman | DK·ÎµåºÏ½º
   Transformers for Natural Language Processing | Denis Rothman | Packt Publishing
   Transformers for Natural Language Processing and Computer Vision, 3/E(Paperback) | Denis Rothman | Packt Publishing

¿ªÀÚ
À¯ÇöÁß
´ëÇ¥ ¿ª¼­·Î ¡ºÆÄÀ̽㠰í±Þ µö·¯´×¡»ÀÌ ÀÖ´Ù.
   ÆÄÀ̽㠰í±Þ µö·¯´× | À¯ÇöÁß | È«¸ª

ÀÌ ÃâÆÇ»çÀÇ °ü·Ã»óÇ°
ÇÚÁî¿Â ÆÄÀ̽ãÀ» ÀÌ¿ëÇÑ ¼³¸í°¡´ÉÇÑ AI(XAI) | Denis Rothman,°íº´Ã¶,¹æ¿µ±Ô | DK·ÎµåºÏ½º
ÅÙ¼­Ç÷οì 2¿Í Äɶ󽺸¦ ÀÌ¿ëÇÑ °í±Þ µö·¯´× | Rowel Atienza,ÀÌÀ籤, ¹æ¿µ±Ô | DK·ÎµåºÏ½º
AWS ¸Ó½Å·¯´× ¸¶½ºÅÍÇϱâ | Saket S. R. Mengle,À¯ÇöÁß | DK·ÎµåºÏ½º
ÆÄÀÌÅäÄ¡ 1.X·Î ½ÃÀÛÇÏ´Â µö·¯´× | ºñ½´´© ¼öºê¶ó¸¶´Ï¾È,ÀÌÀ籤, ¹æ¿µ±Ô,·Î¶ó ¹Ìÿ, ½º¸®. ¿äÄɽà K.,ÀÌÀ籤, ¹æ¿µ±Ô | DK·ÎµåºÏ½º
Ŭ¶ó¿ìµå ¸ð¹ÙÀÏ ¹× ¿¡Áö ±â¹ÝÀÇ µö·¯´× ½Ç¿ë°¡À̵å | Siddha Ganju, Meher Kasam,½ÉÀçâ, ÀÌ¿µÇÐ, ÀÌÁ¤È¯, Á¤À±ÁÖ | DK·ÎµåºÏ½º

ÀÌ ºÐ¾ß ½Å°£ °ü·Ã»óÇ°
ÄËÆ® º¤ÀÇ Tidy First?: ´õ ³ªÀº ¼ÒÇÁÆ®¿þ¾î ¼³°è¸¦ À§ÇÑ 32°¡Áö ÄÚµå Á¤¸®¹ý | ÄËÆ® º¤,¾È¿µÈ¸ | ÇѺû¹Ìµð¾î
ÄÚµå ÀÛ¼º °¡À̵å | À̽ð¡¿Í ¹«³×Åä½Ã,Á¤±â¿í | ±æ¹þ
 
µµ¼­¸¦ ±¸ÀÔÇϽŠ°í°´ ¿©·¯ºÐµéÀÇ ¼­ÆòÀÔ´Ï´Ù.
ÀÚÀ¯·Î¿î ÀÇ°ß ±³È¯ÀÌ °¡´ÉÇÕ´Ï´Ù¸¸, ¼­ÆòÀÇ ¼º°Ý¿¡ ¸ÂÁö ¾Ê´Â ±ÛÀº »èÁ¦µÉ ¼ö ÀÖ½À´Ï´Ù.

µî·ÏµÈ ¼­ÆòÁß ºÐ¾ß¿Í »ó°ü¾øÀÌ ¸ÅÁÖ ¸ñ¿äÀÏ 5ÆíÀÇ ¿ì¼öÀÛÀ» ¼±Á¤ÇÏ¿©, S-Money 3¸¸¿øÀ» Àû¸³Çص帳´Ï´Ù.
ÃÑ 0°³ÀÇ ¼­ÆòÀÌ ÀÖ½À´Ï´Ù.