°£Æí°áÁ¦, ½Å¿ëÄ«µå û±¸ÇÒÀÎ
ÀÎÅÍÆÄÅ© ·Ôµ¥Ä«µå 5% (29,930¿ø)
(ÃÖ´ëÇÒÀÎ 10¸¸¿ø / Àü¿ù½ÇÀû 40¸¸¿ø)
ºÏÇǴϾð ·Ôµ¥Ä«µå 30% (22,050¿ø)
(ÃÖ´ëÇÒÀÎ 3¸¸¿ø / 3¸¸¿ø ÀÌ»ó °áÁ¦)
NH¼îÇÎ&ÀÎÅÍÆÄÅ©Ä«µå 20% (25,200¿ø)
(ÃÖ´ëÇÒÀÎ 4¸¸¿ø / 2¸¸¿ø ÀÌ»ó °áÁ¦)
Close

Çѱ¹¾î ÀÓº£µù : ÀÚ¿¬¾î ó¸® ¸ðµ¨ÀÇ ¼º´ÉÀ» ³ôÀÌ´Â ÇÙ½É ºñ°á Word2Vec¿¡¼­ ELMo, BERT±îÁö

¼Òµæ°øÁ¦

2013³â 9¿ù 9ÀÏ ÀÌÈÄ ´©Àû¼öÄ¡ÀÔ´Ï´Ù.

ÆǸÅÁö¼ö 62
?
ÆǸÅÁö¼ö¶õ?
»çÀÌÆ®ÀÇ ÆǸŷ®¿¡ ±â¹ÝÇÏ¿© ÆǸŷ® ÃßÀ̸¦ ¹Ý¿µÇÑ ÀÎÅÍÆÄÅ© µµ¼­¿¡¼­ÀÇ µ¶¸³ÀûÀÎ ÆǸŠÁö¼öÀÔ´Ï´Ù. ÇöÀç °¡Àå Àß Æȸ®´Â »óÇ°¿¡ °¡ÁßÄ¡¸¦ µÎ¾ú±â ¶§¹®¿¡ ½ÇÁ¦ ´©Àû ÆǸŷ®°ú´Â ´Ù¼Ò Â÷ÀÌ°¡ ÀÖÀ» ¼ö ÀÖ½À´Ï´Ù. ÆǸŷ® ¿Ü¿¡µµ ´Ù¾çÇÑ °¡ÁßÄ¡·Î ±¸¼ºµÇ¾î ÃÖ±ÙÀÇ À̽´µµ¼­ È®Àνà À¯¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù. ÇØ´ç Áö¼ö´Â ¸ÅÀÏ °»½ÅµË´Ï´Ù.
Close
°øÀ¯Çϱâ
Á¤°¡

35,000¿ø

  • 31,500¿ø (10%ÇÒÀÎ)

    1,750P (5%Àû¸³)

ÇÒÀÎÇýÅÃ
Àû¸³ÇýÅÃ
  • S-Point Àû¸³Àº ¸¶ÀÌÆäÀÌÁö¿¡¼­ Á÷Á¢ ±¸¸ÅÈ®Á¤ÇϽŠ°æ¿ì¸¸ Àû¸³ µË´Ï´Ù.
Ãß°¡ÇýÅÃ
¹è¼ÛÁ¤º¸
  • 3/29(±Ý) À̳» ¹ß¼Û ¿¹Á¤  (¼­¿ï½Ã °­³²±¸ »ï¼º·Î 512)
  • ¹«·á¹è¼Û
ÁÖ¹®¼ö·®
°¨¼Ò Áõ°¡
  • À̺¥Æ®/±âȹÀü

  • ¿¬°üµµ¼­

  • »óÇ°±Ç

AD

Ã¥¼Ò°³

ÀÚ¿¬¾î ó¸® ¸ðµ¨ÀÇ ¼º´ÉÀ» ³ôÀÌ´Â ÇÙ½É ºñ°á, ¡´Çѱ¹¾î ÀÓº£µù¡µ
ÀÓº£µù(embedding)Àº ÀÚ¿¬¾î¸¦ ¼ýÀÚÀÇ ³ª¿­ÀÎ º¤ÅÍ·Î ¹Ù²Û °á°ú ȤÀº ±× ÀÏ·ÃÀÇ °úÁ¤ Àüü¸¦ °¡¸®Å°´Â ¿ë¾î´Ù. ´Ü¾î³ª ¹®Àå °¢°¢À» º¤ÅÍ·Î º¯È¯ÇØ º¤ÅÍ °ø°£¿¡ '³¢¿ö ³Ö´Â´Ù(embed)'´Â ÃëÁö¿¡¼­ ÀÓº£µùÀ̶ó´Â À̸§ÀÌ ºÙ¾ú´Ù. ÄÄÇ»ÅÍ°¡ ÀÚ¿¬¾î¸¦ ó¸®ÇÒ ¼ö ÀÖ°Ô ÇÏ·Á¸é ÀÚ¿¬¾î¸¦ °è»ê °¡´ÉÇÑ Çü½ÄÀÎ ÀÓº£µùÀ¸·Î ¹Ù²ãÁà¾ß ÇÑ´Ù.
ÀÓº£µùÀº ÄÄÇ»ÅÍ°¡ ÀÚ¿¬¾î¸¦ ÀÌÇØÇϵµ·Ï Çϴ ù °ü¹®À¸·Î ¸Å¿ì Áß¿äÇÑ ±â´ÉÀ» ÇÑ´Ù. ÀÚ¿¬¾î ó¸® ¸ðµ¨ÀÇ ¼º´ÉÀº ÀÓº£µùÀÌ Á¿ìÇÑ´Ù°í Çصµ °ú¾ðÀÌ ¾Æ´Ï´Ù. ÀÌ Ã¥¿¡¼­´Â ´Ù¾çÇÑ ÀÓº£µù ±â¹ýÀ» ÀϺ°ÇÏ°í Çѱ¹¾î µ¥ÀÌÅÍ Àüó¸®, ÀÓº£µù ±¸Ãà¿¡ À̸£´Â Àü °úÁ¤À» Æ©Å丮¾ó ¹æ½ÄÀ¸·Î ¼Ò°³ÇÑ´Ù. Word2Vec µî ´Ü¾î ¼öÁØ ±â¹ýºÎÅÍ ELMo, BERT µî ¹®Àå ¼öÁØ ÀÓº£µù±îÁö ´Ù·é´Ù.

ÃâÆÇ»ç ¼­Æò

¡Ú ÀÌ Ã¥¿¡¼­ ´Ù·ç´Â ³»¿ë ¡Ú
¡á ÀÚ¿¬¾î ó¸®ÀÇ Ã¹ °ü¹®ÀÎ ÀÓº£µùÀÇ °³³ä°ú Á¾·ù, ¿ª»ç ¼Ò°³
¡á ÀÓº£µùÀÌ ¾î¶»°Ô ÀÚ¿¬¾î Àǹ̸¦ ÇÔÃàÇÏ´ÂÁö ÀÌ·ÐÀû ¹è°æ Ç®ÀÌ
¡á À§Å°¹é°ú, KorQuAD µî Çѱ¹¾î ¸»¹¶Ä¡ Àüó¸® ³ëÇÏ¿ì °øÀ¯
¡á KoNLPy, soynlp, ±¸±Û ¼¾ÅÙ½ºÇǽº(sentencepiece) ÆÐÅ°Áö ¾È³»
¡á Word2Vec, GloVe, FastText, Swivel µî ´Ü¾î ¼öÁØ ÀÓº£µù
¡á LDA, Doc2Vec, ELMo, BERT µî ¹®Àå ¼öÁØ ÀÓº£µù ¼³¸í
¡á °³º° ¸ðµ¨ ÇнÀ°ú µ¿ÀÛ °úÁ¤À» ÄÚµå ·¹º§·Î ¼³¸íÇÑ ÈÄ Æ©Å丮¾ó ÁøÇà
¡á ¹®¼­ ºÐ·ù ŽºÅ©¸¦ Áß½ÉÀ¸·Î ÀÓº£µù ÆÄÀÎÆ©´×(fine-tuning) ½Ç½À

¡Ú ÀÌ Ã¥ÀÇ ´ë»ó µ¶ÀÚ ¡Ú
¡á ÀÓº£µùÀÇ ÀÌ·ÐÀû ¹è°æ°ú µ¿ÀÛ ¿ø¸®¿¡ °ü½ÉÀÌ ¸¹Àº µ¥ÀÌÅÍ °úÇÐÀÚ
¡á ÀÚ¿¬¾î ºÐÆ÷¿Í ÀÇ¹Ì »çÀÌÀÇ °ü°è ÇظíÀ» Áß½ÃÇÏ´Â ¾ð¾îÇÐ ¿¬±¸ÀÚ
¡á Ç°Áú ÁÁÀº ÀÓº£µùÀ» Çö¾÷¿¡ Àû¿ëÇÏ·Á´Â ¸Ó½Å ·¯´× ¿£Áö´Ï¾î¿Í °³¹ßÀÚ

¡Ú ÀÌ Ã¥ÀÇ ±¸¼º ¡Ú
ÀÌ Ã¥Àº ´Ù¾çÇÑ ÀÓº£µù ±â¹ýÀ» ¼Ò°³ÇÑ´Ù. Å©°Ô ´Ü¾î ¼öÁØ ÀÓº£µù°ú ¹®Àå ¼öÁØ ÀÓº£µùÀ» ´Ù·é´Ù. °¢°¢ ´Ü¾î¿Í ¹®ÀåÀ» º¤ÅÍ·Î º¯È¯ÇÏ´Â ±â¹ýÀÌ´Ù. ¿©±â¼­ ¼³¸íÇÏ´Â ´Ü¾î ¼öÁØ ÀÓº£µùÀ¸·Î´Â Word2Vec, GloVe, FastText, Swivel µîÀÌ ÀÖ´Ù. ¹®Àå ¼öÁØ ÀÓº£µùÀº ELMo, BERT µîÀÌ ÀÖ´Ù.
ÀÌ Ã¥¿¡¼­´Â °¢ ÀÓº£µù ±â¹ýÀÇ ÀÌ·ÐÀû ¹è°æÀ» »ìÆ캻 ÈÄ Çѱ¹¾î ¸»¹¶Ä¡·Î ½ÇÁ¦ ÀÓº£µùÀ» ±¸ÃàÇÏ´Â °úÁ¤À» ¼³¸íÇÑ´Ù. °¢ ±â¹ýÀ» ¼³¸íÇÒ ¶§´Â °¡±ÞÀû ¿ø ³í¹®ÀÇ ¼ö½Ä°ú Ç¥±â¸¦ µû¸¥´Ù. ÄÚµå ¶ÇÇÑ ³í¹® ÀúÀÚÀÇ °ø½Ä ¸®Æ÷ÁöÅ͸®¿¡¼­ °¡Á®¿Í ¼Ò°³ÇÒ ¿¹Á¤ÀÌ´Ù.
¸»¹¶Ä¡ Àüó¸®(preprocess), ÀÓº£µù ÆÄÀÎ Æ©´×(fine-tuning) ¿ª½Ã ÀÌ Ã¥ÀÌ ´Ù·ç´Â Áß¿äÇÑ ÁÖÁ¦´Ù. ÀüÀÚ´Â ÀÓº£µù ±¸Ãà Àü¿¡, ÈÄÀÚ´Â ÀÓº£µù ±¸Ãà ÈÄ¿¡ °ÅÃÄ¾ß ÇÏ´Â °úÁ¤ÀÌ´Ù. Àüó¸®ÀÇ °æ¿ì KoNLPy, soynlp, ±¸±Û ¼¾ÅÙ½ºÇǽº(sentencepiece) µî ¿ÀǼҽº »ç¿ë¹ýÀ» ¼³¸íÇÑ´Ù. ±àÁ¤, ºÎÁ¤ µî ¹®¼­ÀÇ ±Ø¼º(polarity)À» ¿¹ÃøÇÏ´Â ¹®¼­ ºÐ·ù °úÁ¦¸¦ ¿¹·Î µé¾î ÀÓº£µùÀ» ÆÄÀÎ Æ©´×ÇÏ´Â ¹æ¹ýÀ» ½Ç½ÀÇÑ´Ù.

°¢ À庰 ÁÖ¿ä ³»¿ëÀº ´ÙÀ½°ú °°´Ù.
1Àå, '¼­·Ð'¿¡¼­´Â ÀÓº£µùÀÇ Á¤ÀÇ, ¿ª»ç¿Í Á¾·ù µîÀ» »ìÇÉ´Ù. µµÄ¿(docker) µî °³¹ß ȯ°æÀ» ±¸¼ºÇÏ´Â °úÁ¤ ¿ª½Ã ¼³¸íÇÑ´Ù.
2Àå, ¡®º¤ÅÍ°¡ ¾î¶»°Ô Àǹ̸¦ °¡Áö°Ô µÇ´Â°¡¡¯¿¡¼­´Â ÀÚ¿¬¾îÀÇ Àǹ̸¦ ÀÓº£µù¿¡ ¾î¶»°Ô ÇÔÃà½Ãų ¼ö ÀÖ´ÂÁö¿¡ ´ëÇÑ ³»¿ëÀ» ¼Ò°³ÇÑ´Ù. °¢ ÀÓº£µù ±â¹ýµéÀº Å©°í ÀÛÀº Â÷ÀÌ°¡ ÀÖÁö¸¸ ¸»¹¶Ä¡ÀÇ Åë°èÀû ÆÐÅÏ(statistical pattern) Á¤º¸¸¦ ¹Ý¿µÇÑ´Ù´Â Á¡¿¡¼­ °øÅëÁ¡À» Áö´Ñ´Ù´Â »ç½ÇÀ» ¤´Â´Ù.
3Àå, ¡®Çѱ¹¾î Àü󸮡¯¿¡¼­´Â ÀÓº£µù ÇнÀÀ» À§ÇÑ Çѱ¹¾î µ¥ÀÌÅÍÀÇ Àüó¸® °úÁ¤À» ´Ù·é´Ù. À¥ ¹®¼­³ª json ÆÄÀÏ °°Àº ÇüÅÂÀÇ µ¥ÀÌÅ͸¦ ¼ø¼ö ÅؽºÆ® ÆÄÀÏ·Î ¹Ù²Ù°í ¿©±â¿¡ ÇüÅÂ¼Ò ºÐ¼®À» ½Ç½ÃÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ¶ç¾î¾²±â ±³Á¤ µîµµ ¼Ò°³ÇÑ´Ù.
4Àå, ¡®´Ü¾î ¼öÁØ ÀÓº£µù¡¯¿¡¼­´Â ´Ù¾çÇÑ ´Ü¾î ¼öÁØ ÀÓº£µù ¸ðµ¨À» ¼³¸íÇÑ´Ù. NPLM, Word2Vec, FastText µîÀº ¿¹Ãø ±â¹Ý ¸ðµ¨, LSA, GloVe, Swivel µîÀº Çà·Ä ºÐÇØ(matrix factorization) ±â¹ÝÀÇ ±â¹ýµéÀÌ´Ù. °¡Áß ÀÓº£µù(weighted embedding)Àº ´Ü¾î ÀÓº£µùÀ» ¹®Àå ¼öÁØÀ¸·Î È®ÀåÇÏ´Â ¹æ¹ýÀÌ´Ù.
5Àå, ¡®¹®Àå ¼öÁØ ÀÓº£µù¡¯¿¡¼­´Â ¹®Àå ¼öÁØ ÀÓº£µùÀ» ´Ù·é´Ù. Çà·Ä ºÐÇØ(matrix factorization), È®·ü ¸ðÇü, ´º·² ³×Æ®¿öÅ© ±â¹Ý ¸ðµ¨ µî ¼¼ °¡Áö Á¾·ù¸¦ ¼Ò°³ÇÑ´Ù. ÀáÀç ÀÇ¹Ì ºÐ¼®(LSA)Àº Çà·Ä ºÐÇØ, ÀáÀç µð¸®Å¬·¹ ÇÒ´ç(LDA)Àº È®·ü ¸ðµ¨, Doc2Vec, ELMo, BERT µîÀº ´º·² ³×Æ®¿öÅ©°¡ Áß½ÉÀÎ ¹æ¹ýµéÀÌ´Ù. ƯÈ÷ BERT´Â ¼¿ÇÁ ¾îÅÙ¼Ç(self-attention) ±â¹ÝÀÇ Æ®·£½ºÆ÷¸Ó ³×Æ®¿öÅ©(transformer network)°¡ ±× »À´ë¸¦ ÀÌ·ç°í ÀÖ´Ù.
6Àå, ¡®ÀÓº£µù ÆÄÀÎ Æ©´×¡¯¿¡¼­´Â ´Ü¾î, ¹®Àå ¼öÁØ ÀÓº£µùÀ» ÆÄÀÎ Æ©´×ÇÏ´Â ¹æ¹ýÀ» ´Ù·é´Ù. ³×À̹ö ¿µÈ­ ¸®ºä ¸»¹¶Ä¡¸¦ °¡Áö°í ±Ø¼ºÀ» ºÐ·ùÇÏ´Â °úÁ¦¸¦ ¼öÇàÇÑ´Ù.
¡®ºÎ·Ï¡¯¿¡¼­´Â ÀÌ Ã¥À» ÀÌÇØÇÏ´Â µ¥ ÇÊ¿äÇÑ ±âÃÊ Áö½ÄÀ» °£·«ÇÏ°Ô »ìÆ캻´Ù. ¼±Çü´ë¼öÇÐ, È®·ü·Ð, ´º·² ³×Æ®¿öÅ©, ±¹¾îÇÐ µîÀÇ ÁÖ¿ä °³³äÀ» ¼³¸íÇÑ´Ù.

̵̧ȍ


ÄÄÇ»ÅÍ´Â ¡®°è»ê±â¡¯¿¡ ºÒ°úÇÏ´Ù. ÄÄÇ»ÅÍ´Â »ç¶÷ÀÇ ¸», Áï ÀÚ¿¬¾î(natural language)¸¦ ¹Ù·Î ÀÌÇØÇÒ ¼ö ¾ø´Ù. ÀÚ¿¬¾î¸¦ 100% ÀÌÇØÇÏ´Â ÀΰøÁö´ÉÀÌ µîÀåÇÏ´õ¶óµµ ±× ÀÌÇØ(understanding)ÀÇ º»ÁúÀº ¿¬»ê(computation)À̳ª ó¸®(processing)´Ù. ÄÄÇ»ÅÍ°¡ ÀÚ¿¬¾î¸¦ ó¸®ÇÒ ¼ö ÀÖ°Ô ÇÏ·Á¸é ÀÚ¿¬¾î¸¦ °è»ê °¡´ÉÇÑ Çü½ÄÀ¸·Î ¹Ù²ãÁà¾ß ÇÑ´Ù.
ÀÓº£µù(embedding)Àº ÀÚ¿¬¾î¸¦ ¼ýÀÚÀÇ ³ª¿­ÀÎ º¤ÅÍ(vector)·Î ¹Ù²Û °á°ú ȤÀº ±× ÀÏ·ÃÀÇ °úÁ¤ Àüü¸¦ °¡¸®Å°´Â ¿ë¾î´Ù. ´Ü¾î³ª ¹®Àå °¢°¢À» º¤ÅÍ·Î º¯È¯ÇØ º¤ÅÍ °ø°£(vector space)¿¡ ¡®³¢¿ö ³Ö´Â´Ù(embed)¡¯´Â ÃëÁö¿¡¼­ ÀÓº£µùÀ̶ó´Â À̸§ÀÌ ºÙ¾ú´Ù. ÄÄÇ»ÅÍ´Â ÀÓº£µùÀ» °è»ê, ó¸®ÇØ ÀÚ¿¬¾î Çü½ÄÀÇ ´äº¯À» Ãâ·ÂÇÔÀ¸·Î½á Àΰ£°ú »óÈ£ÀÛ¿ëÇÒ ¼ö ÀÖ°Ô µÈ´Ù. ±×·¸±â ¶§¹®¿¡ ÀÓº£µùÀº ÄÄÇ»ÅÍ°¡ ÀÚ¿¬¾î¸¦ ÀÌÇØÇϵµ·Ï Çϴ ù °ü¹®À¸·Î ¸Å¿ì Áß¿äÇÑ ±â´ÉÀ» ÇÑ´Ù.
ÀÓº£µù¿¡´Â ¸»¹¶Ä¡(corpus)ÀÇ ÀǹÌ, ¹®¹ý Á¤º¸°¡ ÀÀÃàµÅ ÀÖ´Ù. ÀÓº£µùÀº º¤ÅÍÀ̱⠶§¹®¿¡ »çÄ¢¿¬»êÀÌ °¡´ÉÇϸç, ´Ü¾î/¹®¼­ °ü·Ãµµ(relevance) ¿ª½Ã °è»êÇÒ ¼ö ÀÖ´Ù. ÃÖ±Ù µé¾î ÀÓº£µùÀÌ Áß¿äÇØÁø ÀÌÀ¯´Â µû·Î ÀÖ´Ù. ¹Ù·Î ÀüÀÌ ÇнÀ(transfer learning) ¶§¹®ÀÌ´Ù. ÀüÀÌ ÇнÀÀ̶õ ƯÁ¤ ¹®Á¦¸¦ Ç®±â À§ÇØ ÇнÀÇÑ ¸ðµ¨À» ´Ù¸¥ ¹®Á¦¸¦ Ǫ´Â µ¥ Àç»ç¿ëÇÏ´Â ±â¹ýÀ» ÀǹÌÇÑ´Ù. ¿¹ÄÁ´ë ´ë±Ô¸ð ¸»¹¶Ä¡¸¦ ¹Ì¸® ÇнÀ(pretrain)ÇÑ ÀÓº£µùÀ» ¹®¼­ ºÐ·ù ¸ðµ¨ÀÇ ÀԷ°ªÀ¸·Î ¾²°í, ÇØ´ç ÀÓº£µùÀ» Æ÷ÇÔÇÑ ¸ðµ¨ Àüü¸¦ ¹®¼­ ºÐ·ù °úÁ¦¸¦ ÀßÇÒ ¼ö ÀÖµµ·Ï ¾÷µ¥ÀÌÆ®(fine-tuning)ÇÏ´Â ¹æ½ÄÀÌ ¹Ù·Î ±×°ÍÀÌ´Ù. ¹°·Ð ÀüÀÌ ÇнÀÀº ¹®¼­ ºÐ·ù ÀÌ¿ÜÀÇ ´Ù¾çÇÑ ´Ù¸¥ °úÁ¦¿¡µµ Àû¿ëÇÒ ¼ö ÀÖ´Ù.
ÀüÀÌ ÇнÀ ȤÀº ÇÁ¸®Æ®·¹ÀÎ-ÆÄÀÎ Æ©´× ¸ÞÄ¿´ÏÁòÀº »ç¶÷ÀÇ ÇнÀ°ú ºñ½ÁÇÑ Á¡ÀÌ ÀÖ´Ù. »ç¶÷Àº ¹«¾ð°¡¸¦ ¹è¿ï ¶§ Á¦·Î º£À̽º¿¡¼­ ½ÃÀÛÇÏÁö ¾Ê´Â´Ù. »ç¶÷ÀÌ »õ·Î¿î »ç½ÇÀ» ºü¸£°Ô ÀÌÇØÇÒ ¼ö ÀÖ´Â ÀÌÀ¯´Â ±×°¡ ÀÌÇظ¦ ÇÏ´Â µ¥¿¡ Æò»ý ½×¾Æ ¿Â Áö½ÄÀ» µ¿¿øÇϱ⠶§¹®ÀÌ´Ù. ÀÚ¿¬¾î ó¸® ¸ðµ¨ ¿ª½Ã Á¦·Î¿¡¼­ ½ÃÀÛÇÏÁö ¾Ê´Â´Ù. ¿ì¼± ´ë±Ô¸ð ¸»¹¶Ä¡¸¦ ÇнÀ½ÃÄÑ ÀÓº£µùÀ» ¹Ì¸® ¸¸µé¾î ³õ´Â´Ù(ÇÁ¸®Æ®·¹ÀÎ). ÀÌ ÀÓº£µù¿¡´Â ÀǹÌ, ¹®¹ý Á¤º¸°¡ ³ì¾Æ ÀÖ´Ù. ÀÌÈÄ ÀÓº£µùÀ» Æ÷ÇÔÇÑ ¸ðµ¨ Àüü¸¦ ¹®¼­ ºÐ·ù °úÁ¦¿¡ ¸Â°Ô ¾÷µ¥ÀÌÆ®ÇÑ´Ù(ÆÄÀÎ Æ©´×). À̷νá ÀüÀÌ ÇнÀ ¸ðµ¨Àº Á¦·ÎºÎÅÍ ÇнÀÇÑ ¸ðµ¨º¸´Ù ¹®¼­ ºÐ·ù °úÁ¦¸¦ ºü¸£°Ô Àß ¼öÇàÇÒ ¼ö ÀÖ´Ù.
Ç°Áú ÁÁÀº ÀÓº£µùÀº Àß ´ã±Ù ±èÄ¡¿Í °°´Ù. ±èÄ¡ ¸ÀÀÌ ÁÁÀ¸¸é ¹°¸¸ ºÎ¾î ²úÀÎ ±èÄ¡Âî°³ ¸Àµµ ÁÁ´Ù. ÀÓº£µù Ç°ÁúÀÌ ÁÁÀ¸¸é ´Ü¼øÇÑ ¸ðµ¨·Îµµ ¿øÇÏ´Â ¼º´ÉÀ» ³¾ ¼ö ÀÖ´Ù. ¸ðµ¨ ±¸Á¶°¡ µ¿ÀÏÇÏ´Ù¸é ±× ¼º´ÉÀº ³ô°í ¼ö·Å(converge)Àº ºü¸£´Ù. ÀÚ¿¬¾î ó¸® ¸ðµ¨À» ¸¸µé°í ¼­ºñ½ºÇÒ ¶§ Áß¿äÇÑ ±¸¼º ¿ä¼Ò Çϳª¸¸ ²ÅÀ¸¶ó°í ÇÑ´Ù¸é, ³ª´Â ÁÖÀúÇÏÁö ¾Ê°í ¡®ÀÓº£µù¡¯À» ²ÅÀ» °ÍÀÌ´Ù. ELMo(Embeddings from Language Models), BERT(Bidirectional Encoder Representations from Transformer), GPT(Generative Pre-Training) µî ÀÚ¿¬¾î ó¸® ºÐ¾ß¿¡¼­ ´ç´ë ÃÖ°í ¼º´ÉÀ» ³»´Â ±â¹ýµéÀÌ ¸ðµÎ ÀüÀÌ ÇнÀ ȤÀº ÇÁ¸®Æ®·¹ÀÎ-ÆÄÀÎ Æ©´× ¸ÞÄ¿´ÏÁòÀ» »ç¿ëÇÏ´Â °ÍÀº ¿ì¿¬ÀÇ ÀÏÄ¡°¡ ¾Æ´Ï´Ù.
ÁÖÁöÇÏ´Ù½ÃÇÇ ÀÚ¿¬¾î ó¸® ºÐ¾ßÀÇ ´ë¼¼´Â ¿ÀǼҽº(open source)´Ù. ³í¹®Àº ¹°·Ð µ¥ÀÌÅÍ¿Í ÄÚµå±îÁö ¸ðµÎ¿¡°Ô °ø°³ÇÏ´Â °æ¿ì°¡ ´Ù¹Ý»ç´Ù. ´öºÐ¿¡ ¸ðµ¨ ¹ßÀü ¼Óµµ°¡ »ó»ó ÀÌ»óÀ¸·Î »¡¶óÁ³´Ù. ÃÖÃÊÀÇ ´º·² ³×Æ®¿öÅ© ±â¹Ý ÀÓº£µù ±â¹ýÀ¸·Î Æò°¡¹Þ´Â NPLM(Neural Probabilistic Language Model)ÀÌ 2003³â Á¦¾ÈµÈ ÀÌÈÄ 10³â ¸¸¿¡ ´Ü¾î ¼öÁØÀÇ ÀÓº£µù ±â¹ý Word2VecÀÌ ¹ßÇ¥µÆ´Ù. 5³â µÚ ¹®Àå ¼öÁØ ÀÓº£µù ±â¹ý ELMo°¡ °ø°³µÆ°í, °°Àº ÇØ GPT¿Í BERT°¡ µîÀåÇß´Ù. ÀÌÈÄ ¸ðµ¨µé¿¡ ´ëÇؼ­´Â ±âȸ°¡ µÈ´Ù¸é ÀÌ Ã¥ÀÇ 2ÆÇ¿¡¼­ ´Ù·ï¾ß ÇÒ °ÍÀÌ´Ù.
ÀÌ Ã¥¿¡¼­´Â NPLM, Word2Vec, FastText, ÀáÀç ÀÇ¹Ì ºÐ¼®(LSA), GloVe, Swivel µî 6°¡Áö ´Ü¾î ¼öÁØ ÀÓº£µù ±â¹ý, LSA, Doc2Vec, ÀáÀç µð¸®Å¬·¹ ÇÒ´ç(LDA), ELMo, BERT µî 5°¡Áö ¹®Àå ¼öÁØ ÀÓº£µù ±â¹ýÀ» ¼Ò°³ÇÑ´Ù. ÀÌ¿Ü¿¡µµ ´Ù¾çÇÑ ÀÓº£µù ±â¹ýÀÌ ÀÖÁö¸¸ µÎ °¡Áö ¿øÄ¢¿¡ ÀÔ°¢ÇØ ÀϺθ¸ °ñ¶ú´Ù. ¿ì¼± ¼º´ÉÀÌ ¾ÈÁ¤ÀûÀÌ°í ¶Ù¾î³ª Çö¾÷¿¡ ¹Ù·Î Àû¿ëÇغ½Á÷ÇÑ ±â¹ýÀ» ¼±ÅÃÇß´Ù. ¶Ç ÀÓº£µù ±â¹ýÀÇ ¹ßÀü ¾ç»óÀ» ÀÌÇØÇÏ´Â µ¥ Áß¿äÇÑ ¿ªÇÒÀ» ÇÏ´Â ¸ðµ¨À» Æ÷ÇÔÇß´Ù. ¡®Á¤º¸ÀÇ È«¼ö¡¯ ¼Ó¿¡¼­ »ì¾Æ°¡´Â µ¶Àڵ鿡°Ô Çٽɿ¡ ÇØ´çÇÏ´Â Áö½Ä¸¸À» ÀüÇØÁÖ°í ½Í¾ú±â ¶§¹®ÀÌ´Ù. ±âŸ ÀÓº£µù ±â¹ýµéÀº ´ëºÎºÐ, ÀÌ Ã¥¿¡¼­ ¼Ò°³ÇÏ´Â 11°³ ¸ðµ¨ÀÇ º¯Çü¿¡ ÇØ´çÇϱ⠶§¹®¿¡ µ¶ÀÚ ¿©·¯ºÐÀÌ Ãß°¡·Î °øºÎÇÏ°í ½ÍÀº ÃֽŠ±â¹ýÀÌ ÀÖ´Ù¸é ÀÌ Ã¥¿¡¼­ °¡Áö¸¦ ÃÄ ³ª°¡´Â ½ÄÀ¸·Î ÇнÀÇÏ¸é ¼ö¿ùÇÒ °ÍÀÌ´Ù.

¹Ú±Ôº´(Ä«Ä«¿Àºê·¹ÀÎ NLP ¿¬±¸¿ø)
óÀ½ ¸®ºä¸¦ ºÎŹ¹Þ°í ÀоîºÃÀ» ¶§°¡ »ý°¢³³´Ï´Ù. Ã¥À» ÆîÄ¡±â Àü¿¡´Â ¼ÖÁ÷È÷ ¾à°£ÀÇ ÀDZ¸½ÉÀÌ ÀÖ¾ú½À´Ï´Ù. ÇÑ ±ÇÀÇ Ã¥À¸·Î Ç®¾î³»±â¿¡´Â ÀÓº£µùÀÌ ´Ù¼Ò Çù¼ÒÇÑ ÁÖÁ¦°¡ ¾Æ´ÒÁö, Çѱ¹¾î¶ó´Â Àç·á¿Í °ü·Ã Áö¾î ¾î¶»°Ô ¼³¸íÇÒ ¼ö ÀÖÀ»Áö ¸»ÀÌÁö¿ä. ÇÏÁö¸¸ ¿ø°í¸¦ ÀÐ¾î ³ª°¡¸ç ÀDZ¸½ÉÀÌ ¸ðµÎ »ç¶óÁ³½À´Ï´Ù. ÀÌ Ã¥Àº ÀÓº£µùÀÇ °³³ä, ¼öÇÐÀû ¿ø¸®, Word2VecÀ̳ª FastText µî ´Ü¾î ÀÓº£µù ±â¹ý, ELMo³ª BERT µî ¹®Àå ÀÓº£µù ±â¹ý, ¶Ç ±¸Çö°ú ¿¹½Ã±îÁö °ü·Ã ³»¿ëµéÀ» ºüÁü¾øÀÌ Â¤¾î ³ª°©´Ï´Ù. Çѱ¹¾î 󸮿¡ ´ëÇÑ ÀåÀ» µû·Î ¸¶·ÃÇÏ°í À̸¦ ±â¹ÝÀ¸·Î ½ÇÁ¦ ÁöÀºÀÌ°¡ »õ·ÎÀÌ ±¸ÇöÇÑ ³»¿ëÀ» ¹ÙÅÁÀ¸·Î ¼³¸íÇÑ ³»¿ëµµ ÀλóÀûÀ̾ú½À´Ï´Ù. ¸¶Ä¡ ÀúÀÚ Á÷°­ ¼ö¾÷À» µè´Â µíÇß½À´Ï´Ù. óÀ½¿¡´Â °¡º­¿î ¸¶À½À¸·Î ÄÄÇ»ÅÍ È­¸éÀ¸·Î ¿ø°í¸¦ º¸°í ÀÖ¾ú´Âµ¥, ¾î´À ¼ø°£ ÀÌ ³»¿ëÀ» Á¾ÀÌÃ¥À¸·Î ¸¸³ª°í ½Í´Ù´Â »ý°¢ÀÌ ºÎ½ µé¾ú½À´Ï´Ù. ±×·±µ¥ µåµð¾î ±×³¯ÀÌ ¿À°Ô µÆ³×¿ä. ±â»Û ¸¶À½À¸·Î µ¶ÀÚ ¿©·¯ºÐ²² Ãßõµå¸³´Ï´Ù. ´õºÒ¾î ÁöÀºÀÌÀÇ °â¼ÕÇÏ°í ²Ä²ÄÇÑ ¼ºÇâÀÌ Ã¥ÀÇ ¿Ï¼ºµµ¸¦ ³ôÀÎ °ÍÀº ¹°·Ð, ÀÌ Ã¥ÀÇ »ý¸í·Â¿¡ Å« ±â¿©¸¦ ÇÒ °Í °°½À´Ï´Ù. ¿ø°í¸¦ ´Ù ÀÐÀº ´ÙÀ½ À̱ââ ´Ô¿¡°Ô ÀÌ·±Àú·± Á¦¾ÈÀ» µå¸®ÀÚ ÁøÁöÇÏ°í °âÇãÇÑ Åµµ·Î ÀúÀÇ Á¦¾ÈÀ» °ËÅäÇÏ°í ¿ø°í¸¦ º¸¿ÏÇϱâ À§ÇØ °í¹ÎÇÏ´Â °ÍÀ» ºÃ½À´Ï´Ù. ±× ¸¶À½ÀÌ °è¼Ó À̾îÁ® È£ÈíÀÌ ÂªÀº IT ÃâÆÇ ½ÃÀå¿¡¼­ ÀÌ Ã¥ÀÌ ½ºÅ׵𼿷¯°¡ µÇ±â¸¦ Èñ¸ÁÇÕ´Ï´Ù.

¹ÚÀºÁ¤(³×À̹ö ÆÄÆÄ°í Å×Å©¸®´õ)
ºòµ¥ÀÌÅÍÀÇ ½Ã´ë¶ó°í ÇÑ´Ù. ¾îµð¸¦ °¡µµ µ¥ÀÌÅÍ´Â ³ÑÃÄÈ带 °Í¸¸ °°´Ù. ÇÏÁö¸¸ ¸·»ó ³»°¡ °ü½É ÀÖ´Â ¿µ¿ªÀÌ »ý°Ü µ¥ÀÌÅ͸¦ ¾òÀ¸·Á°í Çϸé Á»Ã³·³ ã±â Èûµé´Ù. ¿µ¿ªÀ» Á¼È÷°í º¸¸é ºòµ¥ÀÌÅͶõ °ÍÀº Á¸ÀçÇÏÁö ¾Ê´Â´Ù.
°øºÎ ÀÚ·á ¿ª½Ã ¸¶Âù°¡Áö´Ù. ¼¼»ó¿¡ °øºÎ°Å¸®°¡ Â÷°í ³ÑÃļ­ ´õ ÀÌ»ó °øºÎ ȯ°æÀ» °¡Áö°í Åõ´ú°Å¸®¸é ¾È µÈ´Ù°í´Â ÇÏÁö¸¸, ¸·»ó ¼¼ºÎ ¿µ¿ªÀ¸·Î °¡¸é °ü·Ã ÀÚ·á°¡ Èñ¹ÚÇÏ´Ù. ±× ÀÚ·á°¡ Çѱ¹¾î·Î ¾²¿©Áø °ÍÀ̰ųª Çѱ¹¾î¿¡ ´ëÇÑ °ÍÀ̶ó¸é ´õ´õ¿í.
±×·±µ¥ ÀÌ Ã¥Àº ±× µÎ °¡Áö ¸ñ¸¶¸§À» ´Ù ä¿î´Ù. Çѱ¹¾î¿¡ ´ëÇÑ Çѱ¹¾î·Î ¾²ÀΠå. Çѱ¹¾î NLP¿¡ ´ëÇØ ¸ñ¸»¶ó Çß´ø »ç¶÷µé¿¡°Ô ´Üºñ °°Àº Á¸Àç°¡ ¾Æ´Ò ¼ö ¾ø´Ù. °Ô´Ù°¡ ±âÃÊÀûÀÎ °³³ä Çؼ®ºÎÅÍ ¾ÆÁÖ ÃÖ±ÙÀÇ ¿¬±¸ °á°ú±îÁöµµ ´ã°í ÀÖ¾î ±âº»±â¸¦ °®Ãá »ç¶÷»Ó¸¸ ¾Æ´Ï¶ó °æÇèÀÌ ¾î´À Á¤µµ ÀÖ´Â »ç¶÷µµ ¾ò¾î °¥ °ÍÀÌ Àִ åÀÌ´Ù. °¢Á¾ ¾Ë°í¸®Áò¿¡ ´ëÇÑ Çؼ®»Ó¸¸ ¾Æ´Ï¶ó ½Ç¹«¿¡ Àû¿ëÇÒ ¼ö ÀÖ°Ô ÄÚµå ½º´ÏÆêµµ ´ã°í ÀÖ¾î °øºÎÇÏ´Â Çлýµµ, ½Ç¹«¿¡ ÅõÀÔµÈ È¸»ç¿øµµ ¾ò¾î °¥ ³»¿ëÀÌ ¸¹À¸¸®¶ó Àå´ãÇÑ´Ù. ÀÌ·¸°Ô źźÇÑ Ã¥À» ½á ÁØ ÁöÀºÀÌ¿¡°Ô ¹«Ã´ °í¸¿´Ù.
ȤÀÚ´Â ÀÌ Ã¥ÀÇ Á¦¸ñ¸¸ º¸°í ¡®Çѱ¹¾î¡¯¿Í ¡®ÀÓº£µù¡¯ÀÇ ±³ÁýÇÕ¸¸ ´Ù·ê °Å¶ó°í ¿©±æ ¼ö ÀÖ´Ù. ÇÏÁö¸¸ °í¸¿°Ôµµ ¡®Çѱ¹¾î¡¯¿Í ¡®ÀÓº£µù¡¯ÀÇ ÇÕÁýÇÕÀ» ´Ù·é´Ù. µû¶ó¼­ µÑ Áß ÇÑÂÊ¿¡¸¸ °ü½É ÀÖ´Â »ç¶÷¿¡°Ôµµ À¯¿ëÇÏ´Ù. Çѱ¹¾î ºÐ¼®¿¡ °ü½ÉÀº Àִµ¥, ¾îµð¼­ºÎÅÍ ½ÃÀÛÇØ¾ß ÇÒÁö ¸ô¶ú´Ù¸é ÀÌ Ã¥À» ÃßõÇÑ´Ù. NLP °ü·Ã ÃֽŠ³í¹®À» ¿©·¯ ±Ç Á¢ÇßÁö¸¸ Á» ´õ °³³äÀ» ºÐ¸íÇÏ°Ô Àâ°í ½ÍÀº »ç¶÷¿¡°Ôµµ ÀÌ Ã¥À» ÃßõÇÑ´Ù.
(KoNLPy ÄÁÆ®¸®ºäÅÍ)

±èÇöÁß(¼­¿ï´ë °øÇйڻç)
ÁöÀºÀ̸¦ óÀ½ ¸¸³­ °÷Àº ÀÚ¿¬¾î 󸮸¦ °øºÎÇÏ´Â ÀÚ¸®¿´½À´Ï´Ù. Àú´Â À̱ââ ´ÔÀÇ ºí·Î±×¸¦ ÀÐÀ¸¸é¼­ ±×ÀÇ ÆÒÀÌ µÆ½À´Ï´Ù. ½ÀµæÇÑ Áö½ÄÀ» ³ª´©·Á´Â ¸¶À½»Ó¸¸ ¾Æ´Ï¶ó ½º½º·ÎÀÇ ¹ßÀüÀ» À§ÇØ ²ÙÁØÈ÷ ³ë·ÂÇÏ´Â ¸ð½À¿¡¼­ ¸¹Àº °ÍÀ» ¹è¿ï ¼ö ÀÖ¾ú½À´Ï´Ù. ÀÌ Ã¥ ¿ª½Ã ÀÓº£µùÀÇ °³³ä°ú »ç¿ë¹ýÀ» ¹è¿ï ¼ö ÀÖ´Â ÁÁÀº ÀÚ·á°¡ µÇ¸®¶ó »ý°¢ÇÕ´Ï´Ù.
ÃÖ±ÙÀÇ ÀÚ¿¬¾î ó¸®ÀÇ ¹ßÀüÀº Á¤º¸¸¦ Ç¥ÇöÇÏ´Â ¹æ½ÄÀÇ º¯È­¿¡ ±âÀÎÇÕ´Ï´Ù. º¤ÅÍ °ø°£¿¡¼­ ÀÛµ¿ÇÏ´Â ¸Ó½Å ·¯´× ¾Ë°í¸®ÁòÀ» Àß È°¿ëÇϱâ À§Çؼ­´Â º¤ÅÍ °ø°£¿¡¼­ÀÇ µ¥ÀÌÅÍÀÇ Ç¥Çö¹ý¿¡ ´ëÇØ ±í°Ô ¾Ë ÇÊ¿ä°¡ ÀÖ½À´Ï´Ù. ÀÌ Ã¥Àº ÀÓº£µùÀ̶ó ºÎ¸£´Â ÀÚ¿¬¾î ó¸® ºÐ¾ß¿¡¼­ÀÇ µ¥ÀÌÅÍ Ç¥Çö¹ý¿¡ ´ëÇÑ °³³ä, ¿ø¸®, ½Ç½ÀÀ» ÅëÇÑ ÇнÀÀÇ °æÇèÀÌ Àß Á¤¸®µÅ ÀÖ½À´Ï´Ù. ±×·¸±â ¶§¹®¿¡ ÀÓº£µù ±â¹Ý ÀÚ¿¬¾î ó¸® ¹æ¹ý¿¡ ÀÔ¹®ÇÏ´Â À̵éÀº °øºÎÀÇ ¹üÀ§¿Í ¿ì¼±¼øÀ§¿¡ ´ëÇÑ ¹æÇ⟸¦ ¾òÀ» ¼ö ÀÖÀ¸¸ç, ÀÚ¿¬¾î ó¸® ÇнÀÀڵ鵵 ÀÓº£µù Áö½ÄÀ» Á¤¸®ÇÒ ±âȸ¸¦ ¾òÀ» °ÍÀ̶ó »ý°¢ÇÕ´Ï´Ù.
ÀÌ Ã¥Àº °¢ ¾Ë°í¸®ÁòÀ» ÇнÀÇÏ°í È°¿ëÇÒ ¼ö ÀÖ´Â Äڵ带 Á¦°øÇÏ°í ÀÖ½À´Ï´Ù. ¸Ó½Å ·¯´×ÀÇ °øºÎ °úÁ¤¿¡´Â ¹Ýµå½Ã ½ÇÁ¦ µ¥ÀÌÅÍÀÇ Àû¿ë ¹× ÇнÀ °á°úÀÇ Å½»öÀÌ Æ÷ÇÔµÅ¾ß ÇÕ´Ï´Ù. ¶ÇÇÑ ºü¸£°Ô Çö¾÷¿¡ ¾Ë°í¸®ÁòÀ» Àû¿ëÇϱâ À§Çؼ­´Â »ç¿ëÇϱ⠽¬¿î Á¤¸®µÈ Äڵ尡 ÇÊ¿äÇÕ´Ï´Ù. ÀÌ Ã¥Àº ½ºÅ©¸³Æ® Çü½ÄÀ¸·Î ¼Õ½±°Ô »ç¿ëÇÒ ¼ö ÀÖ´Â ÄÚµå¿Í ¼¼ºÎ ÆÄÀ̽ã ÄÚµåµéÀ» ¸ðµÎ Á¦°øÇϱ⠶§¹®¿¡ ½Ç½À°ú Àû¿ëÀÌ ÇÊ¿äÇϽŠºÐ µé¿¡°Ôµµ Å« µµ¿òÀÌ µÉ °ÍÀ̶ó »ý°¢ÇÕ´Ï´Ù.
¾ðÁ¦³ª À̱ââ ´ÔÀ» ÀÀ¿øÇϸç, ±× °á½Ç °¡¿îµ¥ ÇϳªÀÎ ÀÌ Ã¥ÀÌ ÀÓº£µù°ú ÀÚ¿¬¾î 󸮸¦ °øºÎÇÏ´Â ºÐµé²² Å« µµ¿òÀÌ µÇ±æ ¹Ù¶ø´Ï´Ù.
(soynlp ¸ÞÀÎ ÄÁÆ®¸®ºäÅÍ, ÅؽºÆ®¸¶ÀÌ´× ºí·Î±×(lovit.github.io) ¿î¿µ)

¸ñÂ÷

1Àå. ¼­·Ð
1.1 ÀÓº£µùÀ̶õ
1.2 ÀÓº£µùÀÇ ¿ªÇÒ
1.2.1 ´Ü¾î/¹®Àå °£ °ü·Ãµµ °è»ê
1.2.2 ÀǹÌ/¹®¹ý Á¤º¸ ÇÔÃà
1.2.3 ÀüÀÌ ÇнÀ
1.3 ÀÓº£µù ±â¹ýÀÇ ¿ª»ç¿Í Á¾·ù
1.3.1 Åë°è ±â¹Ý¿¡¼­ ´º·² ³×Æ®¿öÅ© ±â¹ÝÀ¸·Î
1.3.2 ´Ü¾î ¼öÁØ¿¡¼­ ¹®Àå ¼öÁØÀ¸·Î
1.3.3 ·ê ¡æ ¿£µåÅõ¿£µå ¡æ ÇÁ¸®Æ®·¹ÀÎ/ÆÄÀÎ Æ©´×
1.3.4 ÀÓº£µùÀÇ Á¾·ù¿Í ¼º´É
1.4 °³¹ß ȯ°æ
1.4.1 ȯ°æ ¼Ò°³
1.4.2 AWS ±¸¼º
1.4.3 ÄÚµå ½ÇÇà
1.4.4 ¹ö±× ¸®Æ÷Æ® ¹× Q&A
1.4.5 ÀÌ Ã¥ÀÌ µµ¿ò¹Þ°í ÀÖ´Â ¿ÀǼҽºµé
1.5 ÀÌ Ã¥ÀÌ ´Ù·ç´Â µ¥ÀÌÅÍ¿Í ÁÖ¿ä ¿ë¾î
1.6 ÀÌ ÀåÀÇ ¿ä¾à
1.7 Âü°í ¹®Çå

2Àå. º¤ÅÍ°¡ ¾î¶»°Ô Àǹ̸¦ °¡Áö°Ô µÇ´Â°¡
2.1 ÀÚ¿¬¾î °è»ê°ú ÀÌÇØ
2.2 ¾î¶² ´Ü¾î°¡ ¸¹ÀÌ ¾²¿´´Â°¡
2.2.1 ¹é¿Àºê¿öÁî °¡Á¤
2.2.2 TF-IDF
2.2.3 Deep Averaging Network
2.3 ´Ü¾î°¡ ¾î¶² ¼ø¼­·Î ¾²¿´´Â°¡
2.3.1 Åë°è ±â¹Ý ¾ð¾î ¸ðµ¨
2.3.2 ´º·² ³×Æ®¿öÅ© ±â¹Ý ¾ð¾î ¸ðµ¨
2.4 ¾î¶² ´Ü¾î°¡ °°ÀÌ ¾²¿´´Â°¡
2.4.1 ºÐÆ÷ °¡Á¤
2.4.2 ºÐÆ÷¿Í ÀÇ¹Ì (1): ÇüżÒ
2.4.3 ºÐÆ÷¿Í ÀÇ¹Ì (2): Ç°»ç
2.4.4 Á¡º° »óÈ£ Á¤º¸·®
2.4.5 Word2Vec
2.5 ÀÌ ÀåÀÇ ¿ä¾à
2.6 Âü°í ¹®Çå

3Àå. Çѱ¹¾î Àüó¸®
3.1 µ¥ÀÌÅÍ È®º¸
3.1.1 Çѱ¹¾î À§Å°¹é°ú
3.1.2 KorQuAD
3.1.3 ³×À̹ö ¿µÈ­ ¸®ºä ¸»¹¶Ä¡
3.1.4 Àüó¸® ¿Ï·áµÈ µ¥ÀÌÅÍ ´Ù¿î·Îµå
3.2 Áöµµ ÇнÀ ±â¹Ý ÇüÅÂ¼Ò ºÐ¼®
3.2.1 KoNLPy »ç¿ë¹ý
3.2.2 KoNLPy ³» ºÐ¼®±âº° ¼º´É Â÷ÀÌ ºÐ¼®
3.2.3 Khaiii »ç¿ë¹ý
3.2.4 ÀºÀüÇÑ´Ø¿¡ »ç¿ëÀÚ »çÀü Ãß°¡Çϱâ
3.3 ºñÁöµµ ÇнÀ ±â¹Ý ÇüÅÂ¼Ò ºÐ¼®
3.3.1 soynlp ÇüÅÂ¼Ò ºÐ¼®±â
3.3.2 ±¸±Û ¼¾ÅÙ½ºÇǽº
3.3.3 ¶ç¾î¾²±â ±³Á¤
3.3.4 ÇüÅÂ¼Ò ºÐ¼® ¿Ï·áµÈ µ¥ÀÌÅÍ ´Ù¿î·Îµå
3.4 ÀÌ ÀåÀÇ ¿ä¾à
3.5 Âü°í ¹®Çå

4Àå. ´Ü¾î ¼öÁØ ÀÓº£µù
4.1 NPLM
4.1.1 ¸ðµ¨ ±âº» ±¸Á¶
4.1.2 NPLMÀÇ ÇнÀ
4.1.3 NPLM°ú ÀÇ¹Ì Á¤º¸
4.2 Word2Vec
4.2.1 ¸ðµ¨ ±âº» ±¸Á¶
4.2.2 ÇнÀ µ¥ÀÌÅÍ ±¸Ãà
4.2.3 ¸ðµ¨ ÇнÀ
4.2.4 Æ©Å丮¾ó
4.3 FastText
4.3.1 ¸ðµ¨ ±âº» ±¸Á¶
4.3.2 Æ©Å丮¾ó
4.3.3 ÇÑ±Û ÀÚ¼Ò¿Í FastText
4.4 ÀáÀç ÀÇ¹Ì ºÐ¼®
4.4.1 PPMI Çà·Ä
4.4.2 Çà·Ä ºÐÇØ·Î ÀÌÇØÇÏ´Â ÀáÀç ÀÇ¹Ì ºÐ¼®
4.4.3 Çà·Ä ºÐÇØ·Î ÀÌÇØÇÏ´Â Word2Vec
4.4.4 Æ©Å丮¾ó
4.5 GloVe
4.5.1 ¸ðµ¨ ±âº» ±¸Á¶
4.5.2 Æ©Å丮¾ó
4.6 Swivel
4.6.1 ¸ðµ¨ ±âº» ±¸Á¶
4.6.2 Æ©Å丮¾ó
4.7 ¾î¶² ´Ü¾î ÀÓº£µùÀ» »ç¿ëÇÒ °ÍÀΰ¡
4.7.1 ´Ü¾î ÀÓº£µù ´Ù¿î·Îµå
4.7.2 ´Ü¾î À¯»çµµ Æò°¡
4.7.3 ´Ü¾î À¯Ãß Æò°¡
4.7.4 ´Ü¾î ÀÓº£µù ½Ã°¢È­
4.8 °¡Áß ÀÓº£µù
4.8.1 ¸ðµ¨ °³¿ä
4.8.2 ¸ðµ¨ ±¸Çö
4.8.3 Æ©Å丮¾ó
4.9 ÀÌ ÀåÀÇ ¿ä¾à
4.10 Âü°í ¹®Çå

5Àå. ¹®Àå ¼öÁØ ÀÓº£µù
5.1 ÀáÀç ÀÇ¹Ì ºÐ¼®
5.2 Doc2Vec
5.2.1 ¸ðµ¨ °³¿ä
5.2.2 Æ©Å丮¾ó
5.3 ÀáÀç µð¸®Å¬·¹ ÇÒ´ç
5.3.1 ¸ðµ¨ °³¿ä
5.3.2 ¾ÆÅ°ÅØó
5.3.3 LDA¿Í ±é½º »ùÇøµ
5.3.4 Æ©Å丮¾ó
5.4 ELMo
5.4.1 ¹®ÀÚ ´ÜÀ§ ÄÁº¼·ç¼Ç ·¹À̾î
5.4.2 ¾ç¹æÇâ LSTM, ½ºÄÚ¾î ·¹À̾î
5.4.3 ELMo ·¹À̾î
5.4.4 ÇÁ¸®Æ®·¹ÀÎ Æ©Å丮¾ó
5.5 Æ®·£½ºÆ÷¸Ó ³×Æ®¿öÅ©
5.5.1 Scaled Dot-Product Attention
5.5.2 ¸ÖƼÇìµå ¾îÅÙ¼Ç
5.5.3 Position-wise Feed-Forward Networks
5.5.4 Æ®·£½ºÆ÷¸ÓÀÇ ÇнÀ Àü·«
5.6 BERT
5.6.1 BERT, ELMo, GPT
5.6.2 ÇÁ¸®Æ®·¹ÀΠŽºÅ©¿Í ÇнÀ µ¥ÀÌÅÍ ±¸Ãà
5.6.3 BERT ¸ðµ¨ÀÇ ±¸Á¶
5.6.4 ÇÁ¸®Æ®·¹ÀÎ Æ©Å丮¾ó
5.7 ÀÌ ÀåÀÇ ¿ä¾à
5.8 Âü°í ¹®Çå

6Àå. ÀÓº£µù ÆÄÀÎ Æ©´×
6.1 ÇÁ¸®Æ®·¹Àΰú ÆÄÀÎ Æ©´×
6.2 ºÐ·ù¸¦ À§ÇÑ ÆÄÀÌÇÁ¶óÀÎ ¸¸µé±â
6.3 ´Ü¾î ÀÓº£µù È°¿ë
6.3.1 ³×Æ®¿öÅ© °³¿ä
6.3.2 ³×Æ®¿öÅ© ±¸Çö
6.3.3 Æ©Å丮¾ó
6.4 ELMo È°¿ë
6.4.1 ³×Æ®¿öÅ© °³¿ä
6.4.2 ³×Æ®¿öÅ© ±¸Çö
6.4.3 Æ©Å丮¾ó
6.5 BERT È°¿ë
6.5.1 ³×Æ®¿öÅ© °³¿ä
6.5.2 ³×Æ®¿öÅ© ±¸Çö
6.5.3 Æ©Å丮¾ó
6.6 ¾î¶² ¹®Àå ÀÓº£µùÀ» »ç¿ëÇÒ °ÍÀΰ¡
6.7 ÀÌ ÀåÀÇ ¿ä¾à
6.8 Âü°í ¹®Çå

ºÎ·Ï
ºÎ·Ï A. ¼±Çü´ë¼öÇÐ ±âÃÊ
1.1 º¤ÅÍ, Çà·Ä ¿¬»ê
1.2 ³»Àû°ú °øºÐ»ê
1.3 ³»Àû°ú »ç¿µ
1.4 ³»Àû°ú ¼±Çüº¯È¯
1.5 Çà·Ä ºÐÇØ ±â¹Ý Â÷¿ø Ãà¼Ò (1): ÁÖ¼ººÐ ºÐ¼®(PCA)
1.6 Çà·Ä ºÐÇØ ±â¹Ý Â÷¿ø Ãà¼Ò (2): ƯÀÌ°ª ºÐÇØ(SVD)

ºÎ·Ï B. È®·ü·Ð ±âÃÊ
2.1 È®·üº¯¼ö¿Í È®·ü ºÐÆ÷
2.2 º£ÀÌÁö¾È È®·ü·Ð

ºÎ·Ï C. ´º·² ³×Æ®¿öÅ© ±âÃÊ
3.1 DAG·Î ÀÌÇØÇÏ´Â ´º·² ³×Æ®¿öÅ©
3.2 ´º·² ³×Æ®¿öÅ©´Â È®·ü¸ðµ¨ÀÌ´Ù
3.3 ÃÖ´ë¿ìµµÃßÁ¤°ú ÇнÀ ¼Õ½Ç
3.4 ±×·¡µð¾ðÆ® µð¼¾Æ®
3.5 °è»ê ³ëµåº° ¿ªÀüÆÄ
3.6 CNN°ú RNN

ºÎ·Ï D. ±¹¾îÇÐ ±âÃÊ
4.1 Åë»ç ´ÜÀ§
4.2 ¹®Àå À¯Çü
4.3 Ç°»ç
4.4 »ó°ú ½ÃÁ¦
4.5 ÁÖÁ¦
4.6 ³ôÀÓ
4.7 ¾çÅÂ
4.8 Àǹ̿ª
4.9 Çǵ¿
4.10 »çµ¿
4.11 ºÎÁ¤

ºÎ·Ï E. Âü°í ¹®Çå

°ü·ÃÀ̹ÌÁö

ÀúÀÚ¼Ò°³

À̱ââ [Àú] ½ÅÀ۾˸² SMS½Åû
»ý³â¿ùÀÏ -

ÀúÀÚ À̱ââÀº ¼­¿ï´ëÇб³ ±¹¾î±¹¹®Çаú¸¦ Á¹¾÷ÇÏ°í °í·Á´ëÇб³ ´ëÇпø¿¡¼­ °øÇÐ ¼®»ç ÇÐÀ§(»ê¾÷°æ¿µ°øÇÐ)¸¦ ÃëµæÇß´Ù. ¹®Àå ¹üÁÖ ºÐ·ù¿¡ Å« ¿µÇâÀ» ¹ÌÄ¡´Â ´Ü¾îµé¿¡ ³ôÀº Á¡¼ö¸¦ ÁÖ´Â ±â¹ý¿¡ ´ëÇÑ ³í¹®(SCI Àú³Î °ÔÀç)¿¡ 1ÀúÀÚ·Î Âü¿©Çß´Ù. ÇöÀç ³×À̹ö¿¡¼­ ´ëÈ­ ¸ðµ¨À» °³¹ßÇÏ°í ÀÖ´Ù. ÁÖ¿ä ¾÷¹«´Â ÀÓº£µù ÇнÀ ¹× ±¸ÃàÀÌ´Ù. ¹®Àå »ý¼º(text generation)¿¡ °ü½ÉÀÌ ¸¹´Ù. ÀÚ¿¬¾î 󸮸¦ ÁÖÁ¦·Î ºí·Î±×(http://ratsgo.github.io)¸¦ ¿î¿µÇÏ°í ÀÖ´Ù. µö·¯´×°ú ÀÚ¿¬¾î ó¸®ÀÇ ¹«±Ã¹«ÁøÇÑ °¡´É¼ºÀ» ¹Ï´Â´Ù.

Àü°øµµ¼­/´ëÇб³Àç ºÐ¾ß¿¡¼­ ¸¹Àº ȸ¿øÀÌ ±¸¸ÅÇÑ Ã¥

    ¸®ºä

    0.0 (ÃÑ 0°Ç)

    100ÀÚÆò

    ÀÛ¼º½Ã À¯ÀÇ»çÇ×

    ÆòÁ¡
    0/100ÀÚ
    µî·ÏÇϱâ

    100ÀÚÆò

    9.7
    (ÃÑ 0°Ç)

    ÆǸÅÀÚÁ¤º¸

    • ÀÎÅÍÆÄÅ©µµ¼­¿¡ µî·ÏµÈ ¿ÀǸ¶ÄÏ »óÇ°Àº ±× ³»¿ë°ú Ã¥ÀÓÀÌ ¸ðµÎ ÆǸÅÀÚ¿¡°Ô ÀÖÀ¸¸ç, ÀÎÅÍÆÄÅ©µµ¼­´Â ÇØ´ç »óÇ°°ú ³»¿ë¿¡ ´ëÇØ Ã¥ÀÓÁöÁö ¾Ê½À´Ï´Ù.

    »óÈ£

    (ÁÖ)±³º¸¹®°í

    ´ëÇ¥ÀÚ¸í

    ¾Èº´Çö

    »ç¾÷ÀÚµî·Ï¹øÈ£

    102-81-11670

    ¿¬¶ôó

    1544-1900

    ÀüÀÚ¿ìÆíÁÖ¼Ò

    callcenter@kyobobook.co.kr

    Åë½ÅÆǸž÷½Å°í¹øÈ£

    01-0653

    ¿µ¾÷¼ÒÀçÁö

    ¼­¿ïƯº°½Ã Á¾·Î±¸ Á¾·Î 1(Á¾·Î1°¡,±³º¸ºôµù)

    ±³È¯/ȯºÒ

    ¹ÝÇ°/±³È¯ ¹æ¹ý

    ¡®¸¶ÀÌÆäÀÌÁö > Ãë¼Ò/¹ÝÇ°/±³È¯/ȯºÒ¡¯ ¿¡¼­ ½Åû ¶Ç´Â 1:1 ¹®ÀÇ °Ô½ÃÆÇ ¹× °í°´¼¾ÅÍ(1577-2555)¿¡¼­ ½Åû °¡´É

    ¹ÝÇ°/±³È¯°¡´É ±â°£

    º¯½É ¹ÝÇ°ÀÇ °æ¿ì Ãâ°í¿Ï·á ÈÄ 6ÀÏ(¿µ¾÷ÀÏ ±âÁØ) À̳»±îÁö¸¸ °¡´É
    ´Ü, »óÇ°ÀÇ °áÇÔ ¹× °è¾à³»¿ë°ú ´Ù¸¦ °æ¿ì ¹®Á¦Á¡ ¹ß°ß ÈÄ 30ÀÏ À̳»

    ¹ÝÇ°/±³È¯ ºñ¿ë

    º¯½É ȤÀº ±¸¸ÅÂø¿À·Î ÀÎÇÑ ¹ÝÇ°/±³È¯Àº ¹Ý¼Û·á °í°´ ºÎ´ã
    »óÇ°À̳ª ¼­ºñ½º ÀÚüÀÇ ÇÏÀÚ·Î ÀÎÇÑ ±³È¯/¹ÝÇ°Àº ¹Ý¼Û·á ÆǸÅÀÚ ºÎ´ã

    ¹ÝÇ°/±³È¯ ºÒ°¡ »çÀ¯

    ·¼ÒºñÀÚÀÇ Ã¥ÀÓ ÀÖ´Â »çÀ¯·Î »óÇ° µîÀÌ ¼Õ½Ç ¶Ç´Â ÈÑ¼ÕµÈ °æ¿ì
    (´ÜÁö È®ÀÎÀ» À§ÇÑ Æ÷Àå ÈѼÕÀº Á¦¿Ü)

    ·¼ÒºñÀÚÀÇ »ç¿ë, Æ÷Àå °³ºÀ¿¡ ÀÇÇØ »óÇ° µîÀÇ °¡Ä¡°¡ ÇöÀúÈ÷ °¨¼ÒÇÑ °æ¿ì
    ¿¹) È­ÀåÇ°, ½ÄÇ°, °¡ÀüÁ¦Ç°(¾Ç¼¼¼­¸® Æ÷ÇÔ) µî

    ·º¹Á¦°¡ °¡´ÉÇÑ »óÇ° µîÀÇ Æ÷ÀåÀ» ÈѼÕÇÑ °æ¿ì
    ¿¹) À½¹Ý/DVD/ºñµð¿À, ¼ÒÇÁÆ®¿þ¾î, ¸¸È­Ã¥, ÀâÁö, ¿µ»ó È­º¸Áý

    ·½Ã°£ÀÇ °æ°ú¿¡ ÀÇÇØ ÀçÆǸŰ¡ °ï¶õÇÑ Á¤µµ·Î °¡Ä¡°¡ ÇöÀúÈ÷ °¨¼ÒÇÑ °æ¿ì

    ·ÀüÀÚ»ó°Å·¡ µî¿¡¼­ÀÇ ¼ÒºñÀÚº¸È£¿¡ °üÇÑ ¹ý·üÀÌ Á¤ÇÏ´Â ¼ÒºñÀÚ Ã»¾àöȸ Á¦ÇÑ ³»¿ë¿¡ ÇØ´çµÇ´Â °æ¿ì

    »óÇ° Ç°Àý

    °ø±Þ»ç(ÃâÆÇ»ç) Àç°í »çÁ¤¿¡ ÀÇÇØ Ç°Àý/Áö¿¬µÉ ¼ö ÀÖÀ½

    ¼ÒºñÀÚ ÇÇÇغ¸»ó
    ȯºÒÁö¿¬¿¡ µû¸¥ ¹è»ó

    ·»óÇ°ÀÇ ºÒ·®¿¡ ÀÇÇÑ ±³È¯, A/S, ȯºÒ, Ç°Áúº¸Áõ ¹× ÇÇÇغ¸»ó µî¿¡ °üÇÑ »çÇ×Àº ¼ÒºñÀÚºÐÀïÇØ°á ±âÁØ (°øÁ¤°Å·¡À§¿øȸ °í½Ã)¿¡ ÁØÇÏ¿© 󸮵Ê

    ·´ë±Ý ȯºÒ ¹× ȯºÒÁö¿¬¿¡ µû¸¥ ¹è»ó±Ý Áö±Þ Á¶°Ç, ÀýÂ÷ µîÀº ÀüÀÚ»ó°Å·¡ µî¿¡¼­ÀÇ ¼ÒºñÀÚ º¸È£¿¡ °üÇÑ ¹ý·ü¿¡ µû¶ó ó¸®ÇÔ

    (ÁÖ)KGÀ̴Ͻýº °áÁ¦´ë±Ý¿¹Ä¡¾÷ µî·Ï¹øÈ£: 02-006-00013

    (ÁÖ)ÀÎÅÍÆÄÅ©Ä¿¸Ó½º´Â ȸ¿ø´ÔµéÀÇ ¾ÈÀü°Å·¡¸¦ À§ÇØ ±¸¸Å±Ý¾×, °áÁ¦¼ö´Ü¿¡ »ó°ü¾øÀÌ (ÁÖ)ÀÎÅÍÆÄÅ©Ä¿¸Ó½º¸¦ ÅëÇÑ
    ¸ðµç °Å·¡¿¡ ´ëÇÏ¿© (ÁÖ)KGÀ̴Ͻýº°¡ Á¦°øÇÏ´Â ±¸¸Å¾ÈÀü¼­ºñ½º¸¦ Àû¿ëÇÏ°í ÀÖ½À´Ï´Ù.
    µî·Ï ¿©ºÎ´Â e-±ÝÀ¶¹Î¿ø¼¾ÅÍ È¨ÆäÀÌÁö(www.fcsc.kr)ÀÇ µî·Ï¡¤½Å°í>ÀüÀÚ±ÝÀ¶¾÷µî·ÏÇöȲ ¸Þ´º¿¡¼­ È®ÀÎÇÏ½Ç ¼ö ÀÖ½À´Ï´Ù. ¼­ºñ½º °¡ÀÔ»ç½Ç È®ÀÎ

    ¹è¼Û¾È³»

    • ±³º¸¹®°í »óÇ°Àº Åùè·Î ¹è¼ÛµÇ¸ç, Ãâ°í¿Ï·á 1~2Àϳ» »óÇ°À» ¹Þ¾Æ º¸½Ç ¼ö ÀÖ½À´Ï´Ù.

    • Ãâ°í°¡´É ½Ã°£ÀÌ ¼­·Î ´Ù¸¥ »óÇ°À» ÇÔ²² ÁÖ¹®ÇÒ °æ¿ì Ãâ°í°¡´É ½Ã°£ÀÌ °¡Àå ±ä »óÇ°À» ±âÁØÀ¸·Î ¹è¼ÛµË´Ï´Ù.

    • ±ººÎ´ë, ±³µµ¼Ò µî ƯÁ¤±â°üÀº ¿ìü±¹ Åù踸 ¹è¼Û°¡´ÉÇÕ´Ï´Ù.

    • ¹è¼Ûºñ´Â ¾÷ü ¹è¼Ûºñ Á¤Ã¥¿¡ µû¸¨´Ï´Ù.

    • - µµ¼­ ±¸¸Å ½Ã 15,000¿ø ÀÌ»ó ¹«·á¹è¼Û, 15,000¿ø ¹Ì¸¸ 2,500¿ø - »óÇ°º° ¹è¼Ûºñ°¡ ÀÖ´Â °æ¿ì, »óÇ°º° ¹è¼Ûºñ Á¤Ã¥ Àû¿ë