°£Æí°áÁ¦, ½Å¿ëÄ«µå û±¸ÇÒÀÎ
ÀÎÅÍÆÄÅ© ·Ôµ¥Ä«µå 5% (42,750¿ø)
(ÃÖ´ëÇÒÀÎ 10¸¸¿ø / Àü¿ù½ÇÀû 40¸¸¿ø)
ºÏÇǴϾð ·Ôµ¥Ä«µå 30% (31,500¿ø)
(ÃÖ´ëÇÒÀÎ 3¸¸¿ø / 3¸¸¿ø ÀÌ»ó °áÁ¦)
NH¼îÇÎ&ÀÎÅÍÆÄũīµå 20% (36,000¿ø)
(ÃÖ´ëÇÒÀÎ 4¸¸¿ø / 2¸¸¿ø ÀÌ»ó °áÁ¦)
Close

ºòµ¥ÀÌÅÍ ºÐ¼®À» À§ÇÑ ½ºÄ®¶ó¿Í ½ºÆÄÅ© : ´ë¿ë·® ºòµ¥ÀÌÅÍ ºÐ¼®°ú ¸Ó½Å ·¯´×±îÁö Ȱ¿ëÇÏ´Â

¿øÁ¦ : Scala and Spark for Big Data Analytics: Tame big data with Scala and Apache Spark!
¼Òµæ°øÁ¦

2013³â 9¿ù 9ÀÏ ÀÌÈÄ ´©Àû¼öÄ¡ÀÔ´Ï´Ù.

ÆÇ¸ÅÁö¼ö 305
?
ÆÇ¸ÅÁö¼ö¶õ?
»çÀÌÆ®ÀÇ ÆÇ¸Å·®¿¡ ±â¹ÝÇÏ¿© ÆÇ¸Å·® ÃßÀ̸¦ ¹Ý¿µÇÑ ÀÎÅÍÆÄÅ© µµ¼­¿¡¼­ÀÇ µ¶¸³ÀûÀÎ ÆÇ¸Å Áö¼öÀÔ´Ï´Ù. ÇöÀç °¡Àå Àß ÆÈ¸®´Â »óǰ¿¡ °¡ÁßÄ¡¸¦ µÎ¾ú±â ¶§¹®¿¡ ½ÇÁ¦ ´©Àû ÆÇ¸Å·®°ú´Â ´Ù¼Ò Â÷À̰¡ ÀÖÀ» ¼ö ÀÖ½À´Ï´Ù. ÆÇ¸Å·® ¿Ü¿¡µµ ´Ù¾çÇÑ °¡ÁßÄ¡·Î ±¸¼ºµÇ¾î ÃÖ±ÙÀÇ À̽´µµ¼­ È®Àνà À¯¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù. ÇØ´ç Áö¼ö´Â ¸ÅÀÏ °»½ÅµË´Ï´Ù.
Close
°øÀ¯Çϱâ

2019³â ´ëÇѹα¹Çмú¿ø ¿ì¼öÇмúµµ¼­ ¼±Á¤µµ¼­

Á¤°¡

50,000¿ø

  • 45,000¿ø (10%ÇÒÀÎ)

    2,500P (5%Àû¸³)

ÇÒÀÎÇýÅÃ
Àû¸³ÇýÅÃ
  • I-Point Àû¸³Àº Ãâ°í¿Ï·á ÈÄ 14ÀÏ À̳» ¸¶ÀÌÆäÀÌÁö¿¡¼­ Àû¸³¹Þ±âÇÑ °æ¿ì¸¸ Àû¸³µË´Ï´Ù.
Ãß°¡ÇýÅÃ
¹è¼ÛÁ¤º¸
ÁÖ¹®¼ö·®
°¨¼Ò Áõ°¡
  • À̺¥Æ®/±âȹÀü

  • ¿¬°üµµ¼­(53)

  • »çÀºÇ°(4)

ÃâÆÇ»ç ¼­Æò

½ºÆÄÅ©¸¦ ÀÌ¿ëÇØ µ¥ÀÌÅÍ ºÐ¼® ¹æ¹ýÀ» ¹è¿ì·Á´Â »ç¶÷¿¡°Ô ¸Å¿ì À¯¿ëÇÑ Ã¥ÀÌ´Ù. °¡Àå ¸ÕÀú ½ºÄ®¶ó¸¦ ¼Ò°³Çϰí, ½ºÄ®¶ó ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ß¿¡ ÇÊ¿äÇÑ °´Ã¼ÁöÇâ °³³ä°ú ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö °³³äÀ» ¼³¸íÇÑ´Ù. ½ºÆÄÅ©¿¡ ÃÊÁ¡À» ¸ÂÃç RDD¿Í µ¥ÀÌÅÍ ÇÁ·¹ÀÓÀ» »ç¿ëÇÑ ±âº» Ãß»óÈ­¸¦ ´Ù·é´Ù.
±× ´ÙÀ½ ½ºÆÄÅ© SQL, GraphX, ½ºÆÄÅ© ±¸Á¶È­ ½ºÆ®¸®¹ÖÀ» »ç¿ëÇØ ±¸Á¶È­µÈ µ¥ÀÌÅÍ¿Í ±¸Á¶È­µÇÁö ¾ÊÀº µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ°í ¸ð´ÏÅ͸µ, ¼³Á¤, µð¹ö±ë, Å×½ºÆÃ, ¹èÆ÷¿Í °°Àº °í±Þ ÁÖÁ¦¸¦ »ìÆìº»´Ù. ¶ÇÇÑ SparkR ¹× PySpark API¸¦ »ç¿ëÇÑ ½ºÆÄÅ© ¾ÖÇø®ÄÉÀ̼ÇÀ» °³¹ßÇÏ´Â ¹æ¹ý, ¾ÆÆÄÄ¡ Á¦Çø°(Zeppelin)À» »ç¿ëÇÑ ´ëÈ­½Ä µ¥ÀÌÅÍ ºÐ¼®, Alluxio¸¦ ÇÔ²² »ç¿ëÇØ Àθ޸𸮠µ¥ÀÌÅ͸¦ ó¸®ÇÏ´Â ¹æ¹ýÀ» ´Ù·é´Ù.
ÀÌ Ã¥À» ´Ù »ìÆìº» ÈÄ, ½ºÆÄÅ©¸¦ ¿Ïº®ÇÏ°Ô ÀÌÇØÇϰí Ç® ½ºÅà µ¥ÀÌÅÍ ºÐ¼®À» ¼öÇàÇÒ ¼ö ÀÖÀ» °ÍÀÌ´Ù. ÀÌ Ã¥Àº ÃֽŠ2.3.2 ¹öÀüÀ» ±âÁØÀ¸·Î ÀÛ¼ºµÆ´Ù. ±âÁ¸ÀÇ ¿ø¼­¿¡¼­ Á¦°øÇÏ´Â ÄÚµåÀÇ ¿ÀŸ¿Í ȣȯ¼ºÀ» ¼öÁ¤ÇÑ ¿Å±äÀÌÀÇ github ÀúÀå¼Ò¸¦ Á¦°øÇÑ´Ù.

ÀÌ Ã¥¿¡¼­ ´Ù·ç´Â ³»¿ë

¡á ½ºÄ®¶óÀÇ °´Ã¼ÁöÇâ °³³ä°ú ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö °³³ä ÀÌÇØ
¡á ½ºÄ®¶ó Ä÷º¼Ç API ÀÌÇØ
¡á ½ºÆÄÅ©ÀÇ ÇÙ½É Ãß»óÈ­¸¦ ¾Ë±â À§ÇØ RDD¿Í µ¥ÀÌÅÍ ÇÁ·¹ÀÓÀ¸·Î ÀÛ¾÷Çϱâ
¡á ½ºÆÄÅ© SQL°ú GraphX¸¦ »ç¿ëÇØ ±¸Á¶ µ¥ÀÌÅÍ¿Í ±¸Á¶È­µÇÁö ¾ÊÀº µ¥ÀÌÅÍ ºÐ¼®
¡á ½ºÆÄÅ© ±¸Á¶È­ ½ºÆ®¸®¹ÖÀ» »ç¿ëÇØ È®Àå °¡´ÉÇÏ°í ³»°áÇÔ¼º ÀÖ´Â ½ºÆ®¸®¹Ö ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ß
¡á ½ºÆÄÅ© MLlib°ú ½ºÆÄÅ© ML¿¡¼­ ¸¹ÀÌ »ç¿ëµÇ´Â ¾Ë°í¸®ÁòÀ¸·Î ¿¹Ãø ¸ðµ¨À» ±¸ÃàÇÒ ¼ö ÀÖ´Â ºÐ·ù, ȸ±Í ºÐ¼®, Â÷¿ø °¨¼Ò, Ãßõ ½Ã½ºÅÛ°ú °°Àº ¸Ó½Å ·¯´× ¸ð¹ü »ç·Ê
¡á ¹æ´ëÇÑ ¾çÀÇ µ¥ÀÌÅ͸¦ Ŭ·¯½ºÅ͸µÇϴ Ŭ·¯½ºÅ͸µ ¸ðµ¨ ±¸Ãà
¡á ½ºÆÄÅ© ¾ÖÇø®ÄÉÀÌ¼Ç Æ©´×, µð¹ö±ë, ¸ð´ÏÅ͸µ ÀÌÇØ
¡á ½ÇÁ¦ µ¶¸³Çü(Standalone), ¸Þ¼Ò½º(Mesos), ¾á(YARN), Äí¹ö³×Ƽ½º(Kubernetes) ¸ðµåÀÇ Å¬·¯½ºÅÍ¿¡ ½ºÆÄÅ© ¾ÖÇø®ÄÉÀÌ¼Ç ¹èÆ÷

ÀÌ Ã¥ÀÇ ´ë»ó µ¶ÀÚ

½ºÆÄÅ©¸¦ ÀÌ¿ëÇØ µ¥ÀÌÅÍ ºÐ¼® ¹æ¹ýÀ» ¹è¿ì·Á´Â »ç¶÷¿¡°Ô ¸Å¿ì À¯¿ëÇÑ Ã¥ÀÌ´Ù. ½ºÆÄÅ©³ª ½ºÄ®¶ó¿¡ ´ëÇÑ Áö½ÄÀº ¾ø´õ¶óµµ ÀÌÀü ÇÁ·Î±×·¡¹Ö °æÇè(ƯÈ÷ ´Ù¸¥JVM ¾ð¾î)ÀÌ ÀÖ´Ù¸é ½ºÆÄÅ©³ª ½ºÄ®¶ó¿¡ ´ëÇÑ °³³äÀ» ÀÌÇØÇÏ´Â µ¥ ¸Å¿ì À¯¿ëÇÏ´Ù.
½ºÄ®¶ó´Â Áö³­ ¸î ³â µ¿¾È ƯÈ÷ µ¥ÀÌÅÍ °úÇаú ºÐ¼® ºÐ¾ß¿¡¼­ ²ÙÁØÈ÷ Áõ°¡Çϰí ÀÖ´Ù. ½ºÆÄÅ©´Â ½ºÄ®¶ó·Î ÀÛ¼ºµÆ°í ºÐ¼® ºÐ¾ß¿¡¼­ ³Î¸® »ç¿ëµÇ°í ÀÖ´Ù. ÀÌ Ã¥Àº ºòµ¥ÀÌÅ͸¦ Àß ´Ù·ê ¼ö ÀÖ´Â ½ºÆÄÅ©¸¦ ¼³¸íÇÑ´Ù.

ÀÌ Ã¥ÀÇ ±¸¼º

1Àå, '½ºÄ®¶ó ¼Ò°³'¿¡¼­´Â ½ºÆÄÅ©ÀÇ ½ºÄ®¶ó ±â¹Ý API¸¦ »ç¿ëÇØ ºòµ¥ÀÌÅ͸¦ ºÐ¼®ÇÑ´Ù. ½ÃÀÛÁ¡À¸·Î ½ºÆÄÅ© ³»ºÎ°¡ ½ºÄ®¶ó·Î ÀÛ¼ºµÆÀ½À» ¼³¸íÇϰí ÀÚ¿¬½º·´°Ô ½ºÄ®¶óÀÇ ¿ª»ç, ¸ñÀû, À©µµ¿ì/¸®´ª½º/¸ÆOS¿¡ ½ºÄ®¶ó¸¦ ¼³Ä¡ÇÏ´Â ¹æ¹ý°ú °°Àº ±âº» ³»¿ë µî ½ºÄ®¶ó¿¡ ´ëÇØ °£´ÜÈ÷ ¼³¸íÇÑ´Ù. ±×¸®°í ½ºÄ®¶ó À¥ ÇÁ·¹ÀÓ¿öÅ©¿¡ ´ëÇØ °£·«È÷ ¼³¸íÇÑ´Ù. ±×´ÙÀ½ ÀÚ¹Ù¿Í ½ºÄ®¶ó¸¦ ºñ±³ ºÐ¼®ÇÑ´Ù. ¸¶Áö¸·¿¡ ½ºÄ®¶ó¸¦ ½ÃÀÛÇϱâ À§ÇØ ½ºÄ®¶ó ÇÁ·Î±×·¡¹ÖÀ» »ìÆìº»´Ù.
2Àå, '°´Ã¼ÁöÇâ ¾ð¾î, ½ºÄ®¶ó'¿¡¼­´Â °´Ã¼ÁöÇâ ÇÁ·Î±×·¡¹Ö(OOP) ÆÐ·¯´ÙÀÓÀÌ ¿ÏÀüÈ÷ »õ·Î¿î Ãß»óÈ­ °èÃþÀ» Á¦°øÇÑ´Ù°í ¼³¸íÇÑ´Ù. °£´ÜÈ÷ ¸»ÇØ OOP ¾ð¾îÀÇ °¡Àå Å« ÀåÁ¡ÀΠŽ»ö °¡´É¼º,¸ðµâ¼º, È®À强À» ¼³¸íÇÑ´Ù. ƯÈ÷ ½ºÄ®¶ó¿¡¼­ º¯¼ö¸¦ ó¸®ÇÏ´Â ¹æ¹ýÀ» »ìÆìº»´Ù. ½ºÄ®¶ó¿¡¼­ º¯¼ö, ¸Þ¼Òµå, Ŭ·¡½º, °´Ã¼»Ó ¾Æ´Ï¶ó ÆÐŰÁö, ÆÐŰÁö °´Ã¼, Æ®·¹ÀÌÆ®, Æ®·¹ÀÌÆ® ¼±ÇüÈ­, ÀÚ¹Ù¿ÍÀÇ »óÈ£ ȣȯ¼º µîÀ» ´Ù·é´Ù.
3Àå, 'ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö °³³ä'¿¡¼­´Â ½ºÄ®¶óÀÇ ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö °³³äÀ» ¼Ò°³ÇÑ´Ù. ½ºÄ®¶ó°¡ µ¥ÀÌÅÍ °úÇÐÀÚ¿¡°Ô ¹«±â°¡ µÇ´Â ÀÌÀ¯, ½ºÆÄÅ© ÆÐ·¯´ÙÀÓ/¼ø¼ö ÇÔ¼ö/°íÂ÷ ÇÔ¼ö¸¦ ¹è¿ì´Â °ÍÀÌ Áß¿äÇÑ ÀÌÀ¯¿Í °°Àº ¸î °¡Áö ÁÖÁ¦¸¦ ´Ù·é´Ù. °íÂ÷ ÇÔ¼ö¸¦ »ç¿ëÇÏ´Â ½ÇÁ¦ »ç¿ë »ç·Êµµ ÇÔ²² ¼Ò°³ÇÑ´Ù. ±×´ÙÀ½ ½ºÄ®¶ó Ç¥ÁØ ¶óÀ̺귯¸®¸¦ »ç¿ëÇØ Ä÷º¼Ç ¿ÜºÎÀÇ °íÂ÷ ÇÔ¼ö¿¡¼­ ¿¹¿Ü¸¦ ó¸®ÇÏ´Â ¹æ¹ýÀ» »ìÆìº»´Ù. ¸¶Áö¸·À¸·Î ÇÔ¼öÇü ½ºÄ®¶ó°¡ °´Ã¼ÀÇ °¡º¯¼º¿¡ ¾î¶² ¿µÇâÀ» ÁÖ´ÂÁö »ìÆìº»´Ù.
4Àå, 'Ä÷º¼Ç API'¿¡¼­´Â ½ºÄ®¶ó »ç¿ëÀÚ°¡ °¡Àå Å« Èï¹Ì¸¦ ¾ò´Â ±â´É Áß ÇϳªÀÎ Ä÷º¼Ç API¸¦ ¼Ò°³ÇÑ´Ù. ½ºÄ®¶ó Ä÷º¼Ç API´Â ¸Å¿ì °­·ÂÇϰí À¯¿¬ÇÏ¸ç °áÇÕµÈ ¸¹Àº ¿¬»êÀ» °®°í ÀÖ´Ù. ±×¸®°í ½ºÄ®¶ó Ä÷º¼Ç APIÀÇ ±â´ÉÀ» ¼Ò°³ÇÒ »Ó ¾Æ´Ï¶ó ´Ù¾çÇÑ Å¸ÀÔÀÇ µ¥ÀÌÅ͸¦ ¼ö¿ëÇÏ°í ´Ù¾çÇÑ ¹®Á¦¸¦ ÇØ°áÇÒ ¶§ Ä÷º¼Ç APIÀÇ »ç¿ë ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù. ¸¶Áö¸·À¸·Î ½ºÄ®¶ó Ä÷º¼Ç API, ŸÀÔ°ú °èÃþ ±¸Á¶, ¼º´É Ư¼º, ÀÚ¹Ù »óÈ£¿î¿ë¼º, ½ºÄ®¶ó ¾Ï½Ã¸¦ ¼³¸íÇÑ´Ù.
5Àå, '½ºÆÄÅ©·Î ºòµ¥ÀÌÅÍ ´Ù·ç±â'¿¡¼­´Â µ¥ÀÌÅÍ ºÐ¼®°ú ºòµ¥ÀÌÅÍ¿¡ ´ëÇØ ¼³¸íÇÑ´Ù. ºòµ¥ÀÌÅÍ¿¡¼­ Á¦±âµÇ´Â µµÀü °úÁ¦, ºÐ»ê ÄÄÇ»ÆÃ ó¸® ¹æ¹ý, ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö Á¢±Ù ¹æ½ÄÀ» »ìÆìº»´Ù. ±¸±ÛÀÇ ¸Ê¸®µà½º, ¾ÆÆÄÄ¡ ÇϵÓ, ¾ÆÆÄÄ¡ ½ºÆÄÅ©¸¦ ¼Ò°³Çϰí, ÇØ´ç ¿ÀǼҽºÀÇ Á¢±Ù ¹æ¹ý°ú ±â¼úÀÇ »ç¿ë ¹æ¹ýÀ» »ìÆìº»´Ù. ¾ÆÆÄÄ¡ ½ºÆÄÅ©°¡ óÀ½ ¸¸µé¾îÁ³´ø ÀÌÀ¯¿Í ºòµ¥ÀÌÅÍ ºÐ¼® ¹× ó¸® ½Ã ºÎµúÇû´ø µµÀü °úÁ¦ µî ¾ÆÆÄÄ¡ ½ºÆÄÅ©ÀÇ ÁøÈ­ °úÁ¤À» »ìÆìº»´Ù.
6Àå, '½ºÆÄÅ©·Î REPL°ú RDD·Î ÀÛ¾÷'¿¡¼­´Â ½ºÆÄÅ© ÀÛµ¿ ¹æ¹ýÀ» ´Ù·é´Ù. ±×´ÙÀ½ ¾ÆÆÄÄ¡ ½ºÆÄÅ©ÀÇ ±âº» Ãß»óÈ­ÀÎ RDD¸¦ ¼Ò°³ÇÏ°í ´Ü¼øÈ÷ ½ºÄ®¶ó¿Í À¯»çÇÑ API¸¦ Á¦°øÇÏ´Â ºÐ»ê Ä÷º¼ÇÀÎÁö È®ÀÎÇÑ´Ù. ¾ÆÆÄÄ¡ ½ºÆÄÅ©ÀÇ ¹èÆ÷ ¿É¼ÇÀ» »ìÆìº¸°í ½ºÆÄÅ© ¼ÐÀ» »ç¿ëÇØ ·ÎÄÿ¡¼­ ½ÇÇàÇÑ´Ù. ¾ÆÆÄÄ¡ ½ºÆÄÅ©ÀÇ ³»ºÎ ±¸Á¶, RDDÀÇ °³³ä, DAG, RDD °èº¸, Æ®·£½ºÆ÷¸ÞÀ̼Ç, ¾×¼ÇÀ» ´Ù·é´Ù.
7Àå, 'Ư¼ö RDD ¿¬»ê'¿¡¼­´Â ´Ù¾çÇÑ ¿ä±¸ »çÇ×À» RDD°¡ ¾î¶»°Ô ÃæÁ·½ÃŰ´ÂÁö, ¾î¶»°Ô RDD°¡ »õ·Î¿î ±â´É(À§Ç輺µµ °®°í ÀÖ´Ù)À» Á¦°øÇÏ´ÂÁö¿¡ ´ëÇØ ÁßÁ¡ÀûÀ¸·Î ´Ù·é´Ù. ¶ÇÇÑ ºê·Îµåij½ºÆ® º¯¼ö¿Í ½ºÆÄÅ©¿¡¼­ Á¦°øÇÏ´Â ´©»ê±â¿Í °°Àº À¯¿ëÇÑ °´Ã¼¸¦ »ìÆìº»´Ù. ¸¶Áö¸·À¸·Î ¼ÅÇøµ°ú Áý°è¸¦ ´Ù·é´Ù.
8Àå, '½ºÆÄÅ© SQL'¿¡¼­´Â RDDÀÇ ÇÏÀÌ·¹º§ Ãß»óÈ­ÀÎ ½ºÆÄÅ© SQL·Î ±¸Á¶È­µÈ µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ´Â ¹æ¹ý°ú ½ºÆÄÅ© SQL API·Î ±¸Á¶È­µÈ µ¥ÀÌÅ͸¦ °£´ÜÇϸ鼭µµ °ß°íÇÏ°Ô Äõ¸®ÇÏ´Â ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù. ¶ÇÇÑ µ¥ÀÌÅͼÂÀ» ¼Ò°³ÇÏ°í µ¥ÀÌÅͼÂ, µ¥ÀÌÅÍ ÇÁ·¹ÀÓ, RDD °£ÀÇ Â÷ÀÌÁ¡À» »ìÆìº»´Ù. ¸¶Áö¸·À¸·Î µ¥ÀÌÅÍ ÇÁ·¹ÀÓ API¸¦ »ç¿ëÇØ º¹ÀâÇÑ µ¥ÀÌÅÍ ºÐ¼®À» ¼öÇàÇÒ ¼ö ÀÖ´Â Á¶ÀÎ ¿¬»ê°ú À©µµ¿ì ÇÔ¼ö¸¦ »ìÆìº»´Ù.
9Àå, '½ºÆÄÅ© ½ºÆ®¸®¹Ö'¿¡¼­´Â ½ºÆÄÅ© ½ºÆ®¸®¹ÖÀ» ¼Ò°³Çϰí, ½ºÆÄÅ© API¸¦ »ç¿ëÇØ µ¥ÀÌÅÍ ½ºÆ®¸²À» ½ºÆÄÅ© ½ºÆ®¸®¹ÖÀ¸·Î ó¸®ÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ¶ÇÇÑ Æ®À§ÅÍ¿¡ ±ÛÀ» Æ®À­Çϰí ó¸®ÇÏ´Â ½ÇÁ¦ »ç·Ê¸¦ »ç¿ëÇØ¼­ ½Ç½Ã°£ µ¥ÀÌÅÍ ½ºÆ®¸²À» ó¸®ÇÏ´Â ´Ù¾çÇÑ ¹æ¹ýÀ» ´Ù·é´Ù. ½Ç½Ã°£ 󸮸¦ À§ÇØ ¾ÆÆÄÄ¡ Ä«ÇÁÄ«¿Í ÅëÇÕÇÏ´Â ¹æ¹ýµµ »ìÆìº»´Ù. ¸¶Áö¸·À¸·Î ¾ÖÇø®ÄÉÀ̼ǿ¡¼­ ½Ç½Ã°£ Äõ¸®¸¦ Á¦°øÇÒ ¼ö ÀÖ´Â ±¸Á¶È­ ½ºÆ®¸®¹ÖÀ» »ìÆìº»´Ù.
10Àå, 'GraphX'¿¡¼­´Â ±×·¡ÇÁ¸¦ »ç¿ëÇØ ¾ó¸¶³ª ¸¹Àº ½ÇÁ¦ ¹®Á¦¸¦ ¸ðµ¨¸µÇϰí ÇØ°áÇÒ ¼ö ÀÖ´ÂÁö »ìÆìº»´Ù. ÆäÀ̽ººÏÀ» ¿¹·Î µé¾î ±×·¡ÇÁ ÀÌ·Ð, ½ºÆÄÅ©ÀÇ ±×·¡ÇÁ ó¸® ¶óÀ̺귯¸® GraphX, VertexRDD¿Í EdgeRDD, ±×·¡ÇÁ ¿¬»êÀÚ, aggregateMessages, triangleCount, Pregel API, ÆäÀÌÁö·©Å© ¾Ë°í¸®Áò°ú °°Àº »ç¿ë »ç·Ê¸¦ »ìÆìº»´Ù.
11Àå, '¸Ó½Å ·¯´× ÇнÀ: ½ºÆÄÅ© MLlib°ú ML'¿¡¼­´Â Åë°è ¸Ó½Å ·¯´×¿¡ ´ëÇÑ °³³äÀûÀÎ ¼Ò°³¸¦ Á¦°øÇÑ´Ù. ½ºÆÄÅ©ÀÇ ¸Ó½Å ·¯´× APIÀÎ ½ºÆÄÅ© MLlib°ú ½ºÆÄÅ© MLÀ» ÁýÁßÀûÀ¸·Î ´Ù·é´Ù. µð½ÃÀü Æ®¸®(decision tree)¿Í ·£´ý Æ÷·¹½ºÆ® ¾Ë°í¸®Áò(random forest algorithm)À» ÀÌ¿ëÇÑ ºÐ·ù ÀÛ¾÷À» ÇØ°áÇÏ´Â ¹æ¹ý°ú ¼±Çü ȸ±Í ¾Ë°í¸®ÁòÀ» ÀÌ¿ëÇÑ È¸±Í ¹®Á¦¸¦ ÇØ°áÇÑ´Ù.
¶ÇÇÑ ºÐ·ù ¸ðµ¨À» ÈÆ·ÃÇϱâ Àü¿¡ ÇÇó ÃßÃâ¿¡¼­ ¿øÇÖ(one-hot) ÀÎÄÚµù°ú Â÷¿ø Ãà¼Ò ¾Ë°í¸®ÁòÀ» »ç¿ëÇÔÀ¸·Î½á ¾òÀ» ¼ö ÀÖ´Â ÀÌÁ¡À» º¸¿©ÁØ´Ù. ±×´ÙÀ½¿¡´Â Çù¾÷ ÇÊÅ͸µ ±â¹Ý ¿µÈ­ Ãßõ ½Ã½ºÅÛÀ» °³¹ßÇÏ´Â ´Ü°èº° ¿¹Á¦¸¦ º¸¿©ÁØ´Ù.
12Àå, '°í±Þ ·¯´× ¸Ó½Å ¸ð¹ü »ç·Ê'¿¡¼­´Â ½ºÆÄÅ©¸¦ »ç¿ëÇÑ ¸Ó½Å ·¯´× °í±Þ ÁÖÁ¦¿¡ ´ëÇÑ À̷аú ½Ç¿ëÀûÀÎ Ãø¸éÀ» »ìÆìº»´Ù. ±×¸®µå °Ë»ö, ±³Â÷ °ËÁõ, ÇÏÀÌÆÛÆÄ¶ó¹ÌÅÍ Æ©´×À» »ç¿ëÇØ ¼º´ÉÀ» ÃÖÀûÈ­ÇÏ´Â ¸Ó½Å ·¯´× ¸ðµ¨ Æ©´× ¹æ¹ýÀ» ¹è¿î´Ù. ±×¸®°í ¸ðµ¨ ±â¹ÝÀÇ Ãßõ ¾Ë°í¸®Áò ÁßÀÎ ÇϳªÀÎ ALS¸¦ »ç¿ëÇØ È®Àå °¡´ÉÇÑ Ãßõ ½Ã½ºÅÛ °³¹ß ¹æ¹ýÀ» ´Ù·é´Ù. ¸¶Áö¸·À¸·Î ÁÖÁ¦ ¸ðµ¨¸µ ¾ÖÇø®ÄÉÀ̼ÇÀº ÅØ½ºÆ® Ŭ·¯½ºÅ͸µ ±â¹ýÀ» Ȱ¿ëÇÑ´Ù.
13Àå, '³ªÀÌºê º£ÀÌÁî'¿¡¼­´Â ºòµ¥ÀÌÅÍ ºÐ¾ßÀÇ ¸Ó½Å ·¯´×ÀÌ Çаè¿Í »ê¾÷°è ¸ðµÎÀÇ ¿¬±¸ ºÐ¾ß¿¡ Å« ¿µÇâÀ» ¹ÌÄ£ ±ÞÁøÀûÀÎ °áÇÕÀ̶ó°í ¸»ÇÑ´Ù. ºòµ¥ÀÌÅÍ´Â ½ÇÁ¦ °¡Ä¡¸¦ ã±â À§ÇØ ML, µ¥ÀÌÅÍ ºÐ¼® Åø, ¾Ë°í¸®Áò¿¡ ¾î·Á¿î °úÁ¦¸¦ ºÎ°úÇÑ´Ù. ±×·¯³ª °Å´ëÇÑ µ¥ÀÌÅͼÂÀ» ±â¹ÝÀ¸·Î ¹Ì·¡¸¦ ¿¹ÃøÇÏ´Â °ÍÀº °áÄÚ ½¬¿î ÀÏÀÌ ¾Æ´Ï´Ù. ¹Ì·¡ ¿¹Ãø°ú °ü·ÃÇØ MLÀ» ÀÚ¼¼È÷ »ìÆìº¸°í, °£´ÜÇÏÁö¸¸ °­·ÂÇÑ ¹æ¹ýÀ¸·Î ´ÙÇ× ºÐ·ù, º£ÀÌÁö¾È Ãß·Ð, ³ªÀÌºê º£ÀÌÁî, µð½ÃÀü Æ®¸®, ³ªÀÌºê º£ÀÌÁî¿Í µð½ÃÀü Æ®¸®ÀÇ ºñ±³ ºÐ¼® µî È®Àå °¡´ÉÇÑ ºÐ·ù ¸ðµ¨°ú °³³äÀ» ±¸ÃàÇÏ´Â ¹æ¹ýÀ» ¾Ë¾Æº»´Ù.
14Àå, '½ºÆÄÅ© MLlibÀ¸·Î µ¥ÀÌÅÍ Å¬·¯½ºÅ͸µ'¿¡¼­´Â ½ºÆÄÅ©ÀÇ ±âº» ¾ÆÅ°ÅØÃ³ ±â¹ÝÀ¸·Î ½ºÆÄÅ©°¡ Ŭ·¯½ºÅÍ ¸ðµå¿¡¼­ ¾î¶»°Ô µ¿ÀÛÇÏ´ÂÁö ¼³¸íÇÑ´Ù. ÀÌÀü ¿©·¯ Àå¿¡¼­ ´Ù¾çÇÑ ½ºÆÄÅ© API¸¦ »ç¿ëÇØ ½ÇÁ¦ ¾ÖÇø®ÄÉÀ̼ÇÀÇ °³¹ß ¹æ¹ýÀ» »ìÆìºÃ´Ù¸é 14Àå¿¡¼­´Â Ŭ·¯½ºÅÍ¿¡ Àüü ½ºÆÄÅ© ¾ÖÇø®ÄÉÀ̼ÇÀ» ¹èÆ÷ÇÏ´Â ¹æ¹ý»Ó ¾Æ´Ï¶ó ±âÁ¸ ÇϵÓÀ» ¼³Ä¡Çß´ÂÁö ¶Ç´Â ¼³Ä¡ÇÏÁö ¾Ê¾Ò´ÂÁö È®ÀÎÇÑ´Ù.
15Àå, '½ºÆÄÅ© MLÀ» ÀÌ¿ëÇÑ ÅØ½ºÆ® ºÐ¼®'¿¡¼­´Â ½ºÆÄÅ© MLÀ» »ç¿ëÇØ ÅØ½ºÆ® ºÐ¼®À» ¼³¸íÇÑ´Ù. ÅØ½ºÆ® ºÐ¼®Àº ¸Ó½Å ·¯´×ÀÇ ³ÐÀº ºÐ¾ß¸ç, Á¤¼­ ºÐ¼®, äÆÃ º¿, À̸ÞÀÏ ½ºÆÔ ŽÁö, ÀÚ¿¬¾î ó¸® µî°ú °°Àº ¸¹Àº »ç¿ë »ç·Ê¿¡¼­ À¯¿ëÇÏ´Ù. 10,000°³ÀÇ Æ®À§ÅÍ »ùÇà µ¥ÀÌÅͼÂÀ» ÅØ½ºÆ® ºÐ·ù »ç¿ë »ç·Ê¿¡ ÁßÁ¡À» µÐ ÅØ½ºÆ® ºÐ¼®¿¡ ½ºÆÄÅ©¸¦ »ç¿ëÇÏ´Â ¹æ¹ýÀ» »ìÆìº»´Ù. ¶ÇÇÑ ½ÇÁ¦ ÅØ½ºÆ®¸¦ Àß ¸ð¸£´Â »óÅ¿¡¼­ ¹®¼­¿¡¼­ ÁÖÁ¦¸¦ »ý¼ºÇÏ´Â Àαâ ÀÖ´Â ±â¼úÀÎ LDA¸¦ »ìÆìº¸°í, LDA°¡ Àß µ¿ÀÛÇÏ´ÂÁö Æ®À§ÅÍ µ¥ÀÌÅ͸¦ ±â¹ÝÀ¸·Î ÅØ½ºÆ® ºÐ·ù¸¦ ±¸ÇöÇÑ´Ù.
16Àå, '½ºÆÄÅ© Æ©´×'¿¡¼­´Â ½ºÆÄÅ© ³»ºÎ¸¦ ±íÀÌ ÀÖ°Ô »ìÆìº»´Ù. ±×¸®°í ½ºÆÄÅ©¸¦ »ç¿ëÇÏ´Â °ÍÀÌ ½ºÄ®¶ó Ä÷º¼ÇÀ» »ç¿ëÇÏ´Â °Íó·³ ´À²¸ÁöÁö¸¸ ½ÇÁ¦ ½ºÆÄÅ©°¡ ºÐ»ê ½Ã½ºÅÛ¿¡¼­ ½ÇÇàµÈ´Ù´Â °ÍÀ» ÀØÁö ¸»¾Æ¾ß ÇÑ´Ù. ¶ÇÇÑ ½ºÆÄÅ© Àâ ¸ð´ÏÅ͸µ, ½ºÆÄÅ© ¼³Á¤, ½ºÆÄÅ© ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ß ½Ã ¹ß»ýÇÏ´Â ÀϹÝÀûÀÎ ½Ç¼ö, ÃÖÀûÈ­ ±â¼ú¿¡ ´ëÇØ ¼³¸íÇÑ´Ù.
17Àå, 'Ŭ·¯½ºÅÍ¿¡ ½ºÆÄÅ© ¹èÆ÷'¿¡¼­´Â ½ºÆÄÅ©°¡ ±âº» ¾ÆÅ°ÅØÃ³¸¦ ±â¹ÝÀ¸·Î Ŭ·¯½ºÅÍ ¸ðµå¿¡¼­ ¾î¶»°Ô µ¿ÀÛÇÏ´ÂÁö »ìÆìº»´Ù. Ŭ·¯½ºÅÍ¿¡¼­ ½ºÆÄÅ© ¾ÆÅ°ÅØÃ³, ½ºÆÄÅ© »ýŰè, Ŭ·¯½ºÅÍ °ü¸®¸¦ »ìÆìº¸°í µ¶¸³Çü, ¸Þ¼Ò½º(Mesos), ¾á(Yarn), Äí¹ö³×Ƽ½º(kubernetes)¿¡ ½ºÆÄÅ© ¾ÖÇø®ÄÉÀ̼ÇÀ» ¹èÆ÷ÇÏ´Â ¹æ¹ýÀ» »ìÆìº»´Ù. ¸¶Áö¸·À¸·Î Ŭ¶ó¿ìµå ±â¹Ý AWS Ŭ·¯½ºÅÍ¿¡ ½ºÆÄÅ© ¾ÖÇø®ÄÉÀ̼ÇÀ» ¹èÆ÷ÇÏ´Â ¹æ¹ýµµ »ìÆìº»´Ù.
18Àå, '½ºÆÄÅ© Å×½ºÆÃ°ú µð¹ö±ë'¿¡¼­´Â ºÐ»ê ¹èÆ÷µÈ ¾ÖÇø®ÄÉÀ̼ÇÀÇ Å×½ºÆÃ¿¡ ´ëÇÑ ¾î·Á¿òÀ» ¼³¸íÇϰí, Å×½ºÆÃÀ» ÇØ°áÇÒ ¹æ¹ýÀ» »ìÆìº»´Ù. ºÐ»ê ȯ°æ¿¡¼­ Å×½ºÆÃÀ» ¼öÇàÇÏ´Â ¹æ¹ý°ú ½ºÆÄÅ© ¾ÖÇø®ÄÉÀ̼ÇÀ» Å×½ºÆÃÇÏ°í µð¹ö±ëÇÏ´Â ¹æ¹ýÀ» ´Ù·é´Ù.
19Àå, 'PySpark°ú SparkR'¿¡¼­´Â ÆÄÀ̽ã°ú RÀ» »ç¿ëÇØ ½ºÆÄÅ© Äڵ带 ÀÛ¼ºÇÏ´Â µ¥ »ç¿ëµÇ´Â µÎ API, Áï PySpark¿Í SparkRÀ» ¼³¸íÇÑ´Ù. ¸ÕÀú PySpark¸¦ ½ÃÀÛÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ ÈÄ PySpark·Î µ¥ÀÌÅÍ ÇÁ·¹ÀÓ API¿Í UDF¿¡ »óÈ£ÀÛ¿ëÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù.
±×¸®°í PySpark¸¦ »ç¿ëÇØ µ¥ÀÌÅÍ ºÐ¼®À» ¼öÇàÇÑ´Ù. ±×´ÙÀ½¿¡ SparkRÀ» ½ÃÀÛÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ¶ÇÇÑ µ¥ÀÌÅÍ Ã³¸®°ú Á¶ÀÛ ¹æ¹ý, SparkRÀ» »ç¿ëÇÑ RDD¿Í µ¥ÀÌÅÍ ÇÁ·¹ÀÓÀ» »ç¿ëÇÏ´Â ¹æ¹ý, ¸¶Áö¸·À¸·Î SparkRÀ» »ç¿ëÇÏ´Â ÀϺΠµ¥ÀÌÅÍ ½Ã°¢È­ ¹æ¹ýÀ» »ìÆìº»´Ù.
ºÎ·Ï A, 'Alluxio·Î ½ºÆÄÅ©ÀÇ Ã³¸® ¼º´É ³ôÀ̱â'¿¡¼­´Â Alluxio¸¦ ½ºÆÄÅ©¿Í ÇÔ²² »ç¿ëÇØ ó¸® ¼Óµµ¸¦ Çâ»ó½ÃŰ´Â ¹æ¹ýÀ» º¸¿©ÁØ´Ù. Alluxio´Â ½ºÆÄÅ©¸¦ Æ÷ÇÔÇÑ ¿©·¯ Ç÷§Æû¿¡¼­ ¸¹Àº ¾ÖÇø®ÄÉÀ̼ÇÀÇ ¼Óµµ¸¦ ³ô¿©ÁÖ´Â ¿ÀǼҽº ºÐ»ê ¸Þ¸ð¸® ÀúÀå ½Ã½ºÅÛÀÌ´Ù.
AlluxioÀÇ °¡´É¼ºÀ» »ìÆìº¸°í AlluxioÀ» ½ºÆÄÅ©¿Í ÅëÇÕÇØ ½ºÆÄÅ© ÀâÀ» ½ÇÇàÇÒ ¶§¸¶´Ù ¸Þ¸ð¸®¿¡ µ¥ÀÌÅ͸¦ ij½ÃÇÒ ÇÊ¿ä ¾øÀÌ ´õ ÁÁÀº ¼º´ÉÀ» º¸¿©ÁÖ´Â ºÎºÐÀ» º¸¿©ÁØ´Ù.
ºÎ·Ï B, '¾ÆÆÄÄ¡ Á¦Çø°¿¡¼­ ´ëÈ­Çü µ¥ÀÌÅÍ ºÐ¼®'¿¡¼­´Â µ¥ÀÌÅÍ °úÇÐ °üÁ¡¿¡¼­ µ¥ÀÌÅÍ ºÐ¼®ÀÇ ´ëÈ­Çü, ½Ã°¢Àû È¿°ú°¡ Áß¿äÇÔÀ» ¼³¸íÇÑ´Ù. Á¦Çø°Àº ¿©·¯ ¹é¿£µå¿Í ÀÎÅÍÇÁ¸®ÅͰ¡ ÀÖ´Â ´ëÈ­Çü, ´ë±Ô¸ð µ¥ÀÌÅÍ ºÐ¼®À» À§ÇÑ À¥ ±â¹Ý ³ëÆ®ºÏÀÌ´Ù. ±×¸®°í ¹é¿£µå¿¡¼­ ÀÎÅÍÇÁ¸®ÅÍ·Î ½ºÆÄÅ©¸¦ »ç¿ëÇØ ´ë±Ô¸ð µ¥ÀÌÅ͸¦ ºÐ¼®ÇÒ ¼ö ÀÖ°Ô ¾ÆÆÄÄ¡ Á¦Çø°À» »ç¿ëÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù.

ÁöÀºÀÌÀÇ ¸»

µ¥ÀÌÅͰ¡ Áö¼ÓÀûÀ¸·Î Áõ°¡Çϸ鼭 µ¥ÀÌÅ͸¦ ±â¹ÝÀ¸·Î Á¡Á¡ ´õ º¹ÀâÇÑ °áÁ¤À» ³»¸± Çʿ伺ÀÌ »ý°å´Ù. ¶ÇÇÑ ºòµ¥ÀÌÅÍ´Â Å« Àå¾Ö¹°À» »ý¼ºÇϰí, ±â¾÷Àº ±âÁ¸ ºÐ¼® ¹æ¹ýÀ» »ç¿ëÇØ Àû½Ã¿¡ ÅëÂû·ÂÀ» ¾òÁö ¸øÇϰí ÀÖ´Ù. ºòµ¥ÀÌÅÍ ¿µ¿ªÀº ºÐ¼® ÇÁ·¹ÀÓ¿öÅ©¿Í ¸¹Àº °ü·ÃÀÌ ÀÖ°í, ºÐ¼® ÇÁ·¹ÀÓ¿öÅ©ÀÇ ¹üÀ§´Â ÇØ´ç ÇÁ·¹ÀÓ¿öÅ©°¡ ó¸®ÇÒ ¼ö ÀÖ´Â °Í¿¡ µû¶ó Á¤ÀǵȴÙ. ¼ö¹é¸¸ ¹æ¹®ÀÚÀÇ Å¬¸¯ ½ºÆ®¸²¿¡¼­ ¿Â¶óÀÎ ±¤°í °ÔÀç À§Ä¡¸¦ ÃÖÀûÈ­Çϱâ À§ÇØ ¸é¹ÐÈ÷ Á¶»çÇϰųª, »ç±â ½ÅÈ£¸¦ ½Äº°Çϱâ À§ÇØ ¼ö½Ê¾ï °ÇÀÇ °Å·¡¸¦ ºÐ¼®Çϰųª, ¸Ó½Å ·¯´×°ú ±×·¡ÇÁ ó¸® °°Àº °í±Þ ºÐ¼®ÀÇ Çʿ䰡 ÀÖµçÁö °£¿¡ ¾öû³­ µ¥ÀÌÅÍ ¿ë·®À¸·ÎºÎÅÍ ÀÚµ¿À¸·Î ÅëÂû·ÂÀ» ¾ò´Â ¹æ¹ýÀÌ ´õ ºÐ¸íÇØÁö°í ÀÖ´Ù.
¸ðµç Çаè¿Í »ê¾÷ ºÐ¾ß¿¡¼­ ºòµ¥ÀÌÅÍ Ã³¸®, ºÐ¼®, µ¥ÀÌÅÍ °úÇÐ ºÐ¾ßÀÇ »ç½Ç»ó Ç¥ÁØÀÎ ¾ÆÆÄÄ¡ ½ºÆÄÅ©´Â ¸Ó½Å ·¯´×°ú ±×·¡ÇÁ ó¸® ¶óÀ̺귯¸®¸¦ Á¦°øÇϰí ÀÖ°í, ±â¾÷¿¡¼­ È®À强ÀÌ ¶Ù¾î³­ Ŭ·¯½ºÅ͸µ ÄÄÇ»ÅÍ ÆÄ¿ö·Î º¹ÀâÇÑ ¹®Á¦¸¦ ½±°Ô ÇØ°áÇÒ ¼ö ÀÖ´Ù. ½ºÆÄÅ©´Â ½ºÄ®¶ó¸¦ »ç¿ëÇØ ºÐ»êµÈ ÇÁ·Î±×·¥À» ÀÛ¼ºÇÏ´Â °ÍÀ» ½ºÆÄÅ©¸¦ »ç¿ëÇÑ ÀÏ¹Ý ÇÁ·Î±×·¥À» ÀÛ¼ºÇÏ´Â °Íó·³ ´À²¸Áö°Ô ÇÑ´Ù. ½ºÆÄÅ©´Â ETL ÆÄÀÌÇÁ¶óÀο¡ ¼º´ÉÀ» Å©°Ô Çâ»ó½ÃŰ°í ¸Ê¸®µà½º ÇÁ·Î±×·¡¸Ó°¡ ¸ÅÀÏ ÇÏµÓ ÇÁ·Î±×·¡¹ÖÀ» ÇÏ´Ù Á÷¸éÇÏ´Â ¾î·Á¿òÀ» °æ°¨½ÃŲ´Ù.
ÀÌ Ã¥¿¡¼­´Â ½ºÆÄÅ©¿Í ½ºÄ®¶ó¸¦ »ç¿ëÇØ ¸Ó½Å ·¯´×, ±×·¡ÇÁ ó¸®, ½ºÆ®¸®¹Ö, SQLÀ» ½ºÆÄÅ©¿¡ Àü´ÞÇÏ´Â ±â´ÉÀ» »ç¿ëÇØ ÃÖ÷´Ü °í±Þ µ¥ÀÌÅÍ ºÐ¼®À» ¼öÇàÇϰí MLlib, ML, SQL, GraphX, ±âŸ ¶óÀ̺귯¸®¸¦ »ç¿ëÇÑ´Ù.
¸ÕÀú ½ºÄ®¶ó·Î ½ÃÀÛÇÑ ÈÄ, ½ºÄ®¶ó¸¦ »ìÆìº»´Ù. ¸¶Áö¸·À¸·Î ½ºÆÄÅ©¿Í ½ºÄ®¶ó·Î ºòµ¥ÀÌÅÍ ºÐ¼®ÇÏ´Â °í±Þ ÁÖÁ¦¸¦ ´Ù·é´Ù. ºÎ·Ï¿¡¼­´Â SparkR, PySpark, ¾ÆÆÄÄ¡ Á¦Çø°, Àθ޸𸮠Alluxio¿¡ ´ëÇÑ ½ºÄ®¶ó Áö½ÄÀ» È®ÀåÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ÀÌ Ã¥Àº óÀ½ºÎÅÍ ³¡±îÁö ÀÐÀ» Çʿ䰡 ¾ø´Ù. ¾ò°í ½ÍÀº Áö½ÄÀ̳ª °ü½ÉÀÌ ÀÖ´Â ÀåÀ¸·Î °Ç³Ê¶Ù¸é µÈ´Ù.
Áñ°Ì°Ô Ã¥À» Àб⠹ٶõ´Ù!

¿Å±äÀÌÀÇ ¸»

ÇÏµÓ ¸Ê¸®µà½º(Hadoop MapReduce) ÇÁ·Î±×·¡¹ÖÀº ÃÖ±Ù ¸î ³â µ¿¾È Àß »ç¿ëµÇ°í ÀÖ½À´Ï´Ù. ¶ÇÇÑ µ¥ÀÌÅͰ¡ ÀúÀåµÈ ÇÏµÓ ºÐ»ê ÆÄÀÏ ½Ã½ºÅÛÀ» ±â¹ÝÀ¸·Î ÇÏ´Â ºÐ¼®, Ãßõ ÇÁ·Î±×·¡¹ÖÀº ÇÏµÓ ³»ºÎ¿¡¼­¸¸ °¡´ÉÇ߱⿡ °³¹ßÀÚµéÀÌ ÇÏµÓ ÀÎÅÍÆäÀ̽º¸¦ »ç¿ëÇØ °³¹ßÇØ¾ß Çß½À´Ï´Ù. ±×·¯³ª ÀÏ¹Ý °³¹ßÀÚ°¡ ÀÌÇØÇϱ⠾î·Á¿î °³³ä°ú ÀÎÅÍÆäÀ̽º°¡ ÀÖ¾î ÇϵӰú ÇÏµÓ ¸Ê¸®µà½º¸¦ Àß ÀÌÇØÇÏ´Â °³¹ßÀÚ°¡ Àü¹®ÀûÀ¸·Î °³¹ßÇϰï Çß½À´Ï´Ù. ÀÏ¹Ý °³¹ßÀÚµéÀÌ ½±°Ô ºÐ¼®ÇÒ ¼ö ÀÖµµ·Ï ¾ÆÆÄÄ¡ ÇÏÀ̺ê(Hive) µî ´Ù¾çÇÑ ÇÏµÓ °ü·Ã ÇÁ·¹ÀÓ¿öÅ©°¡ »ç¿ëµÇ±â ½ÃÀÛÇß½À´Ï´Ù. ±×·¯³ª ¿©ÀüÈ÷ À¯¿¬ÇÏÁö ¾ÊÀ» »Ó ´õ·¯ ÇÏµÓ ¸Ê¸®µà½º °³¹ßÀº º¯È­µÇÁö ¾Ê¾Ò°í, Å×½ºÆ® ÄÚµå °³¹ß ¿ª½Ã ½±Áö ¾Ê¾Ò½À´Ï´Ù. ÇÏµÓ ÇÁ·Î±×·¡¹ÖÀÇ ¾àÁ¡Àº ´ë¿ë·® µ¥ÀÌÅÍ¿¡ ´ëÇÑ ½Ç½Ã°£ ó¸®ÀÔ´Ï´Ù. µû¶ó¼­ ÇÏµÓ ´ë½Å ½Ç½Ã°£ µ¥ÀÌÅ͸¦ ó¸®ÇÏ´Â ¸Þ½Ã¡ Å¥(¿¹, Ä«ÇÁÄ«)¸¦ »ç¿ëÇϰí ÀÖ½À´Ï´Ù. ±×·¯´Ù º¸´Ï ½ºÆ®¸®¹Ö 󸮸¦ ó¸®Çϱâ À§ÇØ ¾ÆÆÄÄ¡ ½ºÅè(Apache Storm), ½ºÆÄÅ© ½ºÆ®¸®¹Ö(Spark Streaming), ¾ÆÆÄÄ¡ ÇøµÅ©(Apache Flink) µî ¸¹Àº ¿ÀÇ ¼Ò½º°¡ ¾²À̰í ÀÖ½À´Ï´Ù.
Àú´Â Çö¾÷ °³¹ßÀÚÀÌÁö¸¸ ´Ù¾çÇÑ NoSQL, ´ë¿ë·®, ºñÁî´Ï½º¿¡ °ü½ÉÀÌ ¸¹½À´Ï´Ù. Àú´Â ½ºÄ®¶ó/½ºÆÄÅ©¸¦ »ç¿ëÇØ ¾ÖÇø®ÄÉÀ̼ÇÀ» °³¹ßÇß°í, ¸Þ¼Ò½º/¸¶¶óÅæ ¹× Äí¹ö³×Ƽ½º¿¡¼­ ¾ÖÇø®ÄÉÀ̼ǿ¡¼­µµ ¾ÖÇø®ÄÉÀ̼ÇÀ» °³¹ßÇß½À´Ï´Ù. µû¶ó¼­ ÇÏµÓ ¸Ê¸®µà½º ÇÁ·Î±×·¡¹ÖÀº ½ºÆÄÅ©·Î ´ëüµÉ °ÍÀ̶ó´Â ±»Àº ¹ÏÀ½ÀÌ ÀÖ½À´Ï´Ù. ´©±¸³ª ½ºÄ®¶ó¸¦ Á¦´ë·Î ¾Ë ¼ö ÀÖ´Ù¸é ÇÏµÓ ¸Ê¸®µà½º ÇÁ·Î±×·¡¹ÖÀ» ½ºÄ®¶ó ±â¹ÝÀÇ ½ºÆÄÅ© ÇÁ·Î±×·¡¹ÖÀ¸·Î ´ëü ¹× º¸¿ÏÇÒ ¼ö ÀÖÀ» °ÍÀ̶ó È®½ÅÇÕ´Ï´Ù.
Àú»Ó ¾Æ´Ï¶ó ¸¹Àº °³¹ßÀÚ°¡ ÇÏµÓ ¸Ê¸®µà½º ÇÁ·Î±×·¡¹Ö, ±âÁ¸ ÆÄÀÌÇÁ¶óÀÎ ÇÁ·Î±×·¡¹Ö ¹× ¸Ó½Å ·¯´× ÇÁ·Î±×·¡¹ÖÀ» Á¡Â÷ ½ºÆÄÅ© ÇÁ·Î±×·¡¹ÖÀ¸·Î ´ëüµÇ°í º¸¿ÏÇϰí ÀÖ½À´Ï´Ù. ½ºÆ®¸®¹Ö ó¸®, ´ë¿ë·® ºÐ¼® ó¸®, Ãßõ ½Ã½ºÅÛ °³¹ß, Àθ޸𸮠º´·Äó¸®, ¸Ó½Å ·¯´×±îÁö ¿©·¯ ºÐ¾ßÀÇ ¾ÖÇø®ÄÉÀ̼ÇÀ» ½ºÆÄÅ© Çϳª¸¸ ¾Ë¸é ¾î´À Á¤µµ ÁøÇàÇÒ ¼ö ÀÖ½À´Ï´Ù. µû¶ó¼­ ¶÷´Ù ¾ÆÅ°ÅØÃ³¸¦ ½ºÆÄÅ©·Î ½±°Ô ó¸®ÇÒ ¼ö ÀÖ½À´Ï´Ù. ½ºÆÄÅ©´Â CNN°ú °°Àº µö·¯´×À» Áö¿øÇÏÁö ¾ÊÁö¸¸ ÅÙ¼­Ç÷Î(Tensorflow)¿Í ½±°Ô ¿¬µ¿ÇÒ ¼ö ÀÖ½À´Ï´Ù. ±×¸®°í ½ºÆÄÅ©´Â ÀÚ¹Ù, ½ºÄ®¶ó, ÆÄÀ̽ã, R ¾ð¾î¸¦ Áö¿øÇϱ⠶§¹®¿¡ ¾ð¾î¿¡ ´ëÇÑ ºÎ´ãÀÌ °¡Àå ´úÇÕ´Ï´Ù.
ƯÈ÷ ½ºÄ®¶óÀÇ ÇÔ¼öÇü ¾ð¾îÀÇ Æ¯Â¡°ú µ¥ÀÌÅÍÇÁ·¹ÀÓÀ» Ãß»óÈ­ÇÑ ½ºÄ®¶ó ±â¹ÝÀÇ ½ºÆÄÅ©¸¦ Ȱ¿ëÇÔÀ¸·Î½á ºòµ¥ÀÌÅ͸¦ ³í¸®ÀûÀÎ ÇÁ·Î±×·¡¹ÖÀ¸·Î ½±°Ô ó¸®ÇÒ ¼ö ÀÖ½À´Ï´Ù. ¸¹Àº °³¹ßÀÚ°¡ ½º½º·Î °øºÎÇÏ¸ç ºòµ¥ÀÌÅÍ, ¸Ó½Å ·¯´×ÀÇ ¿µ¿ªÀ¸·Î ÁøÀÔÇϰí Àִµ¥ ±×¿¡ ÇÔ²² °¡°í ½Í½À´Ï´Ù.
ÀÌ Ã¥Àº Àü¹ÝÀûÀ¸·Î ¼³¸íÀÌ ¸¹°í ±×¸²ÀÌ Ç³ºÎÇÕ´Ï´Ù. ƯÈ÷, Áý°è ºÎºÐÀº Áß¿äÇÑ ³»¿ëÀ» Àß ¼³¸íÇϰí ÀÖ½À´Ï´Ù. Àú´Â ÀÌÀüºÎÅÍ Åë°è¿Í ¸Ó½Å ·¯´×À» °øºÎÇϰí ÀÖ¾ú´Âµ¥ ½ÇÁ¦ ½ºÆÄÅ© ¾ÖÇø®ÄÉÀ̼ǿ¡¼­ ¾î¶»°Ô ¿¬µ¿µÇ´ÂÁö´Â ÀÌ Ã¥À» ÅëÇØ Àß ÀÌÇØÇÏ°Ô µÆ½À´Ï´Ù. ¸Ó½Å ·¯´×À» óÀ½ µµÀüÇϽô ºÐ¿¡°Ô´Â ÀÌ Ã¥ÀÌ Á» ¾î·Æ´Ù°í ´À³¥ ¼ö ÀÖ°ÚÁö¸¸ ¸¹Àº µµ¿òÀÌ µÉ °ÍÀÔ´Ï´Ù. ºòµ¥ÀÌÅÍ ºÐ¼®°ú ¸Ó½Å ·¯´×¿¡ ´ëÇÑ ¸¹Àº ³»¿ëÀ» Æ÷ÇÔÇÑ 'Àü°ú' °°Àº ÀÌ Ã¥ÀÌ ¿©·¯ºÐµé¿¡°Ôµµ Çö¾÷¿¡¼­ Å« µµ¿òÀÌ µÇ¸é ÁÁ°Ú½À´Ï´Ù.
ÀÌ Ã¥Àº ¿ø¼­¿Í ´Þ¸® ÃֽŠ2.3.2 ¹öÀüÀ¸·Î ÀÛ¼ºµÆ½À´Ï´Ù. ±âÁ¸ÀÇ ¿ø¼­¿¡¼­ Á¦°øÇÏ´Â ÄÚµåÀÇ ¿ÀŸ¿Í ȣȯ¼ºÀ» ¼öÁ¤ÇØ ¿Å±äÀÌÀÇ github ÀúÀå¼Ò(https://github.com/knight76/Scala-and-Spark-for-Big-Data-Analytics)¸¦ Á¦°øÇϰí ÀÖÀ¸´Ï, Âü°íÇϽñ⠹ٶø´Ï´Ù.

¸ñÂ÷

1Àå ½ºÄ®¶ó ¼Ò°³
½ºÄ®¶óÀÇ ¿ª»ç¿Í ¸ñÀû
Ç÷§Æû°ú ÆíÁý±â
½ºÄ®¶ó ¼³Ä¡¿Í ¼³Á¤
ÀÚ¹Ù ¼³Ä¡
À©µµ¿ì
¸Æ OS
½ºÄ®¶ó: È®Àå °¡´ÉÇÑ ¾ð¾î
½ºÄ®¶ó´Â °´Ã¼ÁöÇâ
½ºÄ®¶ó´Â ÇÔ¼öÇü
½ºÄ®¶ó´Â Á¤Àû ŸÀÔ Áö¿ø
½ºÄ®¶ó´Â JVM¿¡¼­ µ¿ÀÛ
½ºÄ®¶ó´Â ÀÚ¹Ù Äڵ带 ½ÇÇà °¡´É
½ºÄ®¶ó´Â µ¿½Ã ¹× µ¿±âÈ­ ó¸® ¼öÇà °¡´É
ÀÚ¹Ù ÇÁ·Î±×·¡¸Ó¸¦ À§ÇÑ ½ºÄ®¶ó
¸ðµç ŸÀÔÀº °´Ã¼
ŸÀÔ Ãß·Ð
½ºÄ®¶ó REPL
Áßø ÇÔ¼ö
import¹®
¿¬»êÀÚ¸¦ ¸Þ¼Òµå·Î »ç¿ë
¸Þ¼Òµå¿Í ÆÄ¶ó¹ÌÅÍ ¸ñ·Ï
¸Þ¼Òµå ¾ÈÀÇ ¸Þ¼Òµå
½ºÄ®¶ó »ý¼ºÀÚ
Á¤Àû ¸Þ¼Òµå ´ë½Å °´Ã¼
Æ®·¹ÀÌÆ®
Ãʺ¸ÀÚ¸¦ À§ÇÑ ½ºÄ®¶ó
óÀ½ ÀÛ¼ºÇÏ´Â ½ºÄ®¶ó ÄÚµå
´ëÈ­ÇüÀ¸·Î ½ºÄ®¶ó ½ÇÇà
ÄÄÆÄÀÏ
¿ä¾à

2Àå °´Ã¼ÁöÇâ ¾ð¾î, ½ºÄ®¶ó
½ºÄ®¶ó º¯¼ö
ÂüÁ¶¿Í °ª ºÒº¯¼º
½ºÄ®¶óÀÇ µ¥ÀÌÅÍ Å¸ÀÔ
½ºÄ®¶óÀÇ ¸Þ¼Òµå, Ŭ·¡½º, °´Ã¼
½ºÄ®¶óÀÇ ¸Þ¼Òµå
½ºÄ®¶óÀÇ Å¬·¡½º
½ºÄ®¶óÀÇ °´Ã¼
ÆÐŰÁö¿Í ÆÐŰÁö °´Ã¼
ÀÚ¹Ù »óÈ£¿î¿ë¼º
ÆÐÅÏ ¸ÅĪ
½ºÄ®¶óÀÇ ¾Ï½Ã
½ºÄ®¶óÀÇ Á¦³×¸¯
Á¦³×¸¯ Ŭ·¡½ºÀÇ Á¤ÀÇ
SBT¿Í ±âŸ ºôµå ½Ã½ºÅÛ
SBT·Î ºôµå
ÀÌŬ¸³½º¿¡ ¸ÞÀÌºì »ç¿ë
ÀÌŬ¸³½º¿¡¼­ ±×·¡µé »ç¿ë
¿ä¾à

3Àå ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö °³³ä
ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö ¼Ò°³
ÇÔ¼öÇü ÇÁ·Î±×·¡¹ÖÀÇ ÀåÁ¡
µ¥ÀÌÅÍ °úÇÐÀÚ¸¦ À§ÇÑ ÇÔ¼öÇü ½ºÄ®¶ó
½ºÆÄÅ©¸¦ °øºÎÇÏ´Â µ¥ ¿Í FP ½ºÄ®¶ó¸¦ ¼³¸íÇÏ´Â ÀÌÀ¯
½ºÆÄÅ©ÀÎ ÀÌÀ¯
½ºÄ®¶ó¿Í ½ºÆÄÅ© ÇÁ·Î±×·¡¹Ö ¸ðµ¨
½ºÄ®¶ó¿Í ½ºÆÄÅ© »ýŰè
¼ø¼ö ÇÔ¼ö¿Í °íÂ÷ ÇÔ¼ö
¼ø¼ö ÇÔ¼ö
À͸í ÇÔ¼ö
°íÂ÷ ÇÔ¼ö
ÇÔ¼ö¸¦ ¸®ÅÏ °ªÀ¸·Î »ç¿ë
°íÂ÷ ÇÔ¼ö »ç¿ë
ÇÔ¼öÇü ½ºÄ®¶óÀÇ ¿¡·¯ Çڵ鸵
½ºÄ®¶óÀÇ ½ÇÆÐ¿Í ¿¹¿Ü
¿¹¿Ü ´øÁö±â
try¿Í catch¸¦ »ç¿ëÇÑ ¿¹¿Ü ó¸®
finally
Either »ý¼º
Future
ÇϳªÀÇ Å½ºÅ©¸¦ ½ÇÇàÇÏ°í ´ë±â
ÇÔ¼öÇü ÇÁ·Î±×·¡¹Ö°ú µ¥ÀÌÅÍ °¡º¯¼º
¿ä¾à

4Àå Ä÷º¼Ç API
½ºÄ®¶ó Ä÷º¼Ç API
ŸÀÔ°ú °èÃþ
Traversable
Iterable
Seq, LinearSeq, IndexedSeq
°¡º¯°ú ºÒº¯
¹è¿­
¸®½ºÆ®
¼Â
Æ©ÇÃ
¸Ê
Option
exists
forall
filter
map
take
groupBy
init
drop
takeWhile
dropWhile
flatMap
¼º´É Ư¡
Ä÷º¼Ç °´Ã¼ÀÇ ¼º´É Ư¡
Ä÷º¼Ç °´Ã¼°¡ »ç¿ëÇÏ´Â ¸Þ¸ð¸® »ç¿ë·®
ÀÚ¹Ù »óÈ£ ¿î¿µ¼º
½ºÄ®¶ó ¾Ï½Ã »ç¿ë
½ºÄ®¶óÀÇ ¾Ï½ÃÀû º¯È¯
¿ä¾à

5Àå ½ºÆÄÅ©·Î ºòµ¥ÀÌÅÍ ´Ù·ç±â
µ¥ÀÌÅÍ ºÐ¼® ¼Ò°³
µ¥ÀÌÅÍ ºÐ¼® ÇÁ·Î¼¼½º ³»ºÎ
ºòµ¥ÀÌÅÍ ¼Ò°³
ºòµ¥ÀÌÅÍÀÇ 4V
ÇϵÓÀ» ÀÌ¿ëÇÑ ºÐ»ê ÄÄÇ»ÆÃ
ÇÏµÓ ºÐ»ê ÆÄÀÏ ½Ã½ºÅÛ(HDFS)
¸Ê¸®µà½º ÇÁ·¹ÀÓ¿öÅ©
¾ÆÆÄÄ¡ ½ºÆÄÅ©
½ºÆÄÅ© ÄÚ¾î
½ºÆÄÅ© SQL
½ºÆÄÅ© ½ºÆ®¸®¹Ö
½ºÆÄÅ© GraphX
½ºÆÄÅ© ML
PySpark
SparkR
¿ä¾à

6Àå ½ºÆÄÅ©·Î REPL°ú RDD ÀÛ¾÷
½ºÆÄÅ©¿¡ ´ëÇØ ±íÀÌ »ìÆìº¸±â
¾ÆÆÄÄ¡ ½ºÆÄÅ© ¼³Ä¡
½ºÆÄÅ© µ¶¸³Çü
¾á ±â¹ÝÀÇ ½ºÆÄÅ©
¸Þ¼Ò½º ±â¹ÝÀÇ ½ºÆÄÅ©
Äí¹ö³×Ƽ½º ±â¹Ý ½ºÆÄÅ©
RDD ¼Ò°³
RDD »ý¼º
½ºÆÄÅ© ¼ÐÀÇ »ç¿ë
Æ®·£½ºÆ÷¸ÞÀ̼ǰú ¾×¼Ç
Æ®·£½ºÆ÷¸ÞÀ̼Ç
¾×¼Ç
ij½Ì
µ¥ÀÌÅÍ ·Îµå¿Í ÀúÀå
µ¥ÀÌÅÍ ·Îµå
RDD ÀúÀå
¿ä¾à

7Àå Æ¯¼ö RDD ¿¬»ê
RDD ŸÀÔ
½Ö RDD
DoubleRDD
SequenceFileRDD
CoGroupedRDD
ShuffledRDD
UnionRDD
HadoopRDD
NewHadoopRDD
Áý°è
groupByKey
reduceByKey
aggregateByKey
combineByKey
groupByKey, reduceByKey, combineByKey, aggregateByKeyÀÇ ºñ±³
ÆÄƼ¼Å´×°ú ¼ÅÇøµ
ÆÄƼ¼Å³Ê
¼ÅÇøµ
ºê·Îµåij½ºÆ® º¯¼ö
ºê·Îµåij½ºÆ® º¯¼ö »ý¼º
ºê·Îµåij½ºÆ® º¯¼ö Á¤¸®
ºê·Îµåij½ºÆ® Á¤¸®
´©»ê±â
¿ä¾à

8Àå ½ºÆÄÅ© SQL
½ºÆÄÅ© SQL°ú µ¥ÀÌÅÍ ÇÁ·¹ÀÓ
µ¥ÀÌÅÍ ÇÁ·¹ÀÓ API¿Í SQL API
Çǹþ
ÇÊÅÍ
»ç¿ëÀÚ Á¤ÀÇ ÇÔ¼ö(UDF)
µ¥ÀÌÅÍÀÇ ½ºÅ°¸¶ ±¸Á¶
µ¥ÀÌÅͼ ·Îµå¿Í ÀúÀå
Áý°è
Áý°è ÇÔ¼ö
groupBy
rollup
cube
À©µµ¿ì ÇÔ¼ö
Á¶ÀÎ
Á¶ÀÎÀÇ ³»ºÎ µ¿ÀÛ
ºê·Îµåij½ºÆ® Á¶ÀÎ
Á¶ÀΠŸÀÔ
Á¶ÀÎÀÇ ¼º´É °á°ú
¿ä¾à

9Àå ½ºÆÄÅ© ½ºÆ®¸®¹Ö
½ºÆ®¸®¹Ö¿¡ ´ëÇÑ °£·«ÇÑ ¼Ò°³
ÃÖ¼Ò ÇÑ ¹ø ó¸® ¹æ½Ä
ÃÖ´ë ÇÑ ¹ø ó¸® ¹æ½Ä
Á¤È®È÷ ÇÑ ¹ø ó¸®
½ºÆÄÅ© ½ºÆ®¸®¹Ö
StreamingContext
ÀÔ·Â ½ºÆ®¸²
binaryRecordsStream
queueStream
textFileStream ¿¹
twitterStream ¿¹
ºÒ¿¬¼Ó ½ºÆ®¸²
Æ®·£½ºÆ÷¸ÞÀ̼Ç
À©µµ¿ì ¿¬»ê
»óÅ ÀúÀå/»óÅ ºñÀúÀå Æ®·£½ºÆ÷¸ÞÀ̼Ç
»óÅ ºñÀúÀå Æ®·£½ºÆ÷¸ÞÀ̼Ç
»óÅ ÀúÀå Æ®·£½ºÆ÷¸ÞÀ̼Ç
üũ Æ÷ÀÎÆÃ
¸ÞŸµ¥ÀÌÅÍ Ã¼Å© Æ÷ÀÎÆÃ
µ¥ÀÌÅÍ Ã¼Å©Æ÷ÀÎÆÃ
µå¶óÀ̹ö ½ÇÆÐ º¹±¸
½ºÆ®¸®¹Ö Ç÷§Æû°úÀÇ »óÈ£¿î¿ë¼º(¾ÆÆÄÄ¡ Ä«ÇÁÄ«)
¼ö½Å±â ±â¹ÝÀÇ Á¢±Ù ¹æ½Ä
´ÙÀÌ·ºÆ® ½ºÆ®¸²
±¸Á¶È­ ½ºÆ®¸®¹Ö
±¸Á¶È­ ½ºÆ®¸®¹Ö
À̺¥Æ® ½Ã°£°ú Áö¿¬ µ¥ÀÌÅÍ Ã³¸®
³»°áÇÔ¼º ÀÇ¹Ì Ã¼°è
¿ä¾à

10Àå GraphX
±×·¡ÇÁ À̷п¡ ´ëÇÑ °£·«ÇÑ ¼Ò°³
GraphX
VertexRDD¿Í EdgeRDD
VertexRDD
EdgeRDD
±×·¡ÇÁ ¿¬»êÀÚ
filter
mapValues
aggregateMessages
triangleCount
Pregel API
¿¬°áµÈ ÄÄÆ÷³ÍÆ®
¿©ÇàÇÏ´Â ¼¼ÀÏÁî¸Ç ¹®Á¦
ShortestPaths
ÆäÀÌÁö·©Å©
¿ä¾à

11Àå ¸Ó½Å ·¯´× ÇнÀ: ½ºÆÄÅ© MLlib¿Í ML
¸Ó½Å ·¯´× ¼Ò°³
ÀϹÝÀûÀÎ ¸Ó½Å ·¯´× ¿öÅ©Ç÷οì
¸Ó½Å ·¯´× ÀÛ¾÷
½ºÆÄÅ© ¸Ó½Å ·¯´× API
½ºÆÄÅ© ¸Ó½Å ·¯´× ¶óÀ̺귯¸®
ÇÇó ÃßÃâ°ú Æ®·£½ºÆ÷¸ÞÀ̼Ç
CountVectorizer
Åäūȭ
StopWordsRemover
StringIndexer
OneHotEncoder
½ºÆÄÅ© ML ÆÄÀÌÇÁ¶óÀÎ
°£´ÜÇÑ ÆÄÀÌÇÁ¶óÀÎ »ý¼º
ºñÁöµµ ¸Ó½Å ·¯´×
Â÷¿ø Ãà¼Ò
PCA
ÀÌÁø ¹× ´ÙÁß Å¬·¡½º ºÐ·ù
¼º´É ¸ÞÆ®¸¯
·ÎÁö½ºÆ½ ȸ±Í ºÐ¼®À» ÀÌ¿ëÇÑ ´ÙÁß Å¬·¡½º ºÐ·ù
·£´ý Æ÷·¹½ºÆ®¸¦ »ç¿ëÇØ ºÐ·ù Á¤È®µµ Çâ»ó
¿ä¾à

12Àå °í±Þ ¸Ó½Å ·¯´× ¸ð¹ü »ç·Ê
¸Ó½Å ·¯´× ¸ð¹ü »ç·Ê
¿À¹öÇÇÆÃ°ú ¾ð´õÇÇÆÃ¿¡ ÁÖÀÇ
½ºÆÄÅ© MLlib°ú ML¿¡ ÁýÁß
¾ÖÇø®ÄÉÀ̼ǿ¡ ÀûÇÕÇÑ ¾Ë°í¸®Áò ¼±ÅÃ
¾Ë°í¸®ÁòÀ» ¼±ÅÃÇÒ ¶§ °í·ÁÇØ¾ß ÇÒ »çÇ×
¾Ë°í¸®ÁòÀ» ¼±ÅÃÇÒ ¶§ µ¥ÀÌÅ͸¦ °Ë»ç
ML ¸ðµ¨ÀÇ ÇÏÀÌÆÛÆÄ¶ó¹ÌÅÍ Æ©´×
ÇÏÀÌÆÛÆÄ¶ó¹ÌÅÍ Æ©´×
±×¸®µå °Ë»ö ÆÄ¶ó¹ÌÅÍ Æ©´×
±³Â÷ °ËÁõ
½Å¿ë À§Çè ºÐ¼®: ÇÏÀÌÆÛÆÄ¶ó¹ÌÅÍ Æ©´× ¿¹
½ºÆÄÅ©¸¦ »ç¿ëÇÑ Ãßõ ½Ã½ºÅÛ
½ºÆÄÅ©¸¦ ÀÌ¿ëÇÑ ¸ðµ¨ ±â¹Ý Ãßõ
ÁÖÁ¦ ¸ðµ¨¸µ: ÅØ½ºÆ® Ŭ·¯½ºÅ͸µ¿¡¼­ ¸ð¹ü »ç·Ê
LDA µ¿ÀÛ ¹æ¹ý
½ºÆÄÅ© MLlib¸¦ ÀÌ¿ëÇÑ ÁÖÁ¦ ¸ðµ¨¸µ
¿ä¾à

ÀúÀÚ¼Ò°³

·¹ÀÚ¿ï Ä«¸²(Rezaul Karim) [Àú] ½ÅÀ۾˸² SMS½Åû ÀÛ°¡DBº¸±â
»ý³â¿ùÀÏ -
Ãâ»ýÁö -
Ãâ°£µµ¼­ 3Á¾
ÆÇ¸Å¼ö 185±Ç

C, C++, ÀÚ¹Ù, R, ÆÄÀ̽ãÀ» ºñ·ÔÇØ ½ºÆÄÅ©, Ä«ÇÁÄ«, DC/OS, µµÄ¿, ¸Þ¼Ò½º(Mesos), ÇϵÓ, ¸Ê¸®µà½º(MapReduce)¿Í °°Àº ºòµ¥ÀÌÅÍ ±â¼úÀ» Áß½ÉÀ¸·Î, ¾Ë°í¸®Áò°ú µ¥ÀÌÅÍ ±¸Á¶¿¡ ´ëÇÑ ¿¬±¸ ¹× °³¹ß ºÐ¾ß¿¡¼­ 8³â ÀÌ»óÀÇ °æ·ÂÀ» ½×¾Ò´Ù.
¸Ó½Å ·¯´×¿¡ óÀ½ ¸Å·áµÈ °ÍÀº 2010³â °í±Þ ÀΰøÁö´É ´ëÇпø °úÁ¤À» À̼öÇÏ´ø Áß ÇÏµÓ ±â¹Ý ¸Ê¸®µà½º¿Í ¸Ó½Å ·¯´×À» °áÇÕÇÑ ±â¼úÀ» ´ë±Ô¸ð ºñÁî´Ï½º ÁöÇâ Æ®·£Àè¼Ç µ¥ÀÌÅͺ£À̽º¿¡ Àû¿ëÇØ Àå¹Ù±¸´Ï ºÐ¼®À» ¼öÇàÇϸ鼭ºÎÅÍ´Ù. °á°úÀûÀ¸·Î ¿¬±¸ °ü½É»ç¸¦ ²Å´Â´Ù¸é ¸Ó½Å ·¯´×, µ¥ÀÌÅÍ ¸¶ÀÌ´×, ½Ã¸Çƽ À¥(Semantic Web), ºòµ¥ÀÌÅÍ, ¹ÙÀÌ¿ÀÀÎÆ÷¸Åƽ

ÆîÃ帱â
½º¸®´Ù ¾Ë¶ó(Sridhar Alla) [Àú] ½ÅÀ۾˸² SMS½Åû ÀÛ°¡DBº¸±â
»ý³â¿ùÀÏ -
Ãâ»ýÁö -
Ãâ°£µµ¼­ 0Á¾
ÆÇ¸Å¼ö 0±Ç

Áß¼Ò±â¾÷°ú ´ë±â¾÷ÀÌ µ¥ÀÌÅÍ¿þ¾î ÇÏ¿ì¡, °Å¹ö³Í½º, º¸¾È, ½Ç½Ã°£ ó¸®, ÃÊ´ÜŸ ¸Å¸Å, ´ë±Ô¸ð µ¥ÀÌÅÍ °úÇÐ ÇÁ·¢Æ¼½º ±¸Ãà °°Àº º¹ÀâÇÑ ¹®Á¦¸¦ ÇØ°áÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ´Â ºòµ¥ÀÌÅÍ Àü¹®°¡´Ù. ¾ÖÀÚÀÏ Àü¹®°¡ÀÌÀÚ ÀÎÁõµÈ ¾ÖÀÚÀÏ µ¥ºê¿É½º ½ÇÇà°¡´Ù. ½á´Ï¹ë(Sunnyvale)ÀÇ Network Appliance¿¡¼­ ½ºÅ丮Áö ¼ÒÇÁÆ®¿þ¾î ¿£Áö´Ï¾î·Î °æ·ÂÀ» ½×Àº ÈÄ, »çÀ̹ö º¸¾È ȸ»çÀÎ º¸½ºÅÏÀÇ eIQNetworks¿¡¼­ ÃÖ°í ±â¼ú Ã¥ÀÓÀÚ(CIO)·Î ±Ù¹«Çß´Ù. ¹Ì±¹ Çʶóµ¨ÇǾƿ¡ À§Ä¡ÇÑ ÄÄij½ºÆ®(Comcast)¿¡¼­ µ¥ÀÌÅÍ °úÇÐ ¹× °øÇÐ ´ã´ç ÀÌ»ç·Î ÀçÁ÷Çß´Ù. ½ºÆ®¶óŸ(Strata), ÇÏµÓ ¿ùµå(Hadoop World), ½º

ÆîÃ帱â
»ý³â¿ùÀÏ -
Ãâ»ýÁö -
Ãâ°£µµ¼­ 0Á¾
ÆÇ¸Å¼ö 0±Ç

³×À̹ö, ¶óÀÎ(Line)À» °ÅÃÄ Ä«Ä«¿À(Kakao)¿¡¼­ °³¹ßÀÚ·Î ÀÏÇϰí ÀÖ´Ù. ÇöÀç ¸¶ÈçµÎ »ìÀÇ Æò¹üÇÑ °³¹ßÀÚ·Î ´Ù¾çÇÑ µµÀü¿¡¼­ ¿¡³ÊÁö¸¦ ¾òÀ¸¸ç, °³¹ß°ú ½Ç¹« °æÇèÀ» ºí·Î±×¿¡ ±â·ÏÇϰí ÀÖ´Ù. ¿¡ÀÌÄÜÃâÆÇ»çÀÇ [Ansible ¼³Á¤ °ü¸®](2015), [ElasticSearch Cookbook 2/e](2016), [Redis ÇÙ½ÉÁ¤¸®](2016), [CentOS 7 ¸®´ª½º ¼­¹ö ÄîºÏ](2016), [ÇÏÀ̺ê ÇÙ½ÉÁ¤¸®](2017), [ÀÏ·¡½ºÆ½¼­Ä¡ °í±Þ ±â´ÉÀÇ °³³ä°ú Ȱ¿ë](2017), [SMACK ½ºÅÃÀ» ÀÌ¿ëÇÑ ºü¸¥ µ¥ÀÌÅÍ Ã³¸® ½Ã½ºÅÛ](2017)À» ¹ø¿ªÇß´Ù.

ÀÌ »óǰÀÇ ½Ã¸®Áî

(ÃÑ 56±Ç / ÇöÀ籸¸Å °¡´Éµµ¼­ 54±Ç)

ÆîÃ帱â

ÄÄÇ»ÅÍ/ÀÎÅÍ³Ý ºÐ¾ß¿¡¼­ ¸¹Àº ȸ¿øÀÌ ±¸¸ÅÇÑ Ã¥

    ¸®ºä

    0.0 (ÃÑ 0°Ç)

    ±¸¸Å ÈÄ ¸®ºä ÀÛ¼º ½Ã, ºÏÇǴϾð Áö¼ö ÃÖ´ë 600Á¡

    ¸®ºä¾²±â

    ±â´ëÆò

    ÀÛ¼º½Ã À¯ÀÇ»çÇ×

    ÆòÁ¡
    0/200ÀÚ
    µî·ÏÇϱâ

    ±â´ëÆò

    0.0

    ±³È¯/ȯºÒ

    ±³È¯/ȯºÒ ¹æ¹ý

    ¡®¸¶ÀÌÆäÀÌÁö > Ãë¼Ò/¹Ýǰ/±³È¯/ȯºÒ¡¯ ¿¡¼­ ½ÅûÇÔ, 1:1 ¹®ÀÇ °Ô½ÃÆÇ ¶Ç´Â °í°´¼¾ÅÍ(1577-2555) ÀÌ¿ë °¡´É

    ±³È¯/ȯºÒ °¡´É ±â°£

    °í°´º¯½ÉÀº Ãâ°í¿Ï·á ´ÙÀ½³¯ºÎÅÍ 14ÀÏ ±îÁö¸¸ ±³È¯/ȯºÒÀÌ °¡´ÉÇÔ

    ±³È¯/ȯºÒ ºñ¿ë

    °í°´º¯½É ¶Ç´Â ±¸¸ÅÂø¿ÀÀÇ °æ¿ì¿¡¸¸ 2,500¿ø Åùèºñ¸¦ °í°´´ÔÀÌ ºÎ´ãÇÔ

    ±³È¯/ȯºÒ ºÒ°¡»çÀ¯

    ¹ÝǰÁ¢¼ö ¾øÀÌ ¹Ý¼ÛÇϰųª, ¿ìÆíÀ¸·Î º¸³¾ °æ¿ì »óǰ È®ÀÎÀÌ ¾î·Á¿ö ȯºÒÀÌ ºÒ°¡ÇÒ ¼ö ÀÖÀ½
    ¹è¼ÛµÈ »óǰÀÇ ºÐ½Ç, »óǰÆ÷ÀåÀÌ ÈÑ¼ÕµÈ °æ¿ì, ºñ´Ò·¦ÇÎµÈ »óǰÀÇ ºñ´Ò °³ºÀ½Ã ±³È¯/¹ÝǰÀÌ ºÒ°¡´ÉÇÔ

    ¼ÒºñÀÚ ÇÇÇØº¸»ó

    ¼ÒºñÀÚ ÇÇÇØº¸»óÀÇ ºÐÀïó¸® µî¿¡ °üÇÑ »çÇ×Àº ¼ÒºñÀÚºÐÀïÇØ°á±âÁØ(°øÁ¤°Å·¡À§¿øÈ¸ °í½Ã)¿¡ µû¶ó ºñÇØ º¸»ó ¹ÞÀ» ¼ö ÀÖÀ½
    ±³È¯/¹Ýǰ/º¸ÁõÁ¶°Ç ¹× ǰÁúº¸Áõ ±âÁØÀº ¼ÒºñÀڱ⺻¹ý¿¡ µû¸¥ ¼ÒºñÀÚ ºÐÀï ÇØ°á ±âÁØ¿¡ µû¶ó ÇÇÇØ¸¦ º¸»ó ¹ÞÀ» ¼ö ÀÖÀ½

    ±âŸ

    µµ¸Å»ó ¹× Á¦ÀÛ»ç »çÁ¤¿¡ µû¶ó ǰÀý/ÀýÆÇ µîÀÇ »çÀ¯·Î ÁÖ¹®ÀÌ Ãë¼ÒµÉ ¼ö ÀÖÀ½(ÀÌ °æ¿ì ÀÎÅÍÆÄÅ©µµ¼­¿¡¼­ °í°´´Ô²² º°µµ·Î ¿¬¶ôÇÏ¿© °íÁöÇÔ)

    ¹è¼Û¾È³»

    • ÀÎÅÍÆÄÅ© µµ¼­ »óǰÀº Åùè·Î ¹è¼ÛµÇ¸ç, Ãâ°í¿Ï·á 1~2Àϳ» »óǰÀ» ¹Þ¾Æ º¸½Ç ¼ö ÀÖ½À´Ï´Ù

    • Ãâ°í°¡´É ½Ã°£ÀÌ ¼­·Î ´Ù¸¥ »óǰÀ» ÇÔ²² ÁÖ¹®ÇÒ °æ¿ì Ãâ°í°¡´É ½Ã°£ÀÌ °¡Àå ±ä »óǰÀ» ±âÁØÀ¸·Î ¹è¼ÛµË´Ï´Ù.

    • ±ººÎ´ë, ±³µµ¼Ò µî ƯÁ¤±â°üÀº ¿ìü±¹ Åù踸 ¹è¼Û°¡´ÉÇÏ¿©, ÀÎÅÍÆÄÅ© ¿Ü Ÿ¾÷ü ¹è¼Û»óǰÀÎ °æ¿ì ¹ß¼ÛµÇÁö ¾ÊÀ» ¼ö ÀÖ½À´Ï´Ù.

    • ¹è¼Ûºñ

    µµ¼­(Áß°íµµ¼­ Æ÷ÇÔ) ±¸¸Å

    2,000¿ø (1¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û)

    À½¹Ý/DVD/ÀâÁö/¸¸È­ ±¸¸Å

    2,000¿ø (2¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û)

    µµ¼­¿Í À½¹Ý/DVD/ÀâÁö/¸¸È­/
    Áß°íÁ÷¹è¼Û»óǰÀ» ÇÔ²² ±¸¸Å

    2,000¿ø (1¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û)

    ¾÷üÁ÷Á¢¹è¼Û»óǰ ±¸¸Å

    ¾÷üº° »óÀÌÇÑ ¹è¼Ûºñ Àû¿ë